ByteDance Seedance 1.0 Pro: в 3 раза быстрее, на 60% дешевле — доступно на fal

Executive Summary

ByteDance просто вернул скорость и бюджет на стол. Seedance 1.0 Pro Fast разворачивается на fal, Replicate, Runware и Freepik с в 3 раза быстрее рендерами примерно на 60% дешевле Pro. Replicate публикует конкретные задержки: 5s 480p кадр возвращается в ~15s сквозной и 720p в ~30s, в то время как Freepik фиксирует сокращение на 3s примерно за 7s. Если вы идете по раскадровкам, битам действий или социальным роликам, это разница между «попробовать снова» и «перейти дальше».

Критически важный момент: быстрый режим сохраняет студийного уровня контроль за движением, который действительно используют: контроль первой рамки, последовательные персонажи, много-аспектные выходы и более плавное движение. Он подрывает не только Pro, но даже Seedance Lite по цене, так что вы можете позволить себе больше дублей без потери качества. fal запустил на день-0 текст-в-видео и изображение-в-видео конечные точки для быстрых A/B на идентичных подсказках; Runware добавил слот, готовый к API; Freepik встроил это прямо в их набор инструментов создателя. Ранние тестировщики называют это редким золотым сечением точности, задержки и цены, которое делает правку в середине цикла безболезненной.

После прошлой недели продвижения многошотовой последовательности Pro Fast выглядит как «модуль по умолчанию» для рабочих групп, которые ценят пропускную способность не меньше, чем внешний вид — и он уже повсюду там, где вы работать.

Feature Spotlight

Seedance 1 Pro Fast: преимущество по скорости и цене для видео

Seedance 1.0 Pro Fast появляется в день старта по всем крупным хабам с в три раза быстрее инференсом и примерно на 60% ниже стоимостью по сравнению с Pro, предлагая клипы длительностью 2–12 с (3 с за ~7 с), T2V/I2V, управление по первому кадру и поддержку нескольких соотношений сторон — идеальны для быстрого цикла итераций.

Кросс‑платформенное развёртывание уже в ленте сегодня: Seedance 1.0 Pro Fast от ByteDance выходит на fal, Replicate, Runware и Freepik с значительным повышением скорости и снижением затрат. Это главная история о практической пользе для кинематографистов и монтажёров.

Jump to Seedance 1 Pro Fast: преимущество по скорости и цене для видео topics

📑 Table of Contents

⚡ Seedance 1 Pro Fast: преимущество по скорости и цене для видео

Кросс‑платформенное развёртывание уже в ленте сегодня: Seedance 1.0 Pro Fast от ByteDance выходит на fal, Replicate, Runware и Freepik с значительным повышением скорости и снижением затрат. Это главная история о практической пользе для кинематографистов и монтажёров.

Seedance 1.0 Pro Fast: в 3 раза быстрее и примерно на 60% дешевле выходит на основных платформах

ByteDance’s Seedance 1.0 Pro Fast выходит с рендерами в 3× быстрее и примерно на 60% дешевле Pro, теперь доступен на ModelArk, Replicate, Runware, Freepik и fal BytePlus release. Продолжая тему многошотовой последовательности), это обновление нацелено на скорость производства и бюджет, сохраняя управление движением уровня студии BytePlus release.)

Fal day‑0 banner

Доступность подтверждена публикациями и страницами платформ — конечные точки fal day‑0 Fal announcement,) на странице модели Replicate Replicate model page,), на витрине моделей Runware Runware models,) и в обзоре функций Freepik Freepik details.); креативы получают оптимизированный вывод, более плавное движение и последовательное повествование за долю прежних затрат BytePlus release.)

Freepik добавляет Pro Fast с рендерами примерно за 3 с ≈ 7 с и контролем первого кадра

Freepik интегрировал Seedance 1.0 Pro Fast с быстрыми генерациями за 2–12 секунд; клип длительностью 3 секунды рендерится примерно за 7 секунд, с Text‑to‑Video, Image‑to‑Video, управлением первым кадром и несколькими соотношениями сторон детали функции. Команда называет его самым быстрым и гибким AI‑видео моделем в их наборе обзор скорости.

рекламное искусство Freepik

Сообщественные партнеры уже продвигают испытания и примеры, сигнализируя о движении создателей вокруг нового режима пример партнеров, в то время как тизеры подтолкнут пользователей, стремящихся к скорости, протестировать его Freepik tease.

Воспроизведите конкретные задержки постов: 5 с при 480p ≈ 15 с; 720p ≈ 30 с, дешевле, чем Lite

Replicate выделяет Seedance 1.0 Pro Fast в контексте скорости и цены: видео длительностью 5 с в 480p занимает примерно 15 с от начала до конца, а в 720p — примерно 30 с, при этом цена ниже как Seedance Pro, так и Seedance Lite Latency and pricing. Hands‑on доступен немедленно через размещённый раннер Replicate model.

fal поставляет day‑0 Text‑to‑Video и Image‑to‑Video концевые точки для Pro Fast

fal запустил Seedance 1.0 Pro Fast на day‑0 с двумя точками входа Text‑to‑Video и Image‑to‑Video, что обеспечивает мгновенные пробы из браузера Доступность Day‑0. Прямые ссылки на запуск доступны для создателей, желающих сравнить качество, скорость и управление движением по идентичным запросам Text to video, и Image to video, с последующим призывом «попробуйте сегодня» Try it today.

Изображение продукта Fal

Runware добавляет Pro Fast на нулевой день, заявляет о более плавном движении и более стабильной работе.

Runware интегрировала Seedance 1.0 Pro Fast на первый день внедрения, акцентируя внимание на более быстрой генерации по более низкой цене, при этом улучшая плавность движений и согласованность для производственных рабочих процессов Runware запуск. Модель доступна в их каталоге с готовым API для быстрого тестирования и развёртывания Runware модели, с прямой ссылкой на запуск, доступной для немедленного использования Ссылка на запуск.

Ранние тестировщики называют Pro Fast редкой золотой серединой между качеством, скоростью и стоимостью.

Создатели, тестирующие Seedance 1.0 Pro Fast, сообщают о сильном балансе между точностью, скоростью рендера и ценой — тройку факторов, которая имеет значение в итеративном сторибординге и быстрых монтажах Creator verdict. Сигнал усиливается за счёт продвижения на платформе, подталкивая больше практических испытаний в сообществе Replicate boost.


🌀 Hailuo 2.3 в раннем доступе продолжает впечатлять

Больше тестировщиков публикуют клипы версии 2.3 и отмечают ощущение движения и согласованность; Хайлоу дразнит ограниченное окно ‘API FREE’. Исключает покрытие Seedance (см. характеристику).

Hailuo 2.3 намекает на ограниченный во времени бесплатный доступ к API

Hailuo намекнул(а): «Скоро будет доступно и API БЕСПЛАТНО (ограниченное время)», намекая на окно запуска, в котором креативщики смогут попробовать возможности преобразования текста и изображений в видео 2.3 без затрат API teaser. Для режиссеров и дизайнеров, колебающихся, это снижает порог входа для оценки качества движения, согласованности персонажей и пропускной способности в реальных рабочих процессах.

Быстрые движения камеры по-прежнему сохраняют блокировки персонажей и объектов в версии 2.3.

Свежий стресс-тест показывает, что Hailuo 2.3 сохраняет каждого персонажа и реквизит последовательными даже при быстром движении камеры, продолжая тему group consistency по толпе, Fast camera test. Эта стабильность на скорости имеет значение для whip‑pans, chase beats и сложного охвата кадров без монтажных вставок.

Арабские тестировщики хвалят FPV-погружение и ощущение движения в Hailuo 2.3.

Арабская ветка раннего доступа отмечает, насколько убедительны полёт от первого лица и ощущение энергии, удерживаемой в руках, в версии 2.3, что часто является болезненной точкой для предыдущих моделей FPV praise. For action‑heavy shorts and music videos, that sense of embodied motion is a clear creative unlock.

Аэропанорама над мечетью Аль‑Азхара демонстрирует кинематографическое управление движением Hailuo 2.3.

Новый демонстрационный ранний доступ пролетает над мечетью Аль‑Азхар в Каире с устойчивым параллаксом и атмосферной детализацией, демонстрируя способность версии 2.3 поддерживать длинные, плавные движения камеры без искажений Aerial demo. Такой контролируемый дрейф и изменение масштаба — именно то, что режиссеры, ориентированные на сюжет, ищут для заставок и показа локаций.

Клипы раннего доступа указывают на кинематографическое ощущение и стабильность преобразования текста в видео.

Больше тестов от создателей подчеркивают настроение, движение и согласованность 2.3, при этом потоки I2V и T2V дают чистое покрытие.

  • Friday‑night rain vignette cut on 2.3 Early Access shows tone and camera rhythm holding up end‑to‑end Early access clip.)
  • Text‑to‑video results get positive marks for cohesion and look, suggesting fewer retries to get a usable take Text-to-video praise.)

Монтаж I2V: битва (самурай против меха) подчёркивает согласованность действий в разделе 2.3.

Изображение‑в‑видео подсказка «создать монтажную битву между самураями и мехом» сгенерировала чёткое построение кадров и читаемые боевые удары в Hailuo vid2.3 I2V battle. для стилизованных трейлеров и кинематографических монтажей; временная связность модели помогает последовательностям проигрываться без дрейфа или искажений геометрии.

Живой креативный джем соединяет Хайлуо с Хиггсфилд Попкорн на GMC

На сцене на Конференции по генеративным медиа команды продемонстрировали конвейер Hailuo × Higgsfield Popcorn — потоки от раскадки до кадра, созданные вживую для переполненного зала Stage photos. Для продюсеров, это сигнал практического пересечения между жестко контролируемыми раскадками и движком 2.3 в рамках одной сессии.

Слайд сцены


🎞️ Стиль‑циферблат LTX‑2: фильм, UGC и путешествия во времени

Сегодняшние тематики LTXStudio сосредоточены на разнообразии стилей — от высококлассного кино и стилизованной анимации до прямых трансляций, документации и образов в духе разных эпох — плюс промо‑акция «попробуй сейчас». Исключает Seedance (функция).

LTX‑2 настраивается под высококлассный кинематографический язык с чистым освещением, мягкими линзами и динамичными движениями камеры

LTXStudio демонстрирует, как LTX‑2 может воспроизводить тон и текстуру премиального кино — совпадать освещение, ощущение объектива и грамматику движения для последовательностей, которые читаются как настоящие кинодневники Примеры фильмов премиум‑класса. Это имеет значение для режиссеров, стремящихся к кинематографической связности из текста или ссылок без ущерба для согласованности между кадрами.

Путешествие во времени выглядит заманчиво: скидка 50% на поколения в LTX Studio

LTXStudio выделяет временную шкалу — от фильма 1940-х до видеокамеры 2000-х — которая восстанавливает текстуру видео той эпохи и грамматику вещания, и отмечает, что все поколения LTX‑2 сейчас доступны со скидкой 50% Предложение «Попробуйте сейчас», following up on первоначальный запуск. Создатели могут сразу приступить через страницу студии страница LTX Studio.

Стилизованный набор анимационных стилей: аниме, пластилиновая анимация, кукольная драматургия и ручная рисовка — сохранена идентичность персонажа

LTX‑2 адаптируется к кадровым стилям — аниме, покадровой анимации, глиняной анимации, кукольной анимации и рисованной от руки — сохраняя характер персонажа, окружения и консистентность камеры на разных ракурсах Animation examples. Для анимационных команд это означает, что единый лукбук может обеспечивать создание множества кадров, сохраняя единый визуальный стиль.

UGC и социальные образы: LTX‑2 соответствует сырой, ориентированной на мобильные устройства реалистичности для контента в стиле инфлюенсеров

Поток LTXStudio подчёркивает способность LTX‑2 генерировать убедительный UGC, от кадра, снятого рукой, до форматирования и сжатия, родственных платформе, что позволяет создавать аутентичные социальные правки, пародии на инфлюенсеров и вставки, изменяющие восприятие реальности, которые выглядят как снятые на телефон UGC examples. Создатели могут использовать это для работы с брендами и вирусных коротких видео без повторных съёмок.

Воспроизведение прямого эфира: эстетика ток-шоу, интервью и имитированных новостей по команде

Режим живой продукции демонстрирует студийное освещение, расстановку столов, размещение ведущих и четкие паттерны охвата, читающиеся как ток-шоу и форматы новостей Broadcast look. Это обеспечивает быстрое создание вступлений к шоу, панельных сегментов или сатирических новостных вставок без построения сцены.

Природный и документальный режим: терпеливый язык камеры с текстурированными, реалистичными деталями

LTX‑2 воспроизводит темп документального повествования — медленные панорамы, затянутые эпизоды с дикой природой и наблюдательные последовательности — при сохранении текстуры, которая держится кадр за кадром Nature doc look. Это полезно для вводных кадров, вставок сюжета и историй в документальном стиле с брендингом.


🕸️ Runway Workflows распространяются на все планы

Runway сообщает, что узловые рабочие процессы теперь разворачиваются во всех планах, и появился новый эпизод Runway Academy, чтобы начать. Исключено Seedance (функция).

Runway Workflows развертываются во всех планах с новым гидом по Академии

Runway говорит, что Workflows теперь разворачиваются на всех уровнях подписки, в сочетании с эпизодом Runway Academy, чтобы помочь создателям начать «строить инструменты, которые работают для вас» rollout note. Для режиссеров, дизайнеров и монтажеров это позволяет связывать генеративные шаги и правки внутри Runway, чтобы ускорить пайплайны от кадра к кадру без перехода между приложениями.

Еженедельный обзор Runway освещает рабочие процессы, дообучение моделей и Ads Apps.

Сводка Runway «This Week» выделяет развертывание Workflows наряду с тонкой настройкой моделей и новым набором Apps for Advertising итоговый поток, продолжение к Запуску приложений для рекламы. Обновление задаёт сквозной стек для креативов — строите автоматизации в Workflows, улучшайте модели, затем перепрофилируйте ресурсы для кампаний — смотрите стартовый курс Академии по Workflows, чтобы приступить к Эпизоду Академии.


🎵 AI-музыкальные видеоклипы: OpenArt OMVA + SFX-инструменты

Пошаговый процесс OpenArt и инструменты для музыкального клипа с заголовком к конкурсу OMVA с призовым фондом $50k; Mirelo v1.5 добавляет синхронизированные SFX к немым клипам; создатели делятся реальным ростом канала. Исключает Seedance (функция).

OpenArt Music Video Awards: призы на 50 тысяч долларов и размещение на Таймс-сквер, прием заявок открыт.

OpenArt’s OMVA запущен и предлагает более $50,000 призов, а победившие видео могут появиться на Таймс-сквер в Нью-Йоркe; прием заявок с 15 октября по 16 ноября. Детали подачи и правила размещены на официальной странице Contest announcement,) с разделом программы здесь Contest page.). Поддержка сообщества включает новую акцию «Stellar’s Choice Awards» — spotlight для амбассадоров, призванную способствовать смелым анимационным работам Ambassador call,) и приглашение для создателей, которое резюмирует, как подать заявку и что допускается Creator invite thread.).

Рабочий процесс AI‑музыкального видео от OpenArt: четыре режима, затем одноклик «Создать полное видео»

Руководство для создателя подробно описывает полный цикл OpenArt — от идеи до готового музыкального клипа, превращающего любую песню. Зарегистрируйтесь, выберите режим (Singing, Narrative, Visualizer, or Lyrics), загрузите свой трек и лицо артиста, задайте соотношение сторон/модели/разрешение, затем нажмите “Create Full Video.” How-to thread, and OpenArt home показывают точку входа, с примерами режимов для Singing Singing example, , Visualizer Visualizer example, и Lyrics Lyrics video example. . Последующая ветка собирает все шаги и результаты в одном месте для легкой репликации Contest CTA recap.).

Mirelo v1.5 добавляет синхронизированные звуковые эффекты к беззвучным клипам на Replicate примерно за $0.01 за секунду/образец

Mirelo SFX v1.5 генерирует синхронизированные звуковые эффекты для молчаливых видео (до ~10 с), с улучшенным качеством аудио и временем звучания, несколькими образцами за запуск и простым руководством по подсказкам — цена примерно $0.01 за секунду на образец. Попробуйте на Replicate через страницу модели, опубликованную в сегодняшних постах Model page, с прямым доступом здесь Replicate model.

Кейс-исследование: канал, делающий каверы с помощью ИИ, набрал 500 тыс. просмотров и 8 тыс. подписчиков за 10 дней, монетизирован

Создатель сообщает, что испанский канал каверов с использованием ИИ взлетел с 0 до 8 000 подписчиков за 10 дней, достиг 500 000 просмотров и 14 000 часов просмотра — теперь полностью монетизирован, при этом весь контент создан с помощью инструментов ИИ. Фламенко-кавер песни Linkin Park «In the End» представлен как часть результатов Channel growth post,) с видеороликом, иллюстрирующим формат и эстетику YouTube video.


🌌 Grok Imagine: настроения аниме и тесты диалогов

Создатели подчеркивают кинематографическое настроение Grok и стили аниме; первые тесты Grok Video с диалогом показывают убедительную синхронизацию лица и плавность камеры. Исключает Seedance (функция).

Раннее тестирование диалога в Grok Video демонстрирует естественную синхронизацию губ и плавное движение камеры

Первый практический обзор показывает, как Grok Video обрабатывает разговорную речь с убедительной синхронизацией лица, выражениями и плавным движением камеры Grok video test, продолжая работу над in‑app upscale для Grok Imagine накануне дня. Для создателей это намекает на жизнеспособные сцены с говорящей головой, озвученные короткометражки и аватар‑хосты без ручной подгонки ключевых кадров.

Создатели обращаются к Grok за мрачной атмосферой хоррор‑аниме.

Несколько тестов подчеркивают тревожную сторону Грока, с независящими от сюжета композициями и анимацией, ориентированной на настроение, которые читаются как современное хоррор‑аниме Eerie scene prompt и более широкую серию техник по поддержанию ужаса и напряжения Horror anime thread. Для рассказчиков освещение и темп Грока позволяют быстро придумывать пугающие моменты на практике.

Grok передаёт атмосферу романтики 90‑х годов в OVA на поезде.

Виньетка в стиле OVA 90‑х годов — двое незнакомцев, разделяющие мимолётный момент в поезде — демонстрирует аниме‑эстетику Grok, достигая мягких палитр, кинематографического зерна и языка кадрирования, которые определяют ту эпоху Тест романтики в аниме. Это сильный пример стиля для нарративных шортов и видеоклипов.

Тест героини темного фэнтези: персонаж, освещённый контровым светом, владеющий копьём, сохраняет стиль

Вращающаяся, подсвеченная сзади героиня аниме с изысканным копьем демонстрирует последовательность Grok в освещении волос, деталях костюма и свете без размазывания Dark fantasy character,), поддерживая более широкие утверждения о том, что этот образ в стиле аниме «просто работает» в модели Anime style result.) Отлично подходит для раскрытия персонажей и проходов ключевого арт-движения.

Изображение в анимацию: мрачные последовательности огней города из статичных кадров в Grok

Анимация любимого кадра в неоновую, промокшую дождём городскую виньету демонстрирует силу Grok в сохранении композиции и цвета, добавляя движение клип городских огней. Это лёгкий путь для Reels, lyric-видео и амбиент-петлей, где важна непрерывность вайба.

Простой запрос для созерцания звёзд даёт волшебное кадрирование сверху в Grok

Минимальный промпт — “top down shot of the girl pointing at the stars” — создаёт лирическое, сказочное настроение с ярким направленным светом и негативным пространством Star prompt result. Такой тип экономии промптов полезен для досок, переходов и титров.


🧩 ComfyUI: реактивное видео, последовательность, найм

ComfyUI демонстрирует аудио‑реактивное видео и рабочие процессы по обеспечению согласованности персонажей, отмечает достижение в топ‑100 на GitHub и открывает вакансию на должность старшего дизайнера. Исключает Seedance (фича).

Видео с аудио‑реактивной реакцией, созданное в ComfyUI, намекает на живые визуальные эффекты, синхронизированные с музыкой

Новая аудио‑реактивная рабочая схема демонстрирует, как ComfyUI управляет визуализацией, которая пульсирует и морфирует в такт звуку, подчёркiвая, насколько странными и выразительными могут стать ген‑медиа для концертов, VJ‑сетів и музыкальных видео Аудио‑реактивная демонстрация.

Согласованность персонажей в ComfyUI: практический рабочий процесс для историй с несколькими кадрами

Короткое руководство демонстрирует, как сохранять идентичность персонажа на разных кадрах в ComfyUI — стабилизируя лица, наряды и углы — чтобы режиссеры и аниматоры могли сохранять непрерывность через монтаж и изменение камеры Процесс согласованности.

ComfyUI ищет старшего дизайнера продукта, чтобы формировать творческие инструменты.

ComfyUI открыла вакансию старшего продуктового дизайнера, сосредоточенную на сквозном UX для художник-центрированных, основанных на узлах рабочих процессов — возможность повлиять на следующее поколение инструментов AI для креатива, используемых кинематографистами и дизайнерами Hiring post, и подробности роли перечислены в описании вакансии job description.

Движение сообщества: «Эта команда — CRACKED», по мере того как ComfyUI намекает на более глубокий контроль

Создатели восхваляют скорость ComfyUI, в то время как команда намекает на «ультимальную управляемость», сигнализируя о более быстрой итерации и более точных инструментах направления для стилистов и режиссеров, создающих сложные пайплайны Community praise, и тизер указывает на грядущие закулисные откровения Control teaser.


📽️ Previs: сториборды Popcorn + контроль HDR

Приём Higgsfield Popcorn продолжается для плат на 8 кадров с высокой согласованностью; рабочий поток демонстрирует извлечение подсказок и пакетную обработку нескольких моделей. Luma Ray3 HDR добавляет тонкий контроль цвета и деталей. Seedance исключена (функция).

Higgsfield Popcorn продвигает 8‑кадровые «профессиональные» раскадровки, добавляет промо на 225 кредитов

Хиггсфилд продвигает Popcorn как профессиональный инструмент AI для раскадровки — 8 кинематографических кадров с зафиксированной согласованностью и режиссерским контролем — при этом предлагая 225 кредитов за RT + ответ для запуска испытаний Storyboard promo. Создатели называют это новым стандартом и описывают практичные потоки редактирования (lock subject vs lock world), с реальным использованием для идеи истории по одному изображению и завершения в Kling + Suno + CapCut Creator pitch, Creator claim, Creator case study.

Higgsfield jam slide

Демонстрации на сцене на Generative Media Conference подчеркивают импульс и интерес со стороны создателей по мере того, как Popcorn работает в паре с последующими видеомоделями в живых рабочих процессах Conference demo.)

Popcorn → Weavy конвейер распространяет запросы по мультимодельным пачкам сторибордов

Новый поток автоматизации показывает, как превратить выходные данные Popcorn в доски «один клик» рядом для нескольких моделей изображений, продолжая работу над Creator guide, который охватывал практическую последовательность Popcorn. Он соединяет расширение Popcorn для Chrome и Higgsfield Soul для извлечения подсказок, формирует повторно используемую формулу подсказок в GPT, а затем инициирует рабочий процесс Weavy для пакетной генерации сопоставимых кадров параллельно Workflow steps.

Multi‑model board

• В результате получается сетка сравнения из 8 моделей для быстрого look‑dev и проверки на согласованность перед принятием решения о видеопрохождении Results board.)

Luma Ray3 HDR предоставляет тонкую настройку ярких участков и теней для Dream Machine

Режим HDR Ray3 от Luma обещает динамическое управление цветом с сохранением микро‑детали, поддерживая нюансы в светах и тенях — полезен для направления цветокоррекции на этапе previs перед финальной градацией HDR announcement.)


🗣️ Аватары и графика движения: синхронизация губ до 25 секунд

Тренды в инструментах для аватаров/производительности: OmniHuman 1.5 для выразительной синхронизации губ по статичным кадрам, HeyGen — анимационная графика из текста, и посты об использовании Sora 2. Исключает Seedance (функция).

ElevenLabs + Decart анимируют говорящих аватаров в реальном времени для голосовых агентов.

Пайплайн, объединяющий речевой поток ElevenLabs с живой лицевой анимацией Decart, даёт видео‑аватаров в реальном времени — полезно для агентов поддержки, презентаторов и интерактивной вывески Integration note. Живой сценический демонстрирующий быструю смену стилей и мгновенную визуальную реакцию на подсказки, подчеркивая готовую к продакшну задержку Stage demo.)

Live demo screen

Для создателей это позволяет интерактивных ведущих и живые выступления без предрендеренных проходов синхронизации губ.

OmniHuman 1.5 превращает одно изображение в выразительный видеаватар с синхронизацией губ.

BytePlus говорит, что OmniHuman 1.5 может воссоздать любую статичную изображение с точной синхронизацией губ, эмоциями и жестами, напрямую управляемыми аудио, охватывая случаи использования от персонажей аниме до образов домашних животных и креативных влогов Feature brief. Продолжая работу над управление текстом, которое освещало направление сцены и камеры, данное обновление подчеркивает реализм производительности от одного неподвижного кадра — полезно для персонажных виньеток, объясняющих озвучивание и социальных промо без съемки.

Sora 2 достигает 25‑секундных генераций на Vadoo AI, открывая пространство для более насыщенных битов

Vadoo AI теперь запускает Sora 2 до 25 секунд на клип, давая редакторам достаточно запаса для полных реплик диалога, музыкальных хуков или микро‑сцен перед склейкой Platform update. For storytellers, эта дополнительная продолжительность помогает с темпом и эмоциональной подачей без чрезмерного масштабирования или повторной синхронизации.

HeyGen намекает на создание настраиваемой графики движения из простого текста — «explain it, animate it»

Последняя функция HeyGen обещает создание движущейся графики на основе описаний естественным языком за считанные минуты, снижая порог входа для титульных карточек, кинетического текста и анимированных объяснений без After Effects Feature teaser. Для создателей это означает более быструю итерацию по графическим наборам и обрезкам для соцсетей с согласованным брендом.

Демонстрация диалога Grok Video вызывает похвалу за синхронность губ, мимику и плавность движения камеры.

Демо диалога. Хотя это еще не финальная версия для продакшена, ощущение живой подачі сокращает разрыв между сценарием и черновыми чтениями на камеру для итеративной работы над сюжетом.

Создатели отмечают высокий уровень согласованности образа персонажа Соры 2 во всех ракурсах и при различном освещении.

Леонардо демонстрирует последовательности Sora 2, сохраняющие идентичность лица, освещение и мелкие детали на разных углах, что является ключевым требованием для непрерывности аватара и брендированных говорящих персонажей Пример использования, с информацией о его платформе на сайт Leonardo AI. Такой характер точности между кадрами снижает необходимость в очистке и подборе кадров на постпродакшн.


🏟️ Onstage: Генеративная медиа-конференция (GMC)

Прямой эфир охватывает демонстрации генерации видео в реальном времени, креативные беседы по электронной коммерции, панели по студиям/инвестициям и камео Джеффри Катценберга. Исключаются детали запуска Seedance (раскрыто как фича).

Живой креативный джем: Higgsfield × Hailuo выводят раскадровки на экран в GMC

Продвигаясь после event kickoff обещавшего живой джем, Higgsfield и Hailuo провели на сцене творческую сессию, демонстрируя поток от раскадровки до видео; сопутствующий слайд MiniMax цитирует 4.5bn+ дневных текстовых токенов, 1.6mn+ дневных видео и 370k+ дневных часов аудио в качестве контекста масштаба Creative jam.

Слайд Higgsfield джема

Этот демонстрационный рабочий процесс подчеркивает, как зафиксированные доски могут напрямую питать последовательное, ориентированное на камеру движение для рекламы и короткометражек.

BytePlus демонстрирует Seedream 4.0, OmniHuman 1.5 и Seedance Pro на сцене.

ГМ BytePlus представил новые возможности моделей в области мирового конструирования (Seedream 4.0), аудиоуправляемого актёрства аватаров (OmniHuman 1.5) и кинематографического видео (Seedance Pro) BytePlus demos.

BytePlus stage talk

Для создателей набор предлагает сквозные конвейеры: концептинг, исполнение и готовые к монтажу анимации из единого стека поставщиков.

GMC открывается для переполненного зала с слайдом «год в обзоре» на 200+, 14 моделей, 2 млн+

Генеративная медиа-конференция открылась полным залом и слайдом «Этот год в обзоре…», на котором выделены 200+, 14 моделей и 2M+ в качестве ключевых метрик — сигнализируя о быстром росте экосистемы инструментов для творчества Kickoff room shot.

Слайд «Год в обзоре»

Для творцов с искусственным интеллектом масштаб намекает на больший выбор моделей и более быструю итерацию в производственных рабочих процессах.

Shopify даёт обзор генерируемых медиа для креативов в электронной торговле

Руководитель по продукту Shopify подробно рассмотрел генеративные медиа для коммерции, охватив творческие ограничения, визуализацию продукта и конвейеры материалов кампаний, адаптированные под потребности розничной торговли Shopify session.

Shopify talk slide

Бренд‑кинематографисты и дизайнеры получают более ясное представление о том, как сочетать ИИ‑видео, изображения и тексты в конверсионно‑нацеленных интернет‑магазинах.

Панель: Восхождение AI‑нативных студий исследует новые производственные методики

Панель, состоящая из нескольких создателей, углубилась в то, как AI‑нативные студии организуют команды, поддерживают визуальную идентичность и выпускают многосценарные истории без обычных накладных расходов Studios panel.)

Панель студий на базе ИИ

Вывод для рассказчиков: последовательный кастинг, фиксация стиля и повторное использование ассетов становятся основой для производства небольшими командами с широкими задачами.

Джеффри Катценберг присоединяется к GMC, чтобы привнести взгляд крупной студии на генеративные медиа.

Джеффри Катценберг вышел на сцену, подчеркнув, что мейнстрим-развлечения вовлекаются в генеративные рабочие процессы и инструменты творцов Katzenberg on stage.)

Katzenberg fireside

Его присутствие сигнализирует об ускоряющемся взаимопроникновении между циклами разработки в Голливуде и производством, ориентированным на ИИ.

Панель: ведущие инвесторы Сан-Франциско обсуждают, куда течёт капитал в генеративных медиа.

Инвесторы из a16z, Kindred Ventures, Bessemer и Meritech поделились тем, как они оценивают стартапы в области креативных инструментов и сигналы роста, которые имеют значение для приложений на базе моделей Investing panel.

Investing panel lineup

Сигнал для основателей: реальное использование (а не просто новизна модели) и защищаемые рабочие процессы формируют условия финансирования.

Панель: Следующая граница моделей освещает возможности, ориентированные на создателей.

Исследователи и разработчики разобрали направления моделей, наиболее важных для творческих людей — точность стиля, управление камерой, длинная связность и задержка в реальном времени Models panel.

Models panel screen

Ожидаются краткосрочные преимущества в многошотовой согласованности и настройке в духе режиссёра, которые преобразят раскадровку и монтаж.

Рабочий процесс на сцене: Nano Banana, Veo 3.1 и Genie 3 для быстрого прототипирования

Живой доклад подчеркнул связь между Nano Banana от Google, Veo 3.1 и Genie 3, чтобы перейти от статичных кадров настроения к движущимся последовательностям и интерактивным мировам за считанные минуты Paige stage talk.

Volcano scene slide

Для соло‑креаторов рецепт показывает, как запустить пилот: установить стиль в статичных кадрах, затем расширить движение и интерактивность, не покидая цепочку инструментов.

Foster + Partners рассказывает, как генеративные медиа меняют визуализации в архитектуре.

Партнер-ассоциат Шериф Тарабиши обсудил применение генеративных медиа к архитектурному повествованию — от предварительных демонстраций замысла дизайна до готовых к маркетингу анимаций Architecture talk.)

Выступление на архитектурной сцене

Студии дизайна могут рассчитывать на более быструю итерацию с клиентами и более ясные повествования о форме, свете и материальности.


🎨 Все ещё выглядит: srefs, MJ v7, минимальные линии

Богатая смесь статичных рецептов изображений: наборы промптов в минималистичном линейном искусстве, наборы параметров MJ v7, нео‑арт‑деко стиль фэшн‑нуар srefs, refs в стиле аниме и мрачные неоновые мудборды. Исключает Seedance (feature).

Новый рецепт MJ v7 sref 7380578 даёт связный коллаж 3:4

Свежий набор параметров Midjourney v7 — --chaos 10 --ar 3:4 --sref 7380578 --sw 500 --stylize 500 — обеспечивает единый графический коллаж из нескольких панелей MJ v7 collage,), продолжая тему MJ v7 recipe, где другой sref порождает столь же объединённые наборы 3:4.

MJ v7 collage

Комбинация балансирует фиксацию стиля (sref, sw) с вариацией (chaos), полезна для визуальных систем, готовых к презентациям.

Минималистичное линейное искусство: плоские 2D контуры, без теней

Краткая формула подсказки для минималистичного линейного искусства достигает современного абстрактного образа: 2D-плоский вектор, только контур, без теней, упрощенные формы и чистые линии, с указанием цвета и фона для каждого объекта Line art prompt.)

Примеры линейного искусства

Это готовый шаблон «подключай и используй» для брендовых иконок, постеров или мерча, где важен единый стиль контура.

Нео-ар-деко стиль ref —sref 2122433650 ногти образ в стиле fashion-noir

Ссылка на стиль, зафиксированная через --sref 2122433650, вызывает редакторский минимализм Нагель/Гроу: удлинённые фигуры, резкие взгляды, плоские чернила и сдержанная палитра — идеально подходит для модного нуара и плакатной графики Style ref thread.)

Art deco style set

Авторы отмечают, что он блистает в кадрах, ориентированных на персонажей (например, Vampirella), где поза и силуэт несут сцену.

Редакционный промпт для сетки из 4 панелей с целью единообразной модели, наряда и освещения

Подробный промпт Nano Banana проектирует 2×2 редакционный лист с одной моделью, фиксированным нарядом, освещением и настроением, при этом варьируя позу и кадрирование — идеально для модных досок и лукбуков Editorial grid prompt.

Образец редакционной сетки )

Структура по панелям поз (TL/TR/BL/BR) помогает поддерживать непрерывность выражений и языка тела.

Грубый, приглушённо‑неоновый мудборд с кодом промпта

Готовый эстетический шаблон — “--p hzqhpt4” — создаёт расплывчатую, зернистую, бирюзово-красную неоновую атмосферу на кадрах (уличные вывески, фары, портреты), которая читается как ночные кадры 35-мм Moodboard thread.

Muted neon scenes

Используйте его в качестве базового «look LUT» для единства серии; поверх добавляйте промпты к субъектам, чтобы оставаться в рамках мира.

Референс в стиле аниме —sref 2671898589 с мрачными кинематографическими кадрами

Из личного архива, --sref 2671898589 дает атмосферные образы в стиле аниме: лунные гавани, дымные репетиционные залы и драматичные кадры персонажей с низким углом съемки, все с последовательной линейной прорисовкой и цветовым настроением Anime sref samples.

Anime sref frames

Полезно для поддержания единого стиля серии в статичных изображениях, обложках и ключевых артах без повторной настройки подсказок.

Идея концептуального промпта: эргономичные клавиатуры с коленным упором, вид от первого лица

Игривое концептуальное статичное изображение — вид от первого лица на эргономичные клавиатуры, встроенные в наколенники, — показывает, как одна необычная подсказка может породить вариации индустриального дизайна и мемообразные визуалы Kneepads prompt.

Kneepad keyboards

Полезно как разминка для творчества или как спекулятивный лист продукта, чтобы проверить композицию и освещение на носимой технике.


📑 Статьи: ультра‑высокое разрешение диффузии и обучение с подкреплением по значениям

Сегодняшние исследовательские ссылки включают ультра‑высокое разрешение диффузии через DyPE, обучение с подкреплением с явными человеческими ценностями (RLEV) и примеры сообщества в Gaussian splatting. Исключает Seedance (функция).

DyPE обеспечивает диффузию с ультра‑высоким разрешением 16 МП без повторной тренировки.

Dynamic Position Extrapolation (DyPE) позволяет предварительно обученным диффузионным трансформерам синтезировать ультравысокое разрешение изображений — до 16 миллионов пикселей — за счёт динамической настройки позиционных кодировок во время семплинга, дополнительного обучения не требуется упоминание в статье, с подробностями о методе и результатах на странице статьи страница статьи.}

Рисунок из статьи

  • Подход сочетает раннюю низкочастотную раскладку и позднюю высокочастотную детализацию, повышая точность на больших масштабах согласно резюме авторов страница статьи.

RLEV выравнивает LLM на соответствие явным человеческим ценностям, что повышает точность, взвешенную по ценностям.

Обучение с подкреплением с явными человеческими ценностями (RLEV) оптимизирует модели для корректности с учётом ценности и учится прекращать работу, когда это нужно (остановка, чувствительная к ценности), сообщая о более высокой согласованности по важным вопросам по сравнению со стандартными RL-базами paper abstract.\n\n Paper abstract \n\n- Метод внедряет сигналы ценности по каждому вопросу, поэтому обучение приоритетирует результаты, зависящие от воздействия, что является полезной рамкой для инструментов творческой деятельности и ассистентов, критичных для безопасности paper abstract.

Демонстрации гауссовского распыления подчеркивают резкие скачки качества при захвате 3D в реальном времени.

Сообщества роликов, распространяющихся сегодня, подчеркивают, насколько быстро улучшаются качество и реалистичность гауссовского распыления, при этом создатели реагируют на все более кинематографичные, согласованные по ракурсу сцены, построенные из разрежённых захватов Примеры сообщества.


🧠 Агентные инструменты: MCP-серверы и веб-агенты

Инструменты разработки для агентно-ориентированных творцов: пользовательский сервер fal MCP, вызываемый из популярных IDE и CLI, HyperBuild для подключения агентов к живым веб-данным и вопрос по жизненному циклу токенов Agent Builder. Исключает Seedance (функция).

fal выпускает кастомный сервер MCP, доступный для вызова из Cursor, Gemini CLI, Claude Code и других

fal теперь предоставляет собственный сервер Model Context Protocol (MCP), который можно вызывать из популярных поверхностей разработки, таких как Cursor, Gemini CLI, Claude Code, roocode и cline — что значительно упрощает для креаторов организацию рабочих процессов агентов в знакомые IDE без дополнительного «клеевого» кода MCP server note. Командам, прототипирующим агентские медиаинструменты, это снижает трение интеграции между редакторами и терминалами, на которых они уже работают.

HyperBuild публикует исходники визуального конструктора веб-агентов под открытым исходным кодом.

HyperBuild дебютирует как открытый исходный код, визуальный способ проектирования агентов, которые используют данные в реальном времени из веба — опишите поведение на естественном языке, прикрепляйте действия, подключайте источники данных и координируйте всё в интерфейсе перетаскивания, поддерживаемом Hyperbrowser Tool thread. • Полезно для творческих операций, таких как исследования, сбор контента и автоматизация кампаний, где агентам необходимо извлекать, действовать и суммировать на живых страницах.

Пользователи Agent Builder отмечают подводные камни обновления OAuth-токена для инструментов MCP

Практикующие тестируют OpenAI’s Agent Builder выявили общую проблему: короткоживущие OAuth‑токены доступа (например, Gmail, HubSpot), используемые инструментами MCP, требуют надёжного паттерна обновления/ротации между запусками, иначе агенты ломаются на середине рабочего процесса. https://x.com/ai_for_success/status/1981790018525180150). Ожидается сочетать refresh‑token и безопасное хранение с серверной синхронизацией; пока не появится руководство первого уровня, рассматривайте коннекторы как эфемерные и проектируйте систему с учётом безопасных повторных попыток.


🏛️ Обзор отрасли и политики для создателей контента

Права и сигналы платформы: UMG описывает партнерства в области ИИ и позицию по согласию артистов; публикации поднимают вопросы о рекламе на основе памяти ChatGPT и запросах на данные по искам. Исключает Seedance (функцию).

UMG рассказывает о стратегии в области искусственного интеллекта, заключает сделки по платформам и подтверждает лицензионное соглашение с согласием артистов.

Universal Music Group распространила внутренний меморандум, в котором изложено направление «ответственного ИИ», закреплённое лицензионными сделками с крупными платформами и инструментами, при этом повторяется, что лицензирование не будет осуществляться без явного согласия артистов memo summary.

memo headline

  • Партнерство выделено: YouTube, TikTok, Meta, BandLab, SoundLabs, KDDI, ProRata, KLAY, SoundPatrol (монетизированные, контролируемые экосистемы для создателей) memo summary.
  • Инновационный сигнал продукта: UMG экспериментирует с агентным ИИ для взаимодействия с фанатами и обнаружения музыки, формируя новые источники дохода и охраняя сходство артистов и права на каталог memo summary.)

YouTube вводит распознавание сходства лиц, чтобы помогать удалять контент, использующий чьё-либо изображение.

Еженедельный обзор отмечает, что YouTube запустил путь по распознаванию сходства для удалений контента, сгенерированного ИИ, это изменение политики, которое усиливает средство защиты для авторов, чьи образы используются без согласия еженедельный обзор.

  • Практическое влияние: более четкие потоки подачи отчетов могут предотвращать злоупотребления дипфейками и ускорять удаление, особенно для преподавателей перед камерой, исполнителей и брендов еженедельный обзор.

Сообщается, что Reddit подает в суд на Perplexity за использование данных для обучения, что усиливает давление в области лицензирования.

Та же сводка сигнализирует о судебном иске Reddit против Perplexity за использование данных для обучения ИИ, добавляя импульс к платному лицензированию и более строгие условия вокруг пользовательского контента для обучения моделей roundup list.

  • Для креативных команд кейс сигнализирует о растущих расходах и проверках соблюдения происхождения наборов данных, особенно для коммерческих внедрений и корпоративных клиентов roundup list.

Запрос OpenAI на раскрытие информации вызывает озабоченность по вопросам конфиденциальности в деле о суициде, связанном с ChatGPT.

Скриншот отчета сообщает, что OpenAI запросила список участников мемориала в ходе раскрытия материалов по делу, связанному с суицидом и использованием ChatGPT, что приводит к вопросам о масштабе и чувствительности запрашиваемых данных в судебном процессе, затрагивающем инструменты ИИ lawsuit report.

headline screenshot

  • Для создателей и агентств этот «переломный момент» подчеркивает, почему важно минимизировать персональные данные в подсказках, журналах и общих проектах, если споры перерастут в юридическое раскрытие lawsuit report.

Пост утверждает, что OpenAI протестирует рекламу на основе памяти в ChatGPT; создатели спорят о компромиссах в таргетинге.

Широко распространяемая публикация утверждает, что OpenAI планирует показывать объявления внутри ChatGPT, которые используют память пользователя, возможно начиная с Pulse перед более широким развёртыванием, что вызывает вопросы конфиденциальности и UX для творческих рабочих процессов ads claim.

мем про рекламу

  • Если это так, размещения, таргетируемые по памяти, могли бы повысить релевантность рекламы, но усложнить согласие и конфиденциальность клиентов для агентств и студий, использующих ChatGPT в продакшене ads claim.

On this page

Executive Summary
⚡ Seedance 1 Pro Fast: преимущество по скорости и цене для видео
Seedance 1.0 Pro Fast: в 3 раза быстрее и примерно на 60% дешевле выходит на основных платформах
Freepik добавляет Pro Fast с рендерами примерно за 3 с ≈ 7 с и контролем первого кадра
Воспроизведите конкретные задержки постов: 5 с при 480p ≈ 15 с; 720p ≈ 30 с, дешевле, чем Lite
fal поставляет day‑0 Text‑to‑Video и Image‑to‑Video концевые точки для Pro Fast
Runware добавляет Pro Fast на нулевой день, заявляет о более плавном движении и более стабильной работе.
Ранние тестировщики называют Pro Fast редкой золотой серединой между качеством, скоростью и стоимостью.
🌀 Hailuo 2.3 в раннем доступе продолжает впечатлять
Hailuo 2.3 намекает на ограниченный во времени бесплатный доступ к API
Быстрые движения камеры по-прежнему сохраняют блокировки персонажей и объектов в версии 2.3.
Арабские тестировщики хвалят FPV-погружение и ощущение движения в Hailuo 2.3.
Аэропанорама над мечетью Аль‑Азхара демонстрирует кинематографическое управление движением Hailuo 2.3.
Клипы раннего доступа указывают на кинематографическое ощущение и стабильность преобразования текста в видео.
Монтаж I2V: битва (самурай против меха) подчёркивает согласованность действий в разделе 2.3.
Живой креативный джем соединяет Хайлуо с Хиггсфилд Попкорн на GMC
🎞️ Стиль‑циферблат LTX‑2: фильм, UGC и путешествия во времени
LTX‑2 настраивается под высококлассный кинематографический язык с чистым освещением, мягкими линзами и динамичными движениями камеры
Путешествие во времени выглядит заманчиво: скидка 50% на поколения в LTX Studio
Стилизованный набор анимационных стилей: аниме, пластилиновая анимация, кукольная драматургия и ручная рисовка — сохранена идентичность персонажа
UGC и социальные образы: LTX‑2 соответствует сырой, ориентированной на мобильные устройства реалистичности для контента в стиле инфлюенсеров
Воспроизведение прямого эфира: эстетика ток-шоу, интервью и имитированных новостей по команде
Природный и документальный режим: терпеливый язык камеры с текстурированными, реалистичными деталями
🕸️ Runway Workflows распространяются на все планы
Runway Workflows развертываются во всех планах с новым гидом по Академии
Еженедельный обзор Runway освещает рабочие процессы, дообучение моделей и Ads Apps.
🎵 AI-музыкальные видеоклипы: OpenArt OMVA + SFX-инструменты
OpenArt Music Video Awards: призы на 50 тысяч долларов и размещение на Таймс-сквер, прием заявок открыт.
Рабочий процесс AI‑музыкального видео от OpenArt: четыре режима, затем одноклик «Создать полное видео»
Mirelo v1.5 добавляет синхронизированные звуковые эффекты к беззвучным клипам на Replicate примерно за $0.01 за секунду/образец
Кейс-исследование: канал, делающий каверы с помощью ИИ, набрал 500 тыс. просмотров и 8 тыс. подписчиков за 10 дней, монетизирован
🌌 Grok Imagine: настроения аниме и тесты диалогов
Раннее тестирование диалога в Grok Video демонстрирует естественную синхронизацию губ и плавное движение камеры
Создатели обращаются к Grok за мрачной атмосферой хоррор‑аниме.
Grok передаёт атмосферу романтики 90‑х годов в OVA на поезде.
Тест героини темного фэнтези: персонаж, освещённый контровым светом, владеющий копьём, сохраняет стиль
Изображение в анимацию: мрачные последовательности огней города из статичных кадров в Grok
Простой запрос для созерцания звёзд даёт волшебное кадрирование сверху в Grok
🧩 ComfyUI: реактивное видео, последовательность, найм
Видео с аудио‑реактивной реакцией, созданное в ComfyUI, намекает на живые визуальные эффекты, синхронизированные с музыкой
Согласованность персонажей в ComfyUI: практический рабочий процесс для историй с несколькими кадрами
ComfyUI ищет старшего дизайнера продукта, чтобы формировать творческие инструменты.
Движение сообщества: «Эта команда — CRACKED», по мере того как ComfyUI намекает на более глубокий контроль
📽️ Previs: сториборды Popcorn + контроль HDR
Higgsfield Popcorn продвигает 8‑кадровые «профессиональные» раскадровки, добавляет промо на 225 кредитов
Popcorn → Weavy конвейер распространяет запросы по мультимодельным пачкам сторибордов
Luma Ray3 HDR предоставляет тонкую настройку ярких участков и теней для Dream Machine
🗣️ Аватары и графика движения: синхронизация губ до 25 секунд
ElevenLabs + Decart анимируют говорящих аватаров в реальном времени для голосовых агентов.
OmniHuman 1.5 превращает одно изображение в выразительный видеаватар с синхронизацией губ.
Sora 2 достигает 25‑секундных генераций на Vadoo AI, открывая пространство для более насыщенных битов
HeyGen намекает на создание настраиваемой графики движения из простого текста — «explain it, animate it»
Демонстрация диалога Grok Video вызывает похвалу за синхронность губ, мимику и плавность движения камеры.
Создатели отмечают высокий уровень согласованности образа персонажа Соры 2 во всех ракурсах и при различном освещении.
🏟️ Onstage: Генеративная медиа-конференция (GMC)
Живой креативный джем: Higgsfield × Hailuo выводят раскадровки на экран в GMC
BytePlus демонстрирует Seedream 4.0, OmniHuman 1.5 и Seedance Pro на сцене.
GMC открывается для переполненного зала с слайдом «год в обзоре» на 200+, 14 моделей, 2 млн+
Shopify даёт обзор генерируемых медиа для креативов в электронной торговле
Панель: Восхождение AI‑нативных студий исследует новые производственные методики
Джеффри Катценберг присоединяется к GMC, чтобы привнести взгляд крупной студии на генеративные медиа.
Панель: ведущие инвесторы Сан-Франциско обсуждают, куда течёт капитал в генеративных медиа.
Панель: Следующая граница моделей освещает возможности, ориентированные на создателей.
Рабочий процесс на сцене: Nano Banana, Veo 3.1 и Genie 3 для быстрого прототипирования
Foster + Partners рассказывает, как генеративные медиа меняют визуализации в архитектуре.
🎨 Все ещё выглядит: srefs, MJ v7, минимальные линии
Новый рецепт MJ v7 sref 7380578 даёт связный коллаж 3:4
Минималистичное линейное искусство: плоские 2D контуры, без теней
Нео-ар-деко стиль ref —sref 2122433650 ногти образ в стиле fashion-noir
Редакционный промпт для сетки из 4 панелей с целью единообразной модели, наряда и освещения
Грубый, приглушённо‑неоновый мудборд с кодом промпта
Референс в стиле аниме —sref 2671898589 с мрачными кинематографическими кадрами
Идея концептуального промпта: эргономичные клавиатуры с коленным упором, вид от первого лица
📑 Статьи: ультра‑высокое разрешение диффузии и обучение с подкреплением по значениям
DyPE обеспечивает диффузию с ультра‑высоким разрешением 16 МП без повторной тренировки.
RLEV выравнивает LLM на соответствие явным человеческим ценностям, что повышает точность, взвешенную по ценностям.
Демонстрации гауссовского распыления подчеркивают резкие скачки качества при захвате 3D в реальном времени.
🧠 Агентные инструменты: MCP-серверы и веб-агенты
fal выпускает кастомный сервер MCP, доступный для вызова из Cursor, Gemini CLI, Claude Code и других
HyperBuild публикует исходники визуального конструктора веб-агентов под открытым исходным кодом.
Пользователи Agent Builder отмечают подводные камни обновления OAuth-токена для инструментов MCP
🏛️ Обзор отрасли и политики для создателей контента
UMG рассказывает о стратегии в области искусственного интеллекта, заключает сделки по платформам и подтверждает лицензионное соглашение с согласием артистов.
YouTube вводит распознавание сходства лиц, чтобы помогать удалять контент, использующий чьё-либо изображение.
Сообщается, что Reddit подает в суд на Perplexity за использование данных для обучения, что усиливает давление в области лицензирования.
Запрос OpenAI на раскрытие информации вызывает озабоченность по вопросам конфиденциальности в деле о суициде, связанном с ChatGPT.
Пост утверждает, что OpenAI протестирует рекламу на основе памяти в ChatGPT; создатели спорят о компромиссах в таргетинге.