
Higgsfield Recast предлагает более 30 предустановок персонажей, автоозвучивание на 6 языках — замены тела отслеживают сложное движение
Stay in the loop
Free daily newsletter & Telegram daily report
Executive Summary
Higgsfield превратил Recast в практичный инструмент замены тела, и новые демо‑материалы значимы: жесты во весь кадр остаются отслеживаемыми, синхронизация губ сохраняется, и вы можете вывести шесть языков с одного загрузки. Главное для быстрой сборки — разнообразие: более 30 готовых персонажей одним кликом и четыре мгновенных варианта фона сокращают время настройки с часов до минут.
Сегодняшние ролики демонстрируют более плавное движение при смене камер, заметный скачок по сравнению с прошлой неделей идущей на «не готова для профессионалов» версией создателя. Голос тоже обработан: мгновенное клонирование плюс 12 сток‑голосов сохраняют читаемость перестанов, так что диалоговые скетчи и промо‑ролики не расходятся при локализации. Это уже на странице продукта, и если вы занимаетесь созданием UGC или небольшими съемками, это аккуратно дополняет ваш существующий монтажный процесс (ваш заменяющий персонаж может остаться в кроссовке).
Если нужен более тонкий контроль, сочетайте замены Recast с инструментами движения без обучения: Time‑to‑Move от NVIDIA/Technion добавляет рисуемые объекты и пути камер без тонкой настройки, а ATI Trajectory Control от Comfy Cloud позволяет набросать маршруты и анимировать статичные кадры. Итог: правдоподобные тела, более точное направление движения и многоязычные монтажи, которые можно отдать в тот же день — мы помогаем создателям строить выпуск быстрее.
Feature Spotlight
Замены всего тела, которые действительно отслеживают (Higgsfield Recast)
Higgsfield Recast приносит замены полнотелых персонажей профессионального уровня с реальной физикой, клонированием голоса и авто‑дубляжом на 6 языков — превращая сложные VFX в рабочий процесс, занимающий всего несколько минут для создателей.
Сегодняшняя история о самом крупном в мире творческом инструменте: Recast заменяет целые тела на реальную физику, точную синхронизацию губ и авто‑дубляж на нескольких языках. Несколько демонстраций показывают одноклик‑пресеты для персонажей и фонов за считанные минуты.
Jump to Замены всего тела, которые действительно отслеживают (Higgsfield Recast) topicsTable of Contents
🌀 Замены всего тела, которые действительно отслеживают (Higgsfield Recast)
Сегодняшняя история о самом крупном в мире творческом инструменте: Recast заменяет целые тела на реальную физику, точную синхронизацию губ и авто‑дубляж на нескольких языках. Несколько демонстраций показывают одноклик‑пресеты для персонажей и фонов за считанные минуты.
Higgsfield Recast блестяще реализует обмен целыми телами благодаря убедительной физике движений.
Создатели показывают, как Recast заменяет целые тела за считанные минуты, при этом сохраняя сложное движение и механику тела; трекинг выдерживает даже при жестах на полном кадре и смене камеры feature reel. Следуя за обзором создателя, который называл это неподготовленным для профи, сегодняшние демонстрации выглядят более стабильными, и вы можете попробовать это напрямую на странице продукта Higgsfield homepage.

Recast выпускает более 30 пресетов персонажей одним кликом в стилях человека, аниме и животных.
Новый ролик освещает более 30 предустановок, которые позволяют одним кликом вставлять вашего персонажа в человека, аниме, животных и мультфильмы — полезно для быстрой идеи, пайплайнов UGC и тестирования персонажей presets reel. Доступ и цены на основной странице продукта Higgsfield homepage.

Авто‑дубляж экспортируется на шесть языков с сохранением синхронизации губ.
Загрузите один раз и получите шесть языковых версий; демо сохраняет соответствие форм рта каждой локали, что делает быстрые международные монтажи подходящими для коротких видео и рекламы демо автоматической дублировки.)

Recast добавляет мгновенное клонирование голоса и 12 стандартных голосов с естественной подачей.
Вы можете клонировать голос за секунды или выбрать из 12 встроенных; синхронизация губ остаётся точной в образце, что важно для диалоговых скетчей и монологов для промо‑роликов voice demo.)

Замены фона одним кликом нацелены на безликих создателей и предлагают четыре предустановки.
Сменный фон Recast мгновенно изменяет ваше окружение, используя четыре тщательно подобранных образа; он ориентирован на безликих создателей, которым нужны повторяемые, премиальные сцены без суеты с освещением или установкой сцены background demo.)

🎚️ Управление движением без обучения (TTM + Comfy Cloud)
Точное движение — главный тезис для режиссёров: Time‑to‑Move от NVIDIA/Technion добавляет управление на уровне траектории без тонкой настройки, а ATI Trajectory Control от Comfy Cloud позволяет рисовать траектории камеры/объекта. Функция Recast не включена.
Time‑to‑Move приносит управление движением без обучения к диффузии видео.
NVIDIA и Technion представили Time‑to‑Move (TTM), метод по выборке времени, который позволяет чертить траектории объектов, управлять путями камеры через глубинное повторное проецирование и применять пиксельно‑уровневую настройку без донастройки базовой модели paper thread, ArXiv paper. Dual‑clock denoising выделяет отдельные графики шума для управляемых и свободных регионов, сопоставляя или опережая базовые показатели, если обучались, при работе на существующих бэкгундах i2v.
Разбор, ориентированный на кинематографистов, выделяет практические преимущества — матч‑мувы, хореографически выстроенные акционные моменты и композитинг со съёмками в реальном времени, с кодом и примерами, которые можно попробовать уже сегодня creator analysis, analysis article.

ATI Trajectory Control приземляется на Comfy Cloud
ComfyUI выпустил ATI Trajectory Control для Comfy Cloud: закрепляйте субъект, набрасывайте путь и превращайте статичное изображение в движущийся кадр за секунды — идеально для плавного фона и управления камерой/объектом на уровне траектории release demo. Далее cloud workflows в разработке, это поставляется как единый drag‑in JSON workflow для той же схемы «load and run», с запланированным живым подробным разбором в пятницу GitHub workflow.
Проблема сохранения Path Animator: возврат к демо‑путям
Разработчики сообщают о регрессии в редакторе Path Animator от ComfyUI, когда сохранённые пользователем пути не применяются во время выполнения, и рабочий процесс возвращается к встроенным маршрутам демо. Краткое воспроизведение показывает, что несколько пользовательских путей сохранены, а затем проигнорированы во время исполнения — протестируйте перед работой с клиентом, пока исправление ожидает bug report.)

🧩 Krea Nodes: один холст для всего вашего конвейера
Krea объединяет все свои инструменты генерации в реальном времени, стили, редактирование, риггинг и инструменты для холста в Nodes с ранним доступом к API и скидкой для создателей. Значимые новости для операций: дизайнерам, создающим повторяемые пайплайны.
Krea Nodes доступен для всех: единый интерфейс для генерации, стилей, редактирования и риггинга.
Krea rolled out Nodes to all users, combining its realtime generation, style models, editing, rigging, and canvas tools into a single node‑based workspace. API early access is open via comments, signaling upcoming automation hooks for studio pipelines launch video.

Почему это важно: творческие специалисты теперь могут создавать повторяемые и распространяемые пайплайны в одном месте — соединять модули, версии потоков и обеспечивать единообразный облик без переключения между приложениями.
Krea предлагает скидку 50% на все поколения Nodes на этой неделе для платных планов.
Krea объявила 50% скидку на все поколения Nodes на одну неделю, доступную для платных планов. Это окно с низким риском для пакетного тестирования конвейеров, сравнения стилей и проверки пропускной способности перед масштабированием promo details.
🧑🎤 Согласованные символы в LTX‑2 (рабочие процессы Elements)
Как‑то и ролики демонстрируют элементы LTX, сохраняя консистентность мультперсонажа на разных кадрах, с подсказками вроде увеличения токена персонажа, удлинения клипа за счёт последних кадров и ускоренных переходов скорости. Функция Recast не включена.
Учебник по LTX Elements показывает, как сохранять единообразие мультяшного персонажа в разных кадрах.
Практическая серия шагов описывает создание персонажа в LTX Elements, сохранение его как элемента, маркировку @ для вызова в последующих подсказках и усиление токена анимированного персонажа, чтобы сохранять идентичность на разных сценах Руководство по Elements. Он также демонстрирует два практических совета по редактированию внутри LTX‑2: растянуть кадр, анимируя последний кадр предыдущего клипа, и использовать скоростные кривые, чтобы сгладить стыковки Workflow thread.)

Почему это важно: последовательные персонажи — одна из самых сложных частей AI‑шортов и рекламы; этот процесс превращает одну хорошую статическую картинку в повторно используемый, управляемый актив. Попробуйте рабочий процесс непосредственно в студии, если нужно протестировать его от начала до конца сегодня стрница продукта LTX.)
20‑секундный план одной съемки, снятый на LTX‑2, демонстрирует плавную непрерывность движения
Runware поделилась 20‑секундной съёмкой одним дублем, созданной с помощью LTX‑2, которая будет полезна в качестве ориентира для согласованности камеры и временной стабильности перед созданием многодублевых последовательностей One-take reel. Для команд, стремящихся к последовательным персонажам, мощный однодубль задаёт стиль, освещение и сигналы движения, которые можно перенести в рабочие процессы Elements.

📐 Изменить камеру после снимка (Higgsfield Angles)
Angles восстанавливает сцены, чтобы создавать новые точки зрения из одного фото — полезно для лукбуков, э‑коммерции и сторибордов. Несколько создателей заявили о запуске. Исключена функция Recast.
Higgsfield запускает Angles, чтобы изменить угол обзора камеры на фотографии одним кликом
Higgsfield выпустил Angles, инструмент одним щелчком, который восстанавливает сцену по одному фото и создает новые ракурсы — полезно для lookbooks, электронной торговли и раскадровок feature explainer. Создатели сообщают, что возможность смены угла уже доступна и стоит опробовать на текущих проектах rollout note, creator teaser.

🛍️ ИИ-движки рекламы для Черной пятницы/Киберпонедельника
Высокоскоростные инструменты для рекламодателей: более быстрые шаблоны Pollo 2.0, конвейер фото→вирусной рекламы InVideo, и предложение Pictory к BFCM с Getty/ElevenLabs. Исключает функцию Recast.
Pollo 2.0 запускает более 30 рекламных шаблонов ко Дню Черной пятницы с тремя бесплатными запусками
Более 30 шаблонов для Black Friday/Cyber Monday только что поступили в Pollo 2.0, каждый из которых можно использовать бесплатно 3 раза до 1 декабря; промо-акция с ответом «Flash» добавляет 150 кредитов для подписчиков, которые ретвитят и оставят комментарий. Обновление также обеспечивает более быструю отрисовку и праздничное фоновое музыкальное сопровождение на каждом шаблоне, продолжая тему обновления Pollo 2.0, которое добавило синхронизацию голоса и более плавное движение. Смотрите обзор функций в коротком reel templates reel,) и детали предложения на странице Pollo Black Friday promo page) с полным разбором на Black Friday page.)

InVideo превращает одну фотографию продукта в полноценную рекламу — без подсказок.
InVideo продвигает схему «нет съемки, нет монтажа, нет подсказок — просто фото», которая превращает изображение продукта в полноценную рекламу, готовую к размещению в социальных сетях. Творческая ветка собирает концепции для Черной пятницы — от инсценированной стычки в магазине до стиля промо-файтинга — созданные за секунды из одного фото feature thread,) с образцом клипа здесь Store brawl concept) и сайтом продукта для практических испытаний на Invideo site.)

Pictory AI BFCM: 50% скидка на годовые планы плюс 2 400 кредитов и профессиональная сессия
Акционная сделка Pictory на Черную пятницу предлагает 50% скидку на годовые планы (6 месяцев бесплатно, если оплатить за 6), плюс 2 400 AI-кредитов, бесплатную сессию с видео-экспертом и доступ к голосам ElevenLabs и медиа Getty pricing promo. Полная цена и уровни тарифов детально указаны на странице акции pricing page.
📞 Корпоративная телефония: SIP-транки + Scribe v2 в реальном времени
Новости голосовой инфраструктуры для креативщиков с агентной направленностью: ElevenLabs обновляет интеграцию SIP для потоков VoIP/PBX/самостоятельно размещаемых, добавляет детали по безопасности и соответствию требованиям и предоставляет переключатель для Scribe v2 Realtime; транскрипция Raycast на iOS принимает это.
ElevenLabs добавляет SIP-транки, шифрование и статические IP-адреса агентам
ElevenLabs обновила SIP‑интеграцию агентов, чтобы команды могли подключать Twilio или Telnyx, существующие PBX‑системы вроде Exotel, или самохостинговые SIP‑серверы — теперь с сквозным шифрованием и статическими IP‑адресами для соответствия требованиям и списков разрешений сети SIP integration upgrade, Security notes. Обновление также подчеркивает устранение проблем в реальном времени с чистой передачей оператора и содержит подробные инструкции по настройке Handoff and routing, SIP docs.)

Для творческих мастерских, занимающихся телефонной поддержкой, бронированием линий или прямыми трансляциями горячих линий, это приносит маршрутизацию корпоративного уровня и безопасность в тот же стек агентов, который вы уже используете для голоса, TTS и инструментов.
Scribe v2 Realtime теперь поддерживает Raycast iOS; переключатель появляется в разделе “Agents”.
Raycast транскрипция для iOS перешла на ElevenLabs’ Scribe v2 Realtime, давая мобильным создателям более быстрые и чёткие заметки в реальном времени Raycast iOS note. В то же время ElevenLabs добавили простую расширенную настройку для включения Scribe v2 Realtime внутри Agents, чтобы ваши голосовые боты могли использовать ту же низкую задержку ASR — продолжение по Scribe v2 150 ms запуск Agents settings. ElevenLabs также опубликовали сравнение рядом, показывающее более точное улавливание намерений на сложном аудио по сравнению с конкурентом ASR demo.

Если вы запускаете рабочие процессы линии вызова или творческие обзоры звонков, включите переключатель в Agents для производственных запусков; на мобильном устройстве попробуйте обновление Raycast для iOS, чтобы захватывать интервью и мозговые штурмы без потери ключевых деталей.
🧪 Gemini 3.0 появляется на мобильной Canvas (список наблюдений)
Несколько наблюдений свидетельствуют о том, что Gemini 3 Canvas запущен на мобильном устройстве (а не в веб‑версии), при этом строки Enterprise ссылаются на 3.0 Pro+. Это полезно для тестирования креативов на устройстве, задач по SVG и коду.
Gemini 3.0 появляется на мобильном Canvas; строка Enterprise упоминает предварительный просмотр «3.0 Pro+»
Создатели замечают Gemini 3.0 за Canvas Google в мобильном приложении Gemini, результаты отличаются от настольной версии. Тест с запросом “Create an SVG for Penguins” на мобильном устройстве дал чистый встроенный SVG, намекая на новую модель, питающую Canvas Mobile SVG test. Multiple reports say it’s on mobile only for now, not web Mobile only note.
В Enterprise захват консоли показывает “Gemini 3.0 Pro+ (Preview model for testing),” что подтверждает, что тихий развертывание идёт на отдельных поверхностях Enterprise console. Это следует за Arena RC, где запись “riftrunner” намекнула на выпуск кандидата Gemini 3 Pro.
Почему это важно: если мобильный Canvas теперь поддерживает 3.0, внутриустройства креативы получают более быстрые черновики SVG/кода для вставки в инструменты дизайна, и появляется более ясный путь к тестированию структурированных выводов до более широкого веб-релиза. Аггрегатор фиксирует больше примеров и подтверждений в одном месте Post roundup.
📓 NotebookLM для рассказчиков: пользовательские стили видео + история
Удобные для создателей обновления: стили обзоров видео, управляемые подсказками, развёртывание истории чатов и глубокое исследование внутри NotebookLM. Удобно для брифов, конспектов и учебного контента.
NotebookLM добавляет стили обзора видео с поддержкой подсказок и разворачивает их по всему миру.
NotebookLM теперь позволяет задать стиль автоматически сгенерированных обзоров видео простой подсказкой (например, «кинематографический стиль»), создавая брендированные резюме для уроков, брифов и контента курса. Функция разворачивается по всему миру и может занять до 7 дней, чтобы добраться до каждого пользователя. Feature brief

For creators, this cuts post‑style passes and helps keep story packages visually consistent across episodes or modules. Flashcards and spaced‑repetition updates are also noted as “coming soon.” Feature brief
Глубокие исследования встроены в NotebookLM для более широкого обнаружения источников
Новая плитка «Deep Research» стала доступна в NotebookLM, расширяя возможности за пределы быстрых веб-поисков, чтобы вытягивать более богатые источники и формировать структурированные отчёты прямо в ноутбуке. Это помогает писателям и преподавателям собирать ссылки и конспекты, не покидая рабочее пространство. Пошаговое руководство по интерфейсу
История чатов начинает распространяться в NotebookLM.
NotebookLM запускает историю чатов, чтобы вы могли вернуться к прошлым сессиям, возобновлять нити и развивать ранее подготовленные материалы или исследования без копирования контекста. Это удобно для сериализованных видео, подкастов и курсов, которые разворачиваются на протяжении недель. Замечание о функции
🌍 Модели мира на практике (Marble + демонстрации создателей)
Помимо шумихи вокруг исследований, создатели демонстрируют Marble в рабочих процессах: углублённые видеоматериалы и лекция, оценённая на 4.1/5, о создании живого мира из одной картинки. С акцентом на практическое использование, ориентированное на создателей.
Marble доступен каждому благодаря редактируемым и экспортируемым 3D-мирaм.
World Labs’ Marble теперь доступен широко, позволяя создателям генерировать полные 3D-пространства из текста, изображений или видео, редактировать любой объект или область, расширять сцены и экспортировать в виде гауссовских сплатов, мешей или кинематографического видео обзор запуска. Обновление также выделяет Marble Labs, пространство, где художники и разработчики тестируют рабочие процессы для VFX, игр, дизайна и робототехники.
Для кинематографистов и рассказчиков это означает виртуальные наборы, над которыми можно действительно работать итеративно и выпускать. Для дизайнеров это путь от референс-бортов к навигационным пространствам без необходимости начинать с DCC в первую очередь. Объявление о доступности также появляется в хрониках создателей, повышая осведомлённость объявление RT.)
Глубокий разбор создателя: Marble против SIMA 2 для рабочих процессов по миростроению
TheoMediaAI опубликовала обзор, в котором сравниваются пути создания миров Marble и экспорта с обучением агента SIMA 2 от Google DeepMind внутри 3D-сред — полезный контекст, если вы собираете декорации и хотите, чтобы агенты действовали в них overview thread, с полным разбором и демо на YouTube YouTube analysis.
\n
Почему это имеет значение: Marble выглядит как рабочее пространство для построения редактируемых, экспортируемых миров; SIMA 2 — как обучающий агент, который может перемещаться, планировать и совершенствовать их внутри. Такое сочетание намекает на ближнесрочный пайплайн «авторское пространство здесь, поведенческие практики там», что четко соотносится с виртуальной постановкой, превизом и интерактивными сценами.
Доклад «Memory House» о мировостроении одним изображением получил оценку 4.1/5
На AI Tinkerers работа Уилфреда Ли «Memory House: Building a Living World from a Single Image with World Labs» получила средний балл 4,1 из 5, восемь идеальных оценок, подчеркивая практическую привлекательность для строителей повествования снимок отзыва.
Сессия была нацелена на превращение одного неподвижного кадра в управляемое пространство, готовое для рассказа, и нашла отклик у создателей, стремящихся сочетать генеративные визуальные решения, интерактивные элементы и пространственную непрерывность — как раз ту пропасть между красивыми кадрами и пространствами истории производственного уровня.
📺 Сегодняшние выдающиеся ролики (Luma, Grok, PixVerse)
Ежедневная порция креативных рилсов и закулисных кадров: Ray3 image-to-video фрагменты, Grok Imagine отслеживание/комик-образы, и зарисовка роста PixVerse. Исключает функцию Recast.
Grok. Представьте, что трекинговые кадры выглядят чисто и создают настроение аниме и видеоигр.
Короткий ролик демонстрирует, как Grok Imagine выполняет передний и задний dolly, а также латеральную съемку с хорошей временной стабильностью в сценах в стиле аниме и игр. Это полезный ориентир для акционных пауз и погонь. Смотрите последовательность в Tracking reel.)

Если ваши монтажные решения зависят больше от движения камеры, чем от движений персонажей, этот клип является прочной базой для тестов промптов и темпа монтажа.
Luma Ray3 выпускает i2v-ролик «Overclock» с дерзкой моушн-графикой
Luma продемонстрировала новую работу Ray3 в формате image‑to‑video под названием «Overclock», с кинетической типографикой и абстрактными энергетическими полями — еще одна мощная стилистическая попытка после Iron Wild reel, которая была мрачной и текстурной. Клип подчёркивает диапазон Ray3 для титровых последовательностей и бренд-заставок. Смотрите короткометражку в Release clip.

Для моушн-дизайнеров это читается как готовый ориентир для быстрого монтажа, светящихся форм и разрешения логотипа.
BTS: полное музыкальное видео, анимированное с помощью Luma Ray3, разбор рабочего процесса
Создатель Кристофер Фрайант поделился закулисьем последнего музыкального клипа, собранного от начала до конца с Ray3 i2v от Luma, пройдясь по конструкции сцен и решениям по стилю. Это спонсировано, но временная шкала и композитинг практичны для небольших команд. Посмотрите объяснение в BTS breakdown.)

Если вы берёте Ray3 за пределы микро‑кадров, это демонстрирует, как масштабировать концепцию на многие биты, не теряя целостности.
Grok Представь ногти в стиле комиксов: черно‑белые и смелые американские чернила
Два короткометражных ролика подчеркивают силу Grok Imagine в печатном стиле, вдохновлённом печатью: один — черно-белая обработка панелей с чистой заштриховкой, и вторая — vignette американского комикса ужасов с толстыми линиями и драматичной постановкой кадра. Посмотрите черно-белый вариант в Демо B&W,) и второй стиль в Клип американского комикса.)

Для сторибордистов и коротких видеороликов в соцсетях это удобные ориентиры при переводе статичных панелей в движение.
PixVerse микроистория: прыжок во времени от щенка до взрослой собаки
PixVerse опубликовал короткую виньету «до/после», где щенок режется на взрослого персонажа с экранной карточкой «1 ГОД ПОСЛЕ». Это простая, повторяемая структура для темпов роста продукта или персонажа. Смотрите это в клип про рост собаки.

Создатели могут заменять сезонные или маркеры прогресса, чтобы создавать компактные Reels, ориентированные на сюжет, без тяжёлой подготовки.
Luma дразнит BTS по поводу «The Lonely Drone», созданного в Dream Machine.
Luma сообщил о предстоящем закулисном взгляде на «The Lonely Drone», указывая на появление большего объема длинноформатного материала по процессу Ray3/Dream Machine. Следите за тем, чтобы участники обсуждений ожидали специфику рабочего процесса, аналогичную недавним BTS‑публикациям Ray3. Смотрите примечание в Примечание BTS.
🎨 Стиль-паки для кражи: MJ V7 + иллюстрация тушью
Пакеты промптов и sref для художников: нео‑ретро‑MJ‑аниме sref, повторяемый шаблон чернильной иллюстрации и рецепт коллажа V7 с последовательным стеком sref/sw.
MJ V7 коллажный стек: --chaos 33, --raw, --sref 3297549407, --sw 500, --stylize 500
Свежий рецепт коллажа V7 выходит: --chaos 33 --ar 3:4 --raw --sref 3297549407 --sw 500 --stylize 500, дающий связанный набор «винтажный желтый» с плотной непрерывностью персонажей и реквизита Recipe post. Продолжая тему V7 collage recipe, этот вариант демонстрирует более строгую цветовую дисциплину и согласованность между сценами, с несколькими сетками, подтверждающими повторяемость More outputs.
Начинайте с подсказок в духе образа жизни или портрета; сохраняйте сочетание sref и sw, чтобы сохранить палитру, затем слегка увеличьте хаос для вариативности компоновки, не теряя идентичность.
Нео-ретро аниме-образ для MJ V7 через --sref 602722549
Пользователи Midjourney V7 получили чёткое руководство по эстетике поздних 80‑х/начала 90‑х OVA: добавьте --sref 602722549, чтобы зафиксировать палитру киберпанк/нуар и лица, которые остаются в рамках модели в разных кадрах Style reference. Это удобно для действий, мрачных крупных планов и единых характеристик персонажей.
Попробуйте на вашем базовом промпте, затем настройте --stylize для грубости против полировки; sref выполняет основную работу по обеспечению согласованности.
Многоразовый шаблон подсказки для чернильной иллюстрации с полями темы и цвета
Azed поделился встроенным каркасом для ink‑иллюстраций: «Плавная [subject] ink‑иллюстрация… деликатные градиенты [color1] и [color2]… минималистическая композиция, эстетика изобразительного искусства», созданный для формирования естественных линий на светлом фоне Prompt text. Нитка демонстрирует варианты с самураем, карпом, танцором и лошадью, каждая из которых сохраняет одну и ту же визуальную грамматику.
Используйте его как стиль‑оболочку во всех движках; примеры хорошо сочетаются с --ar 3:2 и базовой конфигурацией V7, когда вам нужны единые наборы галереи.
🔬 Исследования, за которыми стоит следить: гибридные декодеры и 3D-агенты
В основном — исследования и новости этого цикла: гибридное декодирование TiDAR от NVIDIA, агент SIMA 2 от DeepMind в 3D‑мире и открытая рецептура Lumine для универсальных агентов. Отслеживание трендов, полезное для создателей.
NVIDIA представляет TiDAR: черновик в диффузии, проверка авторегрессивно.
Исследователи NVIDIA представили TiDAR, гибридный декодер, который формирует последовательности с помощью диффузии и завершается автрегрессией, демонстрируя более высокую пропускную способность по сравнению со спекулятивным декодированием, при этом превосходя диффузионные базовые показатели по эффективности и качеству Paper thread, с акцентом на развертывание, удобное для эксплуатации ArXiv paper. Для длинного текста, сценариев и агентов, использующих инструменты, это обещает более быстрое, более последовательное декодирование без экзотических изменений времени выполнения.
SIMA 2 от DeepMind учится и адаптируется в открытом мире трёхмерных игр
Google DeepMind описал SIMA 2, агент, который играет в 3D‑игры, рассуждает о целях, объясняет действия и самоулучшается на основе собственного игрового процесса; его протестировали на трех сложных открытых мирах (MineDojo, ASKA, No Man’s Sky) для демонстрации zero‑shot адаптивности Research overview. Продолжая работу над AligNet моментом согласования видения, сообщество уже спрашивает, когда можно будет опубликовать рекорд спидрана — полезная нагрузочная проверка для embodied generality Speedrun question.
Lumine публикует открытый рецепт универсальных агентов в 3D-мирах.
Команда Lumine поделилась открытым, сквозным рецептом по созданию агентов‑генералистов, которые работают в реальном времени в 3D‑средах, описывая стек на основе VLM с примерно 5 Гц восприятием и управлением клавиатура/мышь на 30 Гц, способный проходить квестовые линии на несколько часов и демонстрировать кросс‑игровой перенос Paper link. Страница содержит детали метода и примеры, которые можно адаптировать создателями для интерактивных фильмов и игровых по‑вероятности впечатлений Paper page.