Higgsfield Popcorn блокирует точное совпадение 8‑кадровых раскадровок – предложение DM на 250 кредитов

Executive Summary

Higgsfield выпустил Popcorn, систему AI-сторибординга, которая наконец решает проблему дрейфа персонажей. Она сохраняет идентичность, гардероб, освещение и окружение в идеальной согласованности на 8 кадрах, повторно используя точные ссылки, а не «похожих» копий. Доступ открыт для бесплатной ежедневной генерации, плюс промо-код DM на 250 кредитов для тех, кто ретвитит и отвечает в рамках запуска.

Рабочий процесс достаточно практичный: сгенерируйте восемь кадра по одной подсказке, создавайте последовательности из загруженных референсов или смешивайте референсы и записывайте заметки к каждому кадру, когда нужна точность. Вы можете загрузить до четырех референсов для персонажей, локаций или реквизита, выбрать соотношение сторон, набросать простые битовые моменты и получить целостную доску за считанные минуты. Основная функция — точное совпадение блокинга: лица не дрейфуют, наряды не morph'ятся, освещение остаётся верным — ваша доска читается как одно производство, а не как восемь «почти». Вы также можете продолжить любую из восьми изображений, чтобы расширить доску, не нарушив непрерывность, а многоходовые редактирования позволяют сохранить стиль в соответствии с исходным образом.

Когда статичные кадры застабилизированы, команды уже интегрируют их в инструменты анимации — Veo 3.1 для хирургических вставок или fal’s Kling 2.5 Turbo за $0.21 за 5 секунд для быстрого перевода изображений в видео — превращая консистентные доски в пригодные к монтажу движения в быстрый режим.

Feature Spotlight

Higgsfield Popcorn: точные AI-раскадровки

Higgsfield Popcorn выходит на рынок AI-сторибордов: загружайте референсы, получите 8 идеально последовательных кадров с точной фиксацией лица, одежды и окружения, расширяйте сцены и добивайтесь бесплатных ежедневных генераций — создатели публикуют руководства и промо‑материалы в считанные часы.

Взрывной запуск между аккаунтами вокруг Popcorn, инструмента для раскадровки, который фиксирует персонажей, освещение и обстановку на протяжении 8 кадров с более точным соответствием эталонам. Множество руководств для создателей и промо-материалов; это сегодняшняя доминирующая творческая история.

Jump to Higgsfield Popcorn: точные AI-раскадровки topics

📑 Table of Contents

🍿 Higgsfield Popcorn: точные AI-раскадровки

Взрывной запуск между аккаунтами вокруг Popcorn, инструмента для раскадровки, который фиксирует персонажей, освещение и обстановку на протяжении 8 кадров с более точным соответствием эталонам. Множество руководств для создателей и промо-материалов; это сегодняшняя доминирующая творческая история.

Higgsfield Popcorn запускается с точно соответствующими 8‑кадровыми сторибордами и промо на 250 кредитов

Хигсфилд представил Popcorn, инструмент для раскадровки, который поддерживает безупречное согласование персонажей, освещения и обстановки на протяжении 8 кадров, с бесплатной ежедневной генерацией и ограниченным предложением DM на 250‑кредитов для пользователей, которые RT и ответят в рамках промо‑окна Launch thread. Создатели могут присоединиться прямо сейчас через страницу продукта и начать собирать последовательности, сохраняющие непрерывность кадра к кадру Product page.

Три режима создания и «точная» привязка ссылок определяют рабочий процесс Popcorn.

Помимо запуска, Хиггсфилд пояснил, как работает Popcorn: сгенерируйте 8 кадров по одному промпту, создавайте последовательности из загруженных образцов, или смешивайте несколько ссылок и промпт для каждого кадра, чтобы обеспечить полный творческий контроль Modes overview.). Также они объяснили, почему лица и наряды не дрейфуют — каждый кадр повторно использует точную загруженную персонажа/окружения в качестве жёсткой ссылки, а не расплывчатую интерпретацию Consistency explanation.)

Практическое занятие: быстрый рабочий процесс по созданию раскадровки Popcorn, который вы можете повторить

Пошаговое руководство для создателя показывает, как загрузить до четырех ссылок (персонажи, окружение, реквизит), выбрать количество сцен, сделать простые заметки по ритму сцен, а затем за считанные минуты сгенерировать связную 8‑кадровую раскадровку — прежде чем перенести эти кадры в видео на более позднем этапе Учебная ветка. Этот поток включает конкретные заметки по сценам, промежуточные кадры и ссылку на регистрацию для новых пользователей Набор статичных кадров, Регистрация партнера.

Кадры раскадровки }

Руководство для создателей: последовательности Popcorn, правки с несколькими входами и расширяемые доски

Подробная цепочка для создателя подробно описывает полный цикл Popcorn: загрузка референсов, установка соотношений сторон и создание до восьми кадров, которые сохраняют идентичность, гардероб, освещение и окружение зафиксированными Creator walkthrough. Он также подчеркивает дополнения, которые важны в производстве: продолжайте любую из 8 версий, чтобы расширить доску, сохранив непрерывность Extend storyboard, и используйте несколько входов для редактирования или рестайлинга с высокой точностью к исходному виду Multi‑input edits. Начните создание с официальной страницы Product page.


🎞️ Veo 3.1 на практике: расширения, вставки и тесты

Создатели продвигают Veo 3.1 с анимациями с одним изображением, расширением/вставкой между кадрами и экспериментами с физикой и светом; включает критику по поводу поведения зеркала и замерзания. Не охватывает обзор функции Popcorn.

Анимация одного изображения в Veo 3.1 с использованием вставки Scenebuilder

Diesol демонстрирует Veo 3.1 анимационный короткометражный фильм — «Bloom» — создан полностью из одного главного кадра, с использованием Scenebuilder и новой функции Insert для расширения сцен из одного изображения One‑image short. Для креаторов это подтверждает пайплайн «один кадр — несколько кадров», сохраняя при этом идентичность и окружение.

Veo 3.1 сталкивается с трудностями при тесте таймлапса замораживания воды.

Подсказка автора для таймлапса в холодную погоду заставляет Veo 3.1 неправильно интерпретировать замерзшую воду (часто добавляя кубики льда) и отклоняться от ожидаемой термодинамики Freezing test,), продолжая работу над Frame tests, где контроль первых и последних кадров выглядел надежным. Физическая правдоподобность по-прежнему требует внимания для образовательных, продуктовых и с большим количеством спецэффектов задач.

Создатели продвигают переходы от кадра к кадру Veo 3.1 и расширяют поток.

Практические тесты хвалят от кадра к кадру Veo 3.1 и функцию Extend как «безумно» эффективные, предположив более плавную непрерывность при вставке новых фрагментов между кадрами Extend demo. The emerging workflow: rough a sequence, then surgically add cutaways and transitions without breaking look or motion.

Тест зеркальной оптики выявляет неточности отражения в Veo 3.1

Оптический эксперимент, сравнивающий схему лазер‑у‑зеркала с выходом Veo 3.1, показывает ошибки геометрии отражения по отношению к эталонной установке Mirror test. Для рекламы и моушн‑графики ожидаются редкие постфиксы, где точность поведения луча имеет значение.

Mirror reflection rig

Поток storyboard‑to‑Veo: сначала кадры, затем JSON‑запросы для движения

Производственный поток описывает простой пайплайн: сначала сгенерируйте ключевые кадры, затем анимируйте их в Veo 3.1, используя подсказки JSON с встроенным ALT, чтобы управлять эмоциями, диалогами и темпом сцен Stills before animation, Prompt control tip. Это снижает повторные запросы и сохраняет замысел при переходе от раскадровки к движению.

Три ключевых кадра


🎬 Нарисованные траектории камер и производительность, управляемая текстом

Инструменты направления съёмки для формирования движения и игры актёров: визуальные аннотации Ray3 от Luma для камеры/действия и текстово-управляемый контроль сцены BytePlus OmniHuman 1.5. Исключает функцию Popcorn.

Luma Ray3 набрасывает движения камеры и рекламные паузы из одного кадра

Поток визуальной аннотации Ray3 от Luma позволяет создателям рисовать траектории камер и раскадровывать действия прямо поверх кадра, а затем исследовать несколько вариантов рекламы (например, подъёмы продукта, всплески, движение, синхронизированное с энергией) внутри Dream Machine демонстрация Luma. Следуя за запуском Ray3, этот демонстрационный материал подчёркивает точность творческого направления, а не новые настройки, что полезно для быстрой упаковки альтернативных монтажей для клиентов.

OmniHuman 1.5 позволяет управлять сценами, действиями и камерой с помощью текста.

BytePlus позиционирует OmniHuman 1.5 как текст‑ориентированного режиссера: описывайте сценовые моменты, действия исполнителя и движения камеры, и он выполняется с плотной синхронизацией аудио, позволяя монологи в стиле влогов, интерактивные истории персонажей и брендовые выступления без подбора ключевых кадров Обзор функций. Питч нацелен на быструю итерацию для повествовательных и коммерческих материалов, где важны тайминг и подача.

Seedance предлагает встроенную многокадрную съемку для связного повествования в разрешении 1080p.

BytePlus представляет Seedance как решение для студий, которым необходима согласованная последовательность из нескольких кадров при ограниченном бюджете, подчеркивая нативную последовательность и вывод 1080p для лора и предысторий персонажей Use case thread.

Chef pairing graphic

  • Ориентировано как «рекомендация шеф-повара» для игровых нарративов, с много‑персонажными сценами и кинематографическими ожиданиями, обработка которых занимает секунды Use case thread.)

Подсказка Seedance‑1‑pro порождает кинематографический пуш-ин трековый кадр

Создатель делится лаконичным промптом Seedance‑1‑pro, который обеспечивает съёмку с продвижением камеры вперёд в лесную поляну, дополненную реактивными сигналами исполнения (птицы разбегаются, рычание, стойка) и атмосферными элементами (туман), демонстрируя текстовые указания по кадру на практике Prompt example. Это практическая рецептура для повествовательных бит без ручной анимации камеры или актёров.


✂️ Редактировать по описанию: удалить всё из видео.

Инструменты, ускоряющие редактирование для кинематографистов. Remove from Video от Runway удаляет элементы через текст — без ротоскопирования или сложных подсказок. Исключает Popcorn.

Runway запускает Remove from Video: текстовое описание объектов для удаления, без ротоскопирования

Runway представил Remove from Video, инструмент с управлением текстом, который удаляет нежелательные элементы из видеоматериалов без ручного ротоскопирования — просто загрузите клип и опишите, что удалить Обзор функций, с инструментом, доступным прямо сейчас через вход в приложение Страница приложения.)). Следующий пост подчеркивает тот же поток «опишите это и идите» и прямой доступ к немедленным испытаниям Напоминание о запуске.)


📹 Быстрые, дешёвые клипы: Kling 2.5 Turbo на fal

Доступ к моделям и изменения в ценообразовании, влияющие на бюджеты производства. fal предлагает Kling 2.5 Turbo Standard по $0.21 за 5 секунд, с поддержкой 720p image‑to‑video и эндпоинтов, ориентированных на скорость. Не включает Popcorn.

fal дебютирует Kling 2.5 Turbo Standard по цене 0,21 доллара за 5 секунд с быстрым преобразованием изображения в видео в разрешении 720p

fal предлагает доступ на нулевой день к Kling 2.5 Turbo Standard по $0.21 за 5 секунд (примерно $2.52 за минуту), позиционируя его как быстрый, высококачественный вариант с 720p конвертацией изображение‑в‑видео для проектов, ориентированных на бюджет Pricing and features. Затем последующий пост подчёркивает скорость первых конечных точек для динамической генерации, сигнализируя о стремлении к быстрому циклу итераций Endpoint highlight.

New model graphic

Kling’s current showcases include solid image‑to‑video fidelity, useful for turning storyboard stills into moving shots without blowing through credits I2V showcase.


🧩 ComfyUI для последовательных персонажей и сцен

Узловые рабочие процессы для единообразного вида на кадрах: ComfyUI сочетают текстовые и графические API Gemini Flash; на примерах досок показываются певец, миниатюры лягушек и листы моделей в мультяшном стиле. Также приглашаются на доступ в облако. Исключает Popcorn.

ComfyUI представляет рабочий процесс Gemini Flash + Image для постоянных персонажей во всех сценах

ComfyUI опубликовал узловой рабочий процесс, который сочетает LLM Gemini Flash с его API изображений, чтобы поддерживать идентичность персонажа, одновременно изменяя обстановку, наряд и позу, позволяя создателям работать на естественном языке без потери непрерывности Обзор рабочего процесса.

последовательные сетки персонажей

  • Примеры досок показывают панк-персонажа в разных окружениях, серию уютных миниатюр-фигур лягушки, певца, выступающего на нескольких площадках, и оборот/лист моделей в мультяшном стиле — демонстрирующие согласованность между сценами на основе общих ссылок Примеры вывода.

Доступ к Comfy Cloud ускоряется за счёт кодов приглашения и общей ссылки

ComfyUI внедряет упрощённое подключение к своей управляемой среде: участники сообщества сообщают об мгновенном доступе через cloud.comfy.org, в то время как ComfyUI предлагает мгновенные коды приглашения с бесплатным периодом на один месяц тем, кто примет участие в звонке Comfy Cloud) и Invite code offer.)


🌍 Open 3D: прямой проход от видео к миру за секунды

3D-инструменты для создания миров: Tencent выпускает с открытым исходным кодом Hunyuan World 1.1 с поддержкой видео/многоракурсной визуализации в 3D, выводя облака точек, глубину, нормали, камеры и 3D-гауссовы распределения на одном GPU.

Tencent открывает исходники Hunyuan World 1.1 для прямого преобразования видео и мультиизображений в 3D на одной GPU

Tencent выпустил Hunyuan World 1.1 (WorldMirror), универсальную модель прямого 3D‑восстановления, которая за секунды на одном GPU превращает видео или входные данные с нескольких ракурсов в полноценные сценовые активы, и она открыто доступна для создателей. Она объединяет априорные данные, такие как внутрипознакомые камеры, позы и глубина, чтобы определить структуру, и одновременно выдает облака точек, глубину с нескольких ракурсов, нормали, откалиброванные камеры и 3D гауссовы сплаты (splat) для дальнейшего мирового строительства open‑source thread.)

  • Гибкие входы и априорные данные: текст, изображение, видео или многокадровые данные с опциональными сигналами геометрии для более высокой точности open‑source thread)
  • Много representation outputs в одном проходе: плотное облако точек, глубинные/нормальные карты по каждому виду, параметры камеры и 3D гауссианы (Gaussians) (готовы к быстрой визуализации/редактированию) open‑source thread)
  • Влияние для создателей: одно‑GPU, инференс за секунды делает предварительную визуализацию, раскладку и захват ассетов реализуемыми в ежедневных пайплайнах; страница проекта, GitHub, демо и отчет связаны внутри объявления open‑source thread)

🌀 Хитрости промптов о движении: старение, влияние, настроение

Практические рецепты видеоподсказок, которые сегодня поделились создатели: Grok Imagine aging timelapse, комедийная деформация лица от удара лосося, романтика/крупный план — контроль настроения; плюс промпт на трекинговый съёмочный кадр Seedance push-in.

Grok Imagine prompt: мгновенная съёмка-таймлапс с ускоренным старением

Создатели поделились однострочным рецептом Grok Imagine, который превращает субъект из молодого в очень пожилой в виде быстрого таймлэпса, отлично подходит для драматических раскрытий или темпа прошествия времени Aging prompt.

  • Попробуйте: “Subject rapidly aging, ultra‑fast transition to extremely old, rapid time‑lapse effect” Aging prompt

Grok Imagine настроение ногтей и крупные планы на четырех новых тестах

Четыре свежих клипа демонстрируют тонкую романтику, поэтичные ночные сцены и тревожные крупные планы, продолжая тему Mood tests, которая подчеркнула выразительный контроль тона Грока. Сегодняшние посты подчёркивают расстановку света и тени и читаемость микро-эмоций в тесных рамах Romance clip, Night scene, Eerie close‑up, Light and shadow.

Seedance‑1‑pro подсказка: внедренное отслеживание к напряжённому раскрытию

Краткий рецепт Seedance‑1‑pro обеспечивает кинематическое приближение к лесной поляне, когда воин реагирует на зловещий рывок — полезно для трейлеров, настроенческих фрагментов и сцен в духе игрового видеоклипа Prompt details.

  • Попробуйте: «Push‑in tracking shot: Камера приближается к лесной поляне, где воин затачивает клинок. Птицы разбегаются, зловещий рычок эхом разносится, воин наготове. Туман кружится между деревьями. Эпическая фэнтези‑сцена» Prompt details)

Комедийный гэг удара в Grok: деформация лица от удара лососем

Комедийный «рецепт движений» синхронизирует деформацию лица с ударом по ритму — полезно для комических пауз или вставок с реакциями без кадров трюков Punch effect prompt.)

  • Попробуйте: «Его жестко бьют мощным лососем прямо по щеке. Удар по лицу. Его лицо искажается от удара» Punch effect prompt)

🖼️ По-прежнему выглядит так: параметры MJ v7, футболки и srefs дочерней книги.

Рецепты подсказок с фокусом на изображения и ссылки на стиль: наборы параметров MJ v7, готовый к печати промпт для черно-белой футболки, северная акварельная иллюстрация для детей в стиле sref и архивы стилей создателя.

MJ v7 рецепт: хаос 10 с sref 1367149754 образует целостный набор 3:4

Свежая комбинация параметров Midjourney v7 —--chaos 10 --ar 3:4 --sref 1367149754 --sw 500 --stylize 500 — создаёт плотный, стилизованный коллаж с единообразной палитрой и кадрированием MJ v7 collage, в продолжение темы MJ v7 recipe, где вариант chaos‑7 подтвердил свою надёжность.

MJ v7 collage

  • Точные параметры: --chaos 10 --ar 3:4 --sref 1367149754 --sw 500 --stylize 500 MJ v7 collage

Готовый к использованию черно-белый промпт для футболки с графикой в стиле мультфильмов, готовой к печати.

Универсальный шаблон запроса предоставляет графику в стиле высококонтрастной черно-белой карикатуры с яркими контурами, зернистыми штрихами, нейтральным фоном и без текста — готов к печати на футболках прямо из генератора Prompt template.

T‑shirt examples

  • В поля для заполнения входят [emotion], [character], [clothes] и по желанию [pose/prop], чтобы быстро менять стили, сохраняя принт‑безопасную компоновку Prompt template

Детская иллюстрация sref 984570117 передает скандинавский акварельный стиль.

Ссылка в стиле Midjourney (--sref 984570117) задаёт современное ощущение детской иллюстрации — поэтический реализм с влиянием нордической акварели и цветных карандашей — идеально подходит для страниц сказок и мягких повествовательных сцен Style reference.

Детский стиль сетки

Стиль архива сообщества: ссылка --sref 2813586012 приглашает рифы

Архивная справка в стиле Midjourney (--sref 2813586012) снова в обращении, демонстрирующая портреты в духе аниме, сцены галерей и зарисовки про транспорт, чтобы сообщество могло ремиксовать и расширять Archive sref.

Архивные примеры


🛡️ Безопасность браузера с агентной архитектурой: инъекции и планы Chrome

Предупреждения по безопасности для AI-браузеров: Atlas взломан через инъекцию в буфер обмена; Brave предупреждает о рисках, связанных с подсказками; документы Chrome намекают на агентный Gemini в будущей версии. Исключает Popcorn.

Взлом через инъекцию буфера обмена зафиксирован в ChatGPT Atlas; рассматривать режим агента как высокий риск

Публичная демонстрация показывает, что ChatGPT Atlas можно взломать через внедрение в буфер обмена, чтобы вставлять вредоносные фишинговые ссылки, которым агент следует без осознания Clipboard attack demo. Продолжaя тему режим агента, который подчеркнул автономные действия Atlas, предупреждения Brave о вводе команд и ловушках на стороне DOM как основные риски для агентских браузеров Brave warning. Создатели должны рассматривать сессии агентов как ненадежную автоматизацию и держать конфиденциальные учетные записи вне зоны риска, пока вендоры усиливают защиту Safety checklist.

AI browser risks explainer

  • Изолируйте просмотр агентом в отдельные профили или виртуальные машины; не объединяйте с банковскими/медицинскими входами.
  • Требуйте одобрение человека для каждого действия; отключите автоматическое использование буфера обмена и загрузки в песочницу до внедрения мер защиты.

Практический контрольный список по безопасности для браузеров в стиле Atlas/Comet

КРИТИЧЕСКИЕ ПРАВИЛА:

  1. Сохраняйте ВСЕ заполнители точно так же, как они выглядят (например, MARKER_0, https://x.com/koltregaskes/status/1981102596351013363)., SOURCELINK_2)
  2. НЕ переводите любые заполнители
  3. Переводите только читаемый человеком текст между заполнителями
  4. Поддерживайте ту же структуру, тон и форматирование
  5. Используйте технические термины, подходящие для аудитории AI/tech
  6. Сохраняйте форматирование Markdown (жирный шрифт, курсив, списки и т. п.)

Описание заполнителей:

  • MARKER_X: маркеры цитирования с ярлыками, встроенные в текст
  • URL_X: веб-URL-адреса, которые не следует переводить
  • SOURCELINK_X: React-компоненты, которые не следует переводить

Переводите естественно, сохраняя все заполнители без изменений в их точных позициях.

A creator compiled a concise safety playbook for AI browsers like Atlas and Perplexity Comet—profile isolation or VMs, explicit human approvals, and avoiding high‑stakes accounts—based on current exploits and risk models Security checklist. The recommendations align with Brave’s write‑up on prompt injections, clipboard hijacking, and hidden page instructions that can steer agents off‑task [Threat model](URL_1

AI browser risks explainer

  • Просматривайте и утверждайте очереди действий агентов; блокируйте авто‑заполнение форм и авто‑покупки в контекстах агентов.
  • Регулярно проверяйте разрешения для буфера обмена/расширений и поддерживайте обновление программного обеспечения, чтобы снизить поверхность для атак.

Chrome 143 добавит агентские функции Gemini с корпоративными политиками при запуске

Скриншот панели помощи Chrome 143 указывает на предстоящие агентские возможности для Gemini напрямую в Chrome, с корпоративными политиками, доступными на запуске Chrome 143 hint. Для креативных команд встроенная помощь, ориентированная на страницы в браузере по умолчанию, может упростить исследования и правки на самой странице, но при этом повышает требования к встроенной безопасности и административным настройкам по сравнению с сторонними AI-браузерами.

Скриншот Gemini в Chrome


🎙️ Голосовые сессии: ElevenLabs в Google и Summit

Голосо-ориентированное обучение: ElevenLabs продемонстрирует TTS v3 на Google Startup School и расширяет программу саммита с участием will.i.am и Ларри Джексона. Полезно для озвучивания (VO), дубляжа и планирования звукового дизайна.

Саммит ElevenLabs добавляет will.i.am и Ларри Джексона; регистрация открыта

ElevenLabs расширила состав Саммита на 11 ноября до участия will.i.am и gamma. Генеральный директор Larry Jackson, выделяющий голосовые интерфейсы и творческую собственность Speaker announcement.

Speaker announcement card

Регистрация уже открыта на официальном сайте, а сессии обещают ранние превью моделей и живые демонстрации Summit site.

ElevenLabs продемонстрирует Eleven v3 TTS на школе стартапов Google 12 ноября.

ElevenLabs проведёт сессию для разработчиков на Google Startup School: GenAI Media, демонстрируя, как раскрыть очень выразительные голоса с Eleven v3 и интегрировать API в творческие рабочие процессы Session details.

Event session card

Доклад обещает углублённое рассмотрение реалистичных голосов, AI-музыки, звуковых эффектов и практических рекомендаций по реализации для интерактивных медиа и повествования.


🛠️ Помощники для продакшена: OCR/Markdown и редактирование изображений

Бэкенд-помощники для креативных операций: воспроизведите хосты Datalab’s Marker + OCR (быстро, $2–$6 за 1k страниц) и runware поставляет Riverflow 1 Pro для более сложных редактирований изображений с более высокой долей успеха.

Воспроизведите хосты моделей Marker и OCR от Datalab; от $2 до $6 за 1k страниц, быстрое извлечение Markdown

Replicate выпустил Marker и OCR от Datalab, чтобы команды могли извлекать Markdown/структурированный текст из PDF, изображений и Word-документов через простые API, стоимость примерно $2–$6 за 1,000 страниц и позиционируются как быстрые для массовых конвейеров Model announcement, Pricing note.

Баннер Marker и OCR

  • Основано на открытых стэках Marker и Surya, с готовыми к использованию конечными точками для немедленного использования Marker model card, и OCR model card; фон и детали использования в обзоре Replicate blog post.

Riverflow 1 Pro поступает на Runware с увеличенным временем обработки для более сложных правок изображений.

Runware выпустила Riverflow 1 Pro в открытый доступ, рекламируя лучшую качество/стабильность и “долгий интервал размышления”, что повышает успех при сложных правках и сокращает повторные попытки для производственной работы с изображениями Release thread, Availability note.

Riverflow promo card

  • Просматривайте и интегрируйте через каталог моделей; Pro размещается рядом с Mini и базовым Riverflow для разных требований скорости/качества Models catalog.
  • Контекст: Riverflow 1 недавно заняла верхнюю строку в рейтинге по редактированию изображений, что намекает на высокую точность редактирования до этого обновления Pro Leaderboard ranking.

🏆 Показы и звонки: хоррор-голосования, MAX talks

Мероприятия сообщества для кинематографистов: голосование за конкурс фильмов-ужасов с ИИ от Леонардо открывается; сессия Adobe MAX продемонстрирует короткометражные фильмы на базе искусственного интеллекта и рабочие процессы. Не включает бизнес-метрики и запуски, освещаемые в другом месте.

Открыто голосование за конкурс Леонардо по фильмам ужасов с участием ИИ.

Голосование аудитории уже открыто для Третьего ежегодного конкурса фильмов ужасов об искусственном интеллекте, организованного Curious Refuge, Epidemic Sound и Leonardo AI Voting opens. Проголосуйте за официальную подборку участников и ознакомьтесь с участниками до объявления победителей 30 октября, с призовым фондом в $12,000 Competition page.

Сессия Adobe MAX представит три короткометражки про ИИ и разбор рабочего процесса.

Dave Clark из Promise Studios и MetaPuppet представят три новых короткометражных фильма, созданных с использованием ИИ, и расскажут, как они применяют инструменты GenAI от Adobe на Adobe MAX 28 октября, продолжая тему AI in Filmmaking, которая ранее заинтриговала одной премьерой Session preview. Session cards


🏢 Пульс отрасли: увольнения и статистика по числу пользователей

Деловые сигналы с креативным воздействием: по сообщениям, Meta сокращает около 600 сотрудников в области ИИ; FAIR пострадал; PixVerse демонстрирует масштаб в Стэнфорде — 100 млн пользователей, более 40 млн ARR годовой повторяющейся выручки. Исключаются функции запуска продукта.

По сообщениям, Meta сокращает около 600 должностей в области ИИ; сообщается, что FAIR пострадал, среди уходящих — старший директор.

Axios-источники сообщают, что Meta сокращает примерно 600 позиций в своей AI-организации, и ожидается, что на это пострадает FAIR Сводка об увольнениях. Разные публикации отмечают, что директор по исследованиям FAIR Yuandong Tian также был уволен, что подчеркивает влияние на руководящие уровни FAIR director note.)

executive portraits

Для креативных команд сокращение в FAIR может замедлить открытые исследования и релизы моделей, которые часто превращаются в инструменты для создателей контента; следите за ближайшими изменениями в найме в сторону внедрения генеративного ИИ в продукцию, а не исследовательскую работу.

PixVerse демонстрирует масштаб: 100 млн пользователей и более $40 млн ARR, усиливает фокус на росте креаторов с мобильной первой стратегией.

На разговоре у камина в Стэнфорде PixVerse заявил, что превысила 100 млн пользователей и более $40 млн ARR, двигая мобильный, ориентированный на шаблоны путь от зрителя к создателю Stanford talk.

Stanford fireside

Почему это важно: стабильный доход в таком масштабе сигнализирует о постоянном спросе на лёгкое создание видео; ожидайте более быструю итерацию по генерации в реальном времени и монетизацию, которая отдает предпочтение кратким формам рассказа.

Трафик Google AI Studio вырос на 1 453% за год; Gemini увеличивает долю рынка, а ChatGPT снижает свои позиции.

Графики Similarweb показывают, что посещения AI Studio выросли на 1 453,34% год к году, указывая на быстрое принятие разработчиками вокруг стека Google Traffic chart. ) Другой снимок фиксирует рост доли трафика Gemini в генеративном ИИ с 6,4% до 12,9%, в то время как доля ChatGPT снижается с 87,1% до 74,1% за 12 месяцев Traffic share note.

traffic chart

Для креативщиков это перераспределяет риски платформы: появление более жизнеспособных конвейеров вокруг Gemini/AI Studio означает более широкий доступ к видео, изображениям и функциям агентов вне рабочих процессов, ориентированных на OpenAI.

Claude Sonnet 4.5 возглавляет таблицу использования у Poe, обогнав Gemini 2.5 Pro и GPT‑4o

Теперь рейтинги использования Poe показывают, что Claude Sonnet 4.5 является наиболее используемой моделью на платформе, за ней следуют Gemini 2.5 Pro и GPT‑4o на следующих местах Poe leaderboard. Для производственных команд это намекает на склонность к Claude для черновиков, редактирования и планирования задач, которые предшествуют видеопроизводству и работе над дизайном.


🧪 Статьи к просмотру: длинное видео, выравнивание, обучение с подкреплением на триллион шагов

Сегодняшние исследования склонны к генерации длинных видео и масштабируемому обучению с подкреплением: разрежённое внимание MoGA, иерархическое внимание UltraGen, извлечение данных выравнивания из открытых моделей и инфраструктура обучения RL Ring‑1T.

MoGA разрежённое внимание продвигает генерацию видео длительностью в одну минуту с несколькими кадрами

Исследователи ByteDance предлагают Mixture‑of‑Groups Attention (MoGA), схему разрежённой маршрутизации, которая обеспечивает сквозную генерацию длинного видео за минутный масштаб с многошотной структурой, ориентируясь сегодня на примерно 480p paper thread.

Титульная страница )

Для создателей эффективность MoGA обещает более длинные когерентные повествования без разделения на отдельные клипы — следите за новостями об открытых весах или демо, которые могут оказаться в инструментах продакшна.

Ring‑1T подробно описывает обучение RL размером в триллион параметров для «мыслящих» моделей

КРИТИЧЕСКИЕ ПРАВИЛА:

  1. Сохраняйте ВСЕ заполнители точно так, как они выглядят (например, MARKER_0, https://pbs.twimg.com/media/G33ER7mXcAA31jV.png, SOURCELINK_2)
  2. НЕ переводите какие-либо заполнители
  3. Переводите только читаемый текст между заполнителями
  4. Сохраните ту же структуру, стиль и форматирование
  5. Сохраняйте технические термины, уместные для аудитории ИИ/технологий
  6. Сохраните форматирование markdown (жирный шрифт, курсив, списки и т. п.)

Заполнители представляют:

  • MARKER_X: маркеры цитирования с метками, встроенными в текст
  • URL_X: веб-адреса, которые не следует переводить
  • SOURCELINK_X: компоненты React, которые не следует переводить

Переводите естественно, сохраняя все заполнители в неизменном виде на своих местах.

Every Step Evolves описывает Ring‑1T, разомкнутая нейронная сеть с триллионом параметров и разреженной активацией (примерно 50 млрд активных на токен), обучаемая при помощи масштабируемого обучения с подкреплением, с результатами по AIME‑2025, HMMT‑2025, CodeForces и ARC‑AGI‑v1 paper post.

[Image]

Хотя это не относится исключительно к видео, масштабируемое обучение с подкреплением, улучшающее пошаговое рассуждение, может обеспечить более мощных сторибордеров, редакторов и инструменты режиссера-агента, которые планируют мультикадровые последовательности с меньшим количеством повторов.

UltraGen представляет иерархическое внимание для видео высокого разрешения, готового к 4K.

UltraGen описывает иерархический дизайн внимания, нацеленный на масштабирование генерации видео до более высоких разрешений, с примерами от 480p до 4K и сравнениями с Wan и Hunyuan Video paper thread.

Сравнение разрешений

Если применять в инструментах для создателей, иерархическое внимание могло бы уменьшить артефакты при 1080p–4K и стабилизировать тонкие детали на более длинных кадрах.

Google исследует извлечение данных об выравнивании из открытых моделей с помощью эмбеддингов.

Исследование Google показывает, что сигналы обучения выравниванию можно частично восстанавливать из послеподготовленных открытых моделей с использованием извлечения на основе встраиваний, что подчеркивает риски дистилляции данных и утечки безопасности paper post.

Заголовок и аннотация

Для творческих конвейеров ИИ это сигнализирует о необходимости осторожности при ремикшировании или дистилляции выравниваемых моделей — лицензирование и происхождение данных для выравнивания будут иметь значение для последующих инструментов и плагинов.

On this page

Executive Summary
🍿 Higgsfield Popcorn: точные AI-раскадровки
Higgsfield Popcorn запускается с точно соответствующими 8‑кадровыми сторибордами и промо на 250 кредитов
Три режима создания и «точная» привязка ссылок определяют рабочий процесс Popcorn.
Практическое занятие: быстрый рабочий процесс по созданию раскадровки Popcorn, который вы можете повторить
Руководство для создателей: последовательности Popcorn, правки с несколькими входами и расширяемые доски
🎞️ Veo 3.1 на практике: расширения, вставки и тесты
Анимация одного изображения в Veo 3.1 с использованием вставки Scenebuilder
Veo 3.1 сталкивается с трудностями при тесте таймлапса замораживания воды.
Создатели продвигают переходы от кадра к кадру Veo 3.1 и расширяют поток.
Тест зеркальной оптики выявляет неточности отражения в Veo 3.1
Поток storyboard‑to‑Veo: сначала кадры, затем JSON‑запросы для движения
🎬 Нарисованные траектории камер и производительность, управляемая текстом
Luma Ray3 набрасывает движения камеры и рекламные паузы из одного кадра
OmniHuman 1.5 позволяет управлять сценами, действиями и камерой с помощью текста.
Seedance предлагает встроенную многокадрную съемку для связного повествования в разрешении 1080p.
Подсказка Seedance‑1‑pro порождает кинематографический пуш-ин трековый кадр
✂️ Редактировать по описанию: удалить всё из видео.
Runway запускает Remove from Video: текстовое описание объектов для удаления, без ротоскопирования
📹 Быстрые, дешёвые клипы: Kling 2.5 Turbo на fal
fal дебютирует Kling 2.5 Turbo Standard по цене 0,21 доллара за 5 секунд с быстрым преобразованием изображения в видео в разрешении 720p
🧩 ComfyUI для последовательных персонажей и сцен
ComfyUI представляет рабочий процесс Gemini Flash + Image для постоянных персонажей во всех сценах
Доступ к Comfy Cloud ускоряется за счёт кодов приглашения и общей ссылки
🌍 Open 3D: прямой проход от видео к миру за секунды
Tencent открывает исходники Hunyuan World 1.1 для прямого преобразования видео и мультиизображений в 3D на одной GPU
🌀 Хитрости промптов о движении: старение, влияние, настроение
Grok Imagine prompt: мгновенная съёмка-таймлапс с ускоренным старением
Grok Imagine настроение ногтей и крупные планы на четырех новых тестах
Seedance‑1‑pro подсказка: внедренное отслеживание к напряжённому раскрытию
Комедийный гэг удара в Grok: деформация лица от удара лососем
🖼️ По-прежнему выглядит так: параметры MJ v7, футболки и srefs дочерней книги.
MJ v7 рецепт: хаос 10 с sref 1367149754 образует целостный набор 3:4
Готовый к использованию черно-белый промпт для футболки с графикой в стиле мультфильмов, готовой к печати.
Детская иллюстрация sref 984570117 передает скандинавский акварельный стиль.
Стиль архива сообщества: ссылка --sref 2813586012 приглашает рифы
🛡️ Безопасность браузера с агентной архитектурой: инъекции и планы Chrome
Взлом через инъекцию буфера обмена зафиксирован в ChatGPT Atlas; рассматривать режим агента как высокий риск
Практический контрольный список по безопасности для браузеров в стиле Atlas/Comet
Chrome 143 добавит агентские функции Gemini с корпоративными политиками при запуске
🎙️ Голосовые сессии: ElevenLabs в Google и Summit
Саммит ElevenLabs добавляет will.i.am и Ларри Джексона; регистрация открыта
ElevenLabs продемонстрирует Eleven v3 TTS на школе стартапов Google 12 ноября.
🛠️ Помощники для продакшена: OCR/Markdown и редактирование изображений
Воспроизведите хосты моделей Marker и OCR от Datalab; от $2 до $6 за 1k страниц, быстрое извлечение Markdown
Riverflow 1 Pro поступает на Runware с увеличенным временем обработки для более сложных правок изображений.
🏆 Показы и звонки: хоррор-голосования, MAX talks
Открыто голосование за конкурс Леонардо по фильмам ужасов с участием ИИ.
Сессия Adobe MAX представит три короткометражки про ИИ и разбор рабочего процесса.
🏢 Пульс отрасли: увольнения и статистика по числу пользователей
По сообщениям, Meta сокращает около 600 должностей в области ИИ; сообщается, что FAIR пострадал, среди уходящих — старший директор.
PixVerse демонстрирует масштаб: 100 млн пользователей и более $40 млн ARR, усиливает фокус на росте креаторов с мобильной первой стратегией.
Трафик Google AI Studio вырос на 1 453% за год; Gemini увеличивает долю рынка, а ChatGPT снижает свои позиции.
Claude Sonnet 4.5 возглавляет таблицу использования у Poe, обогнав Gemini 2.5 Pro и GPT‑4o
🧪 Статьи к просмотру: длинное видео, выравнивание, обучение с подкреплением на триллион шагов
MoGA разрежённое внимание продвигает генерацию видео длительностью в одну минуту с несколькими кадрами
Ring‑1T подробно описывает обучение RL размером в триллион параметров для «мыслящих» моделей
UltraGen представляет иерархическое внимание для видео высокого разрешения, готового к 4K.
Google исследует извлечение данных об выравнивании из открытых моделей с помощью эмбеддингов.