Krea Realtime 14B стримит 11 кадров в секунду на одном B200 – веса Apache‑2.0 в реальном времени
Executive Summary
Krea открыл исходники Realtime 14B, текст‑в‑видео модель, которая реально умеет стримить, и она появляется там, где команды могут ею пользоваться. На одном NVIDIA B200 она держит 11 кадров в секунду с примерно 1 с временем до первого кадра (TTFF), а веса Apache‑2.0 находятся на Hugging Face. Эта связка — открытые веса плюс реальное интерактивное воспроизведение — выводит видеопоток из демонстрационных роликов в конвейеры.
fal запустил хостинг в день ноль с текст‑в‑видео и видео‑в‑видео конечными точками, сменой подсказок на полпути и демонстрацией в браузере; цена составляет 0,025 доллара за выводенную секунду, рассчитана на 16 кадров в секунду, что упрощает расчёт стоимости для живых сессий. Под капотом дистилляция Self‑Forcing от Krea превращает диффузионную модель Wan 2.1 в автогenerator, в то время как повторное вычисление KV‑кеша и коррекция внимания подавляют накапливание ошибок, чтобы долгие потоки оставались стабильными на одной GPU. Krea заявляет, что модель в 10× крупнее любого открытого аналога, и TTFF держится около секунды в публичных демо. Уже проходит встреча ICCV с демонстрацией вживую, 68 подтверждений участия, что является подходящей аудиторией для выявления проблем с временем выполнения и интерфейсом пользователя.
Если вы давно выбираете между Sora или Veo ради реалистичности, теперь открытые проекты получают realtime‑вариант с продакшн‑дружелюбным хостингом с первого дня.
Feature Spotlight
Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме.
С открытым исходным кодом, текст‑в‑видео в реальном времени достигает 11 FPS на одном B200 с интерактивными правками подсказок и переработкой стиля, весами Apache‑2.0 на HF и конечными точками day‑0 fal — что приносит живое, длинноформатное ИИ‑видео для создателей.
История между аккаунтами сегодня: Krea открывает исходный код 14-миллиардной модели преобразования текста в видео в реальном времени с интерактивной потоковой передачей; fal выпускает эндпойнты на нулевой стадии; создатели получают демонстрации плюс встречу ICCV. В основном — ссылки на модель и рабочий процесс.
Jump to Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме. topics📑 Table of Contents
🎥 Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме.
История между аккаунтами сегодня: Krea открывает исходный код 14-миллиардной модели преобразования текста в видео в реальном времени с интерактивной потоковой передачей; fal выпускает эндпойнты на нулевой стадии; создатели получают демонстрации плюс встречу ICCV. В основном — ссылки на модель и рабочий процесс.
Krea открывает исходники Realtime 14B T2V на одном B200, веса под лицензией Apache-2.0 доступны прямо сейчас.
Krea выпустила открытую модель авто‑регрессивного преобразования текста в видео размером 14 млрд параметров, которая транслирует длинные видеоматериалы со скоростью 11 кадров в секунду, используя всего четыре шага на одном NVIDIA B200, заявляя, что она в 10× крупнее любого аналога с открытым исходным кодом Обсуждение с открытым исходным кодом. Данный релиз включает технический отчет и веса Apache‑2.0 на Hugging Face, со временем до первого кадра около одной секунды и поддержкой изменения подсказки по потоку посередине Технические заявления, Ссылка на веса, Репозиторий Hugging Face, Пост в блоге Krea.
fal поставляет day‑0 Krea Realtime эндпойнты с интерактивной потоковой передачей, а также живые демонстрации
fal выпустил Krea Realtime 14B сразу доступным с поддержкой реального времени текст‑в‑видео и видео‑в‑видео конечных точек, которые принимают редактирования подсказок на полпути и переработки в реальном времени Fal model launch. Цена на размещённых конечных точках указана как $0.025 за выходную секунду (вычисляется при 16 fps), с публичными страницами моделей и браузерной демо, чтобы попробовать генерацию в потоковом режиме прямо сейчас

• Попробуйте: Страница текста в видео, Страница видео в видео, и Демонстрация в реальном времени Ссылки на демо.
За кулисами: самопринудительная дистилляция и трюки с кэшем KV позволяют генерировать длинный контент в реальном времени
Доклад Krea подробно объясняет, как Self‑Forcing преобразует диффузионную модель на базе Wan 2.1 в автокорреляционный генератор, в то время как KV Cache Recomputation и KV Cache Attention Bias снижают накопление ошибок и обеспечивают устойчивые длинные потоки на одном B200 Tech report, Krea blog post. Для создателей это объясняет скорость модели в 11 кадров в секунду, потоковое поведение с возможностью редактирования подсказки, отмеченное в запуске Model origin.
Krea × fal ICCV happy hour начинается с демонстраций в реальном времени на месте
Митап Krea × fal проходит рядом с ICCV, приглашает участников увидеть новую модель в реальном времени в действии, продолжая работу над ICCV happy hour, который задал план Meetup invite. Страница RSVP показывает 68 человек в списке гостей по мере начала мероприятия Event now, RSVP page.
🎬 Veo 3.1: приемы управления и возможности редактирования
Что нового на практике: эксперименты с первым и последним кадрами, согласованность «ингредиента» и мультирезки, редактирование добавления/удаления объектов, а также обсуждение монтажа на реальном материале. Исключена функция Krea Realtime.
Veo‑3.1 получил прозвище «нанобанан» за быстрые редактирования добавления и удаления элементов
Циркулирующее демо называет Veo‑3.1 «нанобананом видео», подчеркивая, как быстро оно может добавлять или удалять объекты на сцене с текстовым руководством — полезно для исправления последне-минутных несоответствий континуитета или для усиления эффектов в нарезках редактировать демо. Второй клип подтверждает простую, хирургически точную рабочую схему, которую хотят видеть многие монтажёры от инструментов T2V следующий клип.
10 первых/последних кадров экспериментов Veo 3.1 показывают, как зафиксировать ключевые моменты сюжета в LTX Studio
Автор опубликовал 10 лучших первых/последних кадровых прогонов с Veo 3.1 внутри LTX Studio, демонстрируя практические способы закрепить позу субъекта, освещение и траекторию камеры, чтобы ваши открывающие и закрывающие кадры оказались точно по плану поток обсуждения: эксперимент, следующий клип. Продолжая тему демо Scene Extend, этот набор превращает концепцию в повторяемую тактику планирования, которую могут копировать другие режиссеры; LTX даже выразил одобрение с помощью благодарностей ответ инструмента.)
Подсказки типа "Ингредиент" обеспечивают последовательные кадры Veo 3.1 под разными углами и в условиях множественных разрезов.
Креаторы сообщают, что рассмотрение основных элементов как «ингредиентов» в подсказке обеспечивает более устойчивую идентичность и стиль при смене ракурсов камеры, а также поддерживает несколько монтажных резов в рамках одной подсказки для более быстрой сборки правок совет по функции. Это легковесный способ поддерживать единообразие гардероба, палитры и реквизита без чрезмерного ограничения движений.
Редактирование реального видеоматериала с помощью текстовых подсказок VEO поднимает важный вопрос: какое будет разрешение после редактирования.
Автор заметил, что Google VEO добавляет режим write‑to‑edit на реальном видео — то, что предлагают коллеги вроде Pika и Runway — затем отмечает практическую проблему, которой озабочены кинематографисты: какое разрешение клипы сохраняют после редактирования creator take? Если конвейер держит HD/4K, это откроет возможности исправлений, безопасных для трансляции, без возвращения в традиционные VFX.
Veo 3.1 отлично справляется с начальной сценой в стиле видеоигры; полное предложение промпта скоро будет.
Короткое, кинематографическое вступление к игре, созданное на Veo 3.1, демонстрирует, что оно может нести стилизованные боевые эпизоды и ритм трейлеров; автор предложил поделиться точным промптом, намекая на повторно используемую отправную точку для аналогичных последовательностей тизер кат-сцены. Для студий, прототипирующих IP, это снижает барьер для тестирования тона и языка камеры на ранних этапах.
Ужасный концепт-трейлер «My Beautiful LoRA», полностью снятый на Veo 3.1
Подходит к Хэллоуину, режиссёр выпустил концепт‑тизер на Veo 3.1 о том, как ИИ восстанавливает потерянного супруга, демонстрируя диапазон модели по настроению, ритму и связности сюжета в 30–60‑секундном споте trailer post. Для режиссёров это чистый пример идеи от начала до конца, разработки внешнего вида и доводки внутри одного инструмента.
✨ Grok Imagine: один промпт, множество вариаций и настроение
Создатели продвигают Grok для многосъёмочных последовательностей с синхронизированным аудио, выразительными черно-белыми работами и кинематографическими мифическими образами. Включены советы по шаблонам и моушн-графике. Исключена функция Krea Realtime.
Grok Imagine теперь выводит последовательности с несколькими кадрами и синхронизированным аудио из одного промпта
Создатели сообщают о модели одежды MULTISHOTS с аудио и реалистичным движением по одному промпту, требуя лишь лёгкой последовательности для завершения — продолжая тему wild update, которая намекала на прирост движений/вида Feature demo. Один пользователь выбрал несколько автоматически сгенерированных кадров, обрезал тайминг и добавил простое фоновое аудио, чтобы выпустить клип Workflow note, с примером, опубликованным здесь Grok Imagine post.
Шаблоны и хитрый трюк «супергерой» ускоряют моушн‑графику в Grok
Быстрые старты набирают обороты: создатели рекомендуют шаблоны Grok Imagine как стартовые точки для сцен Templates nudge. Еще один трюк: добавьте супергероя к вашему изображению, и Grok автоматически подберёт соответствующий стиль моушн‑графики — удобно для кинетических композитов и ритма заголовков Trick tip.)
Рецепт запроса: медленная 360° орбита от дня к ночи, которая точно передает композицию и настроение
Общее указание — «медленное вращение на 360 градусов вокруг дерева, пока день превращается в ночь» — обеспечивает связное, кинематографическое движение, закреплённое за дерево‑островом, одиночной фигурой, водными отражениями и лунным финалом, иллюстрируя, как траектория камеры и временные сигналы могут повысить качество Grok‑съёмок Подсказка по промпту.
Черно-белые анимации Grok вызывают восхищение за выразительный контроль над тоном.
Монохромные клипы Grok выделяются своей эмоциональной ясностью и формированием настроения, что предполагает, что градация и контрастные априоры модели хорошо переносятся на эстетику нуара/немого кино Пример ч/б.)
Кейс-исследование: MJ-кадры, Grok video и музыка ElevenLabs для минимального пайплайна
Одно короткое видео сочетает ключевой кадр из Midjourney и Grok Imagine для динамических визуальных эффектов, с лёгкими правками в Splice/Lightroom и озвучкой/музыкой от ElevenLabs Music — демонстрируя практичный путь с использованием небольшого набора инструментов к отполированным, готовым к распространению материалам Пост о рабочем процессе.
Эфирные мифические и ангельские образы демонстрируют чувство Грока к трансцендентному
Автор отмечает способность Grok захватывать мотивы мифологии и ангельскую символику с воздушной, потусторонней атмосферой — полезно для фэнтези и духовных повествований, стремящихся к светлому, благоговейному тону Примечание к стилю.
📽️ Производства Sora 2, подсказки и предложения платформы
Sora 2 видит свежие наборы подсказок по жанрам, рекламу спецификации на один промпт и неограниченную промо‑акцию Higgsfield; один разработчик отмечает надежность API. Исключает функцию Krea Realtime.
Freepik выпускает гигантский пакет промптов Sora 2, охватывающий стили инфлюенсеров, киноэпохи, вещания, CCTV и натуралистные документальные стили о природе.
Freepik поделился большим, повторно используемым набором подсказок Sora 2, охватывающим форматы, ориентированные на создателей контента, такие как инфлюенсер‑рилсы, кампейны, образы кино 1920‑х/1950‑х годов, вечерние ток‑шоу, настройки подкастов, спортивная трансляция против кинематографического «кино» оформления, виньетки через веб‑камеру/CCTV, крупные планы природы в документальном стиле и ретро‑рекламные/бит‑пункты стримеров Prompt overview. Набор включает полностью написанные, готовые к производству подсказки для подкастов/латенайт Podcast and talk show и nature/GoPro подводные последовательности Nature and GoPro,) с дополнительными брифами для прямого эфира против кино‑баскетбольного освещения, чтобы направлять камеру, градацию и оверлеи Sports broadcast and movie.)
Higgsfield предлагает неделю «Unlimited Sora 2» со Sketch‑to‑Video, Max/Pro Max, Enhancer и Upscale Preview
Higgsfield запускает ограниченное по времени обновление, которое разблокирует неограниченное использование Sora 2 — включая Sketch‑to‑Video, Max, Pro Max, Enhancer и Upscale Preview — с бонусом в 200 бесплатных кредитов за подписку + ретвит + ответ в течение следующих 8 часов; предложение заканчивается в понедельник UTC Offer details. лендинг-пейдж подчеркивает рабочие процессы Sora 2 и библиотеки предустановок для создателей, рассматривающих обновление Upgrade post, с деталями функций на сайте Higgsfield site.
Одноподсказочное рекламное объявление Sora 2 Pro со спецификациями (тайский банк), поставляется с музыкой и озвучкой, сгенерированными Sora.
Автор создал рекламный ролик банковского стиля в тайском духе в Sora 2 Pro, используя единственный промпт, полагаясь на Sora и для музыки, и для озвучивания; после этого были сделаны лишь незначительные корректировки пользовательского интерфейса смартфона через Nano Banana в Photoshop Creator result . Это следует за Однопромптовый короткометражный фильм, который показал фильм в формате одного промпта; новая работа подтверждает жизнеспособность end-to-end для коммерческого типа спотов при минимальной постобработке.
Создатель отмечает ненадёжность API Sora и рассматривает перенос сборки на Veo 3.1
Разработчик, работающий на Interactive Sora, утверждает, что API Sora была «чрезвычайно ненадёжной», отмечая, что проект могут перевести на Veo 3.1 — оперативный сигнал для команд, планирующих запуски с ограниченным сроком или работу с клиентами Dev comment. Для кинематографистов и дизайнеров, работающих с ИИ, это напоминание о необходимости закладывать резервные варианты, планировать повторную перекодировку и тесты паритета моделей при определении объёмов поставляемых результатов.
🎛️ Режиссура исполнения: кадры, лица, ритм
Инструменты для точного контроля: кадры Hedra начала/конца для обрамления съемок, Luma Ray3 для подсказок мимики и OmniHuman 1.5 для выступлений, синхронизированных с музыкой. За исключением функции Krea Realtime.
Hedra добавляет стартовые и конечные кадры, чтобы зафиксировать ваши открывающие и завершающие кадры.
Hedra представила Start/End Frames, предоставляющие директорам точный контроль над первыми и последними кадрами кадра для более чистых драматических пауз и бесшовных точек монтажа Feature intro. Этот bookend-контроль помогает поддерживать визуальное намерение на протяжении нарезок и последовательностей без дополнительной очистки.
OmniHuman 1.5 обеспечивает кинематографическую синхронизацию движений губ и жестов по одному фото и голосу.
BytePlus’ OmniHuman 1.5 обещает кинематографическую синхронизацию губ, естественные жесты и выступления, точные по ритму, на основе всего лишь одного изображения и аудиоклипа, с мультиперсонажными сценами и управлением через текст Обзор функций.). Он также поддерживает движение, синхронизированное с музыкой, и плавные, как в кино, движения камеры — мощные инструменты для влогов, бренд‑историй и коротких драм.
Ray3 от Luma позволяет аннотировать микро‑выражения в Dream Machine
Ray3 внедряет визуальные аннотации для тонкого направления лицевых движений — поднять бровь, изогнуть улыбку, сменить взгляд — чтобы создатели могли точно управлять эмоциями внутри Dream Machine Feature brief. Это актерский стиль направления для AI‑персонажей, полезный для непрерывности и эмоционального ритма.
LTX Studio показывает инструменты обеспечения согласованности: позы с несколькими эталонами и движение с ключевыми кадрами для съемок продукции
Новый пошаговый обзор LTX Studio демонстрирует, как поддерживать стиль на разных ракурсах с использованием Multi‑reference для изменений позы и кадрирования, а затем добавлять точное движение с помощью Keyframes (например, вращение продуктов на съемке, целевые движения камеры) Обсуждение рабочего процесса, Примеры поз, Управление движением. Полные сведения о платформе на сайте страница продукта.
}
Функция Ingredient в Veo 3.1 обеспечивает одинаковые углы и множественные разрезы по одному запросу.
Создатель выделяет функцию Ingredient Veo 3.1 для последовательного рендера персонажей/предметов под разными углами и для генерации нескольких кадров в рамках одного запроса — полезно для охвата и ритма редактирования без повторной прокрутки сцен Демонстрация от создателя.
Grok Imagine генерирует модное освещение в нескольких кадрах со звуком по одному запросу.
Создатели сообщают, что один промпт теперь дает несколько динамичных кадров модных моделей с синхронизированным аудио, требующих лишь легкой доработки последовательности и тайминга для завершения Single prompt demo, Sequencing note. Посмотрите пример набора через публичный пост post page.
Создатели проводят стресс-тест управления первым и последним кадром с 10 кадрами Veo 3.1 в LTX Studio.
Поток из десяти клипов исследует, как направление первого/последнего кадра формирует преемственность и полировку проектов Veo 3.1 в LTX Studio Ten tests, First clip, following up on Start‑end frames introduced for smoother 8‑second story beats. Тесты показывают, как зафиксированные концевые кадры уточняют переходы и сохраняют визуальное намерение на протяжении редактирования.
🧰 Плейбук по модной и продуктовой съемке в LTX Studio
Пятичастный рабочий процесс LTX демонстрирует единый стиль во всех позах и под разными углами, с подсказками, несколькими референсами и движением с ключевыми кадрами. Исключает функцию Krea Realtime.
LTX Studio выпускает пятишаговый гайд по съемке моды и продуктов, который обеспечивает согласованный стиль и динамику.
LTX Studio опубликовала пятиэтапный рабочий процесс по проведению целой съемки моды/продукта от начала до конца внутри приложения, сохраняя единый стиль на протяжении поз, ракурсов и форматов Workflow thread. Гайд задаёт точный редакторский образец, затем использует Multi‑reference для смены поз и Keyframes + Nano Banana для добавления контролируемого движения.

- Начните с детализированного редакторского промпта портрета (солнцезащитные очки + сумка), чтобы зафиксировать образ, освещение и палитру Editorial prompt.)
- Используйте Multi‑reference для изменения поз, выражений и композиции, при этом сохраняя стиль; примеры охватывают крупный план, средний, широкий, верхний и нижний ракурсы Multi‑reference examples.)
- Добавляйте движение с помощью Keyframes и Nano Banana для вращающихся кадров продукта и точных движений камеры, сохраняя выравнивание Keyframes note.)
- Ознакомьтесь с итогом пятого шага и призывом к действию по проведению кампаний в LTX Studio Playbook finale, с деталями продукта здесь LTX Studio site.
💸 Сохранить кредиты: предпросмотр → рабочие процессы масштабирования до 4K
Экономичные советы по видеопроизводству появляются благодаря новому режиму предварительного просмотра PixVerse и тизерам сообщества. Функция Krea Realtime не входит.
PixVerse Preview Mode позволяет создавать черновик в разрешении 360p/540p, затем масштабировать до 4K и экономить до 60% кредитов
PixVerse выпустил Preview Mode в вебе, чтобы вы могли генерировать в 360p или 540p, выбрать лучшие кадры, затем апскейлить до 4K — заявляя о экономии до 60% кредитов для итерационно‑нагруженных рабочих процессов Preview mode post. A 72‑часовая промо‑акция также предоставляет 300 кредитов, если вы ретвитнете объявление, подталкивая команды к тестированию черновиков в низком разрешении перед финальными апскейлами Preview mode post.
Хиггсфилд продвигает Sora 2 с Upscale Preview и промо на 200 кредитов, направленное на более дешёвые итерации
Higgsfield продвигает недельное предложение по апгрейду “Unlimited Sora 2”, включающее сборку Sketch‑to‑Video, Max/Pro Max, Enhancer и поток Upscale Preview, который побуждает к черновикам перед финальными качественными запусками; после + RT + ответ в течение 8 часов начисляются 200 бесплатных кредитов, предложение заканчивается в понедельник UTC Upgrade week promo, Upgrade site link, и полные детали плана на официальной странице Higgsfield site.
PixVerse намекает на грядущую функцию после запуска режима предпросмотра.
Загадочный клип «Что это за…?!» намекает на то, что ещё одна возможность может появиться в ближайшее время, следом за экономией расходов в Preview Mode — порождая спекуляции о более ориентированных на итерации инструментах для создателей видео Teaser clip.
📊 Таблицы лидеров и мониторинг моделей
Свежие сигналы лидерборда и идентификаторы моделей для отслеживания; сегодня основное внимание уделяется верхней позиции Veo 3.1 и кодовым названиям Gemini на LMArena. Функция Krea Realtime не включена.
Veo 3.1 превосходит LM Arena как для преобразования текста в видео, так и для преобразования изображения в видео.
У Google Veo 3.1 теперь лидирует в LM Arena на двух досках, причём как стандартная, так и быстрая аудиоверсии занимают верхние места. В сообщении также утверждается, что Veo 3.1 занимает первое место для image-to-video помимо text-to-video Leaderboard post.

- Text‑to‑video показывает G veo‑3.1‑audio на 1404 (1 305 голосов) и G veo‑3.1‑fast‑audio на 1395 (1 334 голосов), согласно отображаемой таблице Leaderboard post.
«lithiumflow» и «orionmist» появляются на LM Arena; ранний тест показывает, что они уступают GPT‑5
Общий вывод по оценке говорит, что новый кандидат Gemini 3 не обгоняет GPT‑5 по одному бенчмарку Примечание к бенчмарку, пока LM Arena показывает две кодовые записи—«lithiumflow» и «orionmist»—с привязкой к поиску Google, продолжая тему Pоявление кодовых имён. Некоторые наблюдатели считают, что эти идентификаторы на самом деле могут быть моделями Flash, а не Pro Мониторинг моделей, Обсуждение спекуляций, Подробнее.)

🎵 Компоновка музыки и SFX: профессиональное аудио в петле
Генерация музыки и звуковых эффектов становится лучше благодаря модели Beatoven Maestro от fal; авторы также упоминают ElevenLabs Music в готовых шортах. Исключает функцию Krea Realtime.
Модель-маэстро Beatoven выходит на fal с музыкой 44,1 кГц и 1 млн SFX
fal is now hosting Beatoven’s new “maestro” model for high‑fidelity music and sound effects, bringing 44.1kHz pro audio, up to 2.5‑minute tracks, and the option to generate isolated stems or full mixes Model drop. Following up on Suno v5 credit where a creator used Suno to score a short, this adds another production‑ready scoring option trained on 3M+ licensed tracks and 1M SFX to keep projects fully legal and shippable Beatoven site, SFX mention.}

- Формат и длительность: профессиональное аудио 44.1kHz, до 2.5 минут; вывод в виде stems или полного микса Model drop.
- Обучение и охват: более 3 млн лицензированных треков плюс 1 млн звуковых эффектов для широкого охвата жанров и точных SFX‑сигналов Model drop, SFX mention.
Креаторы полагаются на встроенную музыку и озвучку Sora 2 Pro, чтобы завершать рекламу
Рекламный спецпроект банковской тематики в тайском стиле был создан с помощью Sora 2 Pro, который обрабатывает и музыкальное сопровождение, и озвучку напрямую из текста в видео; автор после этого добавил лишь тонкие звуковые эффекты и незначительные изменения в пользовательском интерфейсе Spec ad workflow. Для небольших команд это объединяет музыкальное сопровождение и озвучивание в один проход рендеринга, сокращая сроки для социальных роликов и спек-работ.
Grok Imagine’s однопромптовые мульти‑шоты приходят с встроенным аудио
Grok Imagine теперь может выводить последовательности с несколькими кадрами, которые уже содержат аудио, позволяя создателям выбрать любимые кадры, расположить их по порядку и добавить один фоновый трек для завершения Feature demo, Post example. Это сокращает слой постобработки для быстрых материалов моды, продукции или настроения, где достаточно «сырых» аудио, чтобы передать тон.
Музыка ElevenLabs появляется в озвучке и саундтреке короткометражного фильма, созданного с помощью Grok.
Автор, которому приписали ElevenLabs Music за озвучку и саундтрек к видео Grok Imagine, дополняет лаконичную цепочку инструментов: Midjourney для образов, Grok для движения и простые правки в Splice и Lightroom Workflow credit. The takeaway for filmmakers and designers: turnkey VO+music can now sit inline with your T2V pipeline, reducing external audio sessions.
🏆 Звонки, стенды и демонстрации
Возможности для творческих деятелей: награды за музыкальные видеоклипы, вознаграждения за кредиты, стенды на конференциях и MAX-сессии. Исключается функция Krea Realtime/встреча ICCV (рассматривается как часть функции).
OpenArt Music Video Awards открыты: призовой фонд свыше $50k на 27 призов, Kling AI назван золотым спонсором
Подача заявок открыта для Music Video Awards OpenArt, предлагающего свыше $50,000 в 27 категориях, при этом Kling AI выступает в роли Золотого спонсора Sponsor announcement, program page. Заявки уже идут — одна из них даже стала темой мероприятия, что является сильным сигналом импульса, если вы рассматриваете подачу Theme song entry, Submission invite.
Выиграйте до 1000 долларов США в кредитах fal за публикацию ваших лучших рабочих процессов Reve
fal предоставляет кредиты на сумму до $1,000 за лучшие генерации изображений Reve и рабочие процессы, размещенные на r/fal — простой способ снизить производственные расходы, демонстрируя ваш процесс Contest call.
Сессия по искусственному интеллекту в кинопроизводстве на Adobe MAX: Promise Studios презентует новый короткометражный фильм
Promise Studios представит новый короткометражный фильм и разберёт рабочий процесс повествования, усиленный ИИ, на сессии CP6814, «ИИ в кинопроизводстве: взгляд за кулисами», вместе с Уэсом Хопкинсом из Adobe Анонс сессии.
}
«Dumb Things AI Hackathon» возвращается вместе с DigitalOcean и OpenAI — присоединяйтесь к работе над проектом.
Replicate возвращает свой хакатон сообщества совместно с DigitalOcean и OpenAI, приглашая создателей создавать по-настоящему удивительно необычные AI-проекты — хорошая видимость и быстрое прототипирование для творческих команд Hackathon invite.
Higgsfield’s Unlimited Sora на две недели включает вознаграждение в 200 кредитов в личные сообщения за подписку/ретвит/ответ.
Higgsfield запускает ограниченное по времени обновление Unlimited Sora 2 — охватывающее Sketch‑to‑Video, Max/Pro Max, Enhancer и Upscale Preview — а также 200 бесплатных кредитов через DM, если вы подпишетесь, ретвитнете и ответите в течение следующих 8 часов Unlimited Sora week, страница продукта.
PixVerse добавляет режим предпросмотра и раздачу 300 кредитов (72 часа) за ретвиты
Теперь можно генерировать в 360p/540p, затем увеличивать качество до 4K, чтобы сэкономить до 60% кредитов; PixVerse также предоставляет 300 кредитов пользователям, которые ретвитнут в течение 72 часов Промо кредита.
Replicate разместит стенд на Next.js Conf в Сан-Франциско 22 октября.
Создатели в Сан-Франциско могут заглянуть к стенду Replicate на конференции Next.js Conf в эту среду, чтобы обменяться идеями, продемонстрировать работу и пообщаться с командой Booth invite.
Живая демонстрация Builder.io 30 октября: команды дизайна выпускают продукты с помощью ИИ без передачи задач разработчикам
Зарегистрируйтесь на живую сессию Builder.io о том, как команды дизайнеров создают прототипы и выпускают продукты с помощью ИИ (Fusion, Visual Copilot), нацеленная на сокращение передачи между командами разработки и ускорение поставки Event signup, webinar signup.
🖼️ По-прежнему — рецепты в стиле и мудборды.
Пакеты подсказок и эталонные образы для статичных кадров: сложная механика, параметры MJ v7, классика‑миф и неон‑грита для построения мира. Исключает функцию Krea Realtime.
MJ v7 рецепт: хаос 8, 3:4 AR, sref 264564311, sw 500, stylize 500
Свежий набор параметров Midjourney v7 создает цельный коллаж в стиле аниме — полезный для карточек персонажей и образов сеттинга — в продолжение к MJ v7 recipe, который исследовал призматический эффект преломления. Общие параметры: “--chaos 8 --ar 3:4 --sref 264564311 --sw 500 --stylize 500,” примеры результатов охватывают домашних животных, велосипеды и моменты с едой Params and examples.

Сложный шаблон запроса к внутреннему устройству для эффектных светящихся разрезанных кадров
Azed делится гибким промптом для статических изображений, который заменяет предмет и две цветовые подсветки, чтобы показать шестерёнки, прецизионные компоненты и кинематографическое освещение — отлично подходит для мотивов яйца, сердца, бабочки или черепа детали промпута.

- Структура: “Механический [subject] с полой, скелетной структурой… Сияющий [color1] и [color2] свет исходит изнутри… ровный серый фон, кинематографическое освещение, высокая реалистичность, рендер octane, симметричная композиция” детали промпута.
Настроение классической мифологии: храмы, космические небеса и орлиные стражи
Леонардо подчеркивает «отголоски времени», набор мифико‑классических кадров — храмы у бурных морей, планетарные небеса и колоссальный орёл над городом на склоне горы — и служит палитрой для историко‑фэнтезийного миростроительства Mythic stills.

- Визуальные сигналы для подъёма: колоннада архитектуры, вихревые облака, холмы, усеянные кипарисами, и тёплые и холодные контрасты цветов для эпического масштаба Mythic stills.
Тизеры Freakbags задают образ персонажа в неоново‑жестком стиле.
«Freakbags are coming» прибивает образ с портретом в стиле creature‑couture — монстр-маска, плюшевое пальто, желтый чемодан, набитый деньгами — сигнализируя дерзкий неоновый стиль гранжа для карточек персонажей и настроения бренда Teaser image. Второй кадр накладывает синий глитч-портрет на запустевшую архитектуру для дистопического варианта Follow‑up shot.

Звонок по созданию миров: редакционный портрет + фон губ в стиле поп-арт
Подобранная редакционная настройка — седоволосая фигура в бархате перед мурелем поп‑арт губ и полками библиотеки — приглашает нескольких создателей поиграть в одном и том же мире, предлагая готовую грамматику сцены для последовательных кадров Worldbuilding prompt.

- Полезные ориентиры: мрачные бархатные фактуры, насыщенная точка фокуса мурела, реквизит в духе музейного кабинета для подсказок сюжета Worldbuilding prompt.
🛠️ Помощники разработчикам для творческих программистов
Помощники по кодированию и UX платформ, нацеленные на ускорение творческих конвейеров: Claude Code в вебе и предстоящий vibe‑coding в Google AI Studio. Исключает функцию Krea Realtime.
Claude Code выходит в веб-версию с подагентом Explore, поддержкой навыков и переключателем мышления в VSCode
Anthropic запустила Claude Code в интернете, позволяя делегировать задачи по кодированию без открытия терминала Web launch note. The latest release log also lists Haiku 4.5 support, an Explore subagent, Claude Skills integration, Interactive Questions, a VSCode "thinking" toggle, auto‑background bash commands, and enterprise MCP allowlisting Release log.

For creative pipelines, this reduces context switching across CLI, editor, and browser, and adds safer enterprise hooks via MCP.
Google заигрывает идеей vibe‑кодинга в AI Studio, чтобы ускорить переход от промптов к продакшену, запуск близок.
Логан Килпатрик из Google говорит, что «завтра» команда AI Studio представит совершенно новый опыт вайб‑кодирования, чтобы ускорить переход от запроса к продакшену с Gemini, нацеленный на то, чтобы создание приложений было в 100 раз проще, и к ближайшим двум месяцам будет ещё больше Teaser thread, после переосмысления ключей API.

Если всё получится как обещано, креативные разработчики смогут перейти от идеи к рабочим каркасам и интеграциям без громоздкого boilerplate‑кода.
OpenRouter хвастается доступом к варианту GPT‑5, недоступному в приложении OpenAI.
Автор утверждает, что OpenRouter предоставляет вариант GPT‑5, который даже не доступен через собственное приложение OpenAI, предлагая маршрутизатор как место, где можно первым получить доступ к моделям лучшего класса @mattshumer claim. Для творческих кодеров это может означать более раннее практическое время для прототипирования агентов, генерации кода и мультимодальных инструментов между поставщиками.
🧭 Сигналы подлинности и доверие аудитории
Культурные сигналы вокруг раскрытия информации об ИИ и доверия: фильмы, помечающие «нет генеративного ИИ» и создатели, оценивающие «реальность» видео по длительности. Исключение для функции Krea Realtime.
Студии добавляют в финальные титры оговорку «No Generative AI»
Распространённая карта завершающих титров явно заявляет: «В этом фильме не использовался генеративный ИИ», что сигнализирует о новой тактике раскрытия информации, призванной успокоить аудиторию и профсоюзы. Ожидайте, что больше проектов будут внедрять аналогичные теги в качестве маркетинговых и сигнальных признаков соблюдения на фоне скептицизма к ИИ Замечание по финальным титрам.

xAI задерживает Grokipedia, чтобы очистить пропаганду, сигнализируя о качественном рывке
xAI отложила Grokipedia v0.1 на конец недели, чтобы «очистить пропаганду», этап предрелизной курирования, направленный на повышение доверия к продукту коллективного знания Обновление запуска. Для рассказчиков и преподавателей решения модерации на уровне платформы напрямую формируют доверие аудитории к контексту, суммируемому ИИ.
Зрители теперь оценивают «реальность» по длительности клипа в эпоху Соры.
Создатель говорит, что теперь проверяет продолжительность — если видео длится более примерно 12 секунд, оно «могло бы быть реальным», иначе предполагают генерацию в стиле Sora — фиксируя народную эвристику подлинности в коротком формате медиа Heuristic post. Для режиссеров и брендов включение более длинных непрерывных дублей или BTS‑доказательства может стать частью сигналов доверия.
Создатели предупреждают: не доверяйте обзорам ИИ.
Публичное PSA от ведущего застройщика призывает пользователей не доверять автоматическим обзорам ИИ, отражая существующие проблемы с галлюцинациями и поверхностным синтезом Creator PSA. Для творческих исследований и разработки сюжета, это подчеркивает необходимость ссылаться на источники, перепроверять факты и показывать источники в кадре или в подписях.
🧪 Статьи к просмотру: омни‑модальные, 3D‑правки, редактирование в масштабе
В основном — исследовательские публикации, относящиеся к креативному ИИ: омни‑модальные LLM, самоулучшающиеся видеагенты, 3D‑редакции без обучения, объединённые модели генерации и редактирования и крупные синтетические наборы данных для редактирования.
Google VISTA предлагает самоулучшающийся генератор видео, который обучается во время тестирования.
Google представляет VISTA, агент генерации видео с «самоулучшением во время тестирования», который адаптируется во время вывода — обещает более устойчивые крупные планы и меньше дрейф-артефактов для рассказчиков paper thread. • Для творческих людей это может означать более согласованное движение и стиль на протяжении расширенных последовательностей без повторного обучения.
Ditto выпускает набор данных из 1 млн примеров для редактирования видео на основе инструкций и модели Editto.
Ditto представляет Ditto‑1M, набор из миллиона примеров для синтетических данных по инструкциям к редактированию видео, а также модель Editto с временным усилителем для более высокой согласованности — нацелена на стандартизацию редактирования на основе текста в масштабе поток набора данных, с подробностями в статье страница статьи.
NANO3D обещает редактирование 3D без обучения и без масок для ассетов и игрового контента.
NANO3D очерчивает связный, безмасочный метод редактирования 3D, который не требует дополнительного обучения, нацеленный на быструю отдачу для реквизита, персонажей и окружения в играх и VFX заметка к статье. • процесс без обучения может сократить время и стоимость итераций при доработке 3D‑look dev.
OmniVinci дебютирует с открытым omni‑модальным LLM для зрения, аудио и времени, утверждая, что обошёл Qwen2.5‑Omni
OmniVinci представляет открытую омни‑модальную модель понимания с архитектурными и временными улучшениями, которая, как сообщается, превосходит Qwen2.5‑Omni, нацеленную на более богатое аудиовизуальное рассуждение для творческих задач краткое содержание статьи.
BLIP3o‑NEXT объединяет генерацию изображений на основе текста и редактирование изображений через стек AR+диффузии.
BLIP3o‑NEXT предлагает единую модель для рабочих процессов создания и редактирования, сочетая авторегрессивные и диффузионные подходы, чтобы повысить реализм, сохраняя управляемость редактирования — полезно арт-директорам, которым нужен один набор инструментов как для новых кадров, так и для исправлений model overview.
☁️ Цепная реакция сбоя AWS для создателей контента
Крупный инцидент AWS выводит из строя несколько сервисов; несколько AI-приложений сообщают о перебоях и последующем восстановлении. Следите за устойчивостью инфраструктуры в проливке релизов и доставок.
Перебой в работе AWS US‑EAST‑1 нарушает работу инструментов искусственного интеллекта; среди затронутых сервисов — Perplexity и Ring.
Крупный инцидент AWS в us‑east‑1 вызвал широкомасштабные простои и задержки в приложениях, на которые полагаются создатели. Perplexity признала проблемы в сервисе, а наблюдатели зафиксировали сбои камер Ring, что сигнализирует о широком инфраструктурном событии, которое, вероятно, повлияет на рабочие процессы в области ИИ и доставку медиа. Perplexity down note

- Downdetector зафиксировал резкий скачок, причем большинство сообщений связано с us‑east‑1 (74%), далее us‑west‑1 (17%) и EC2 (9%), что указывает на региональный охват и охват по сервисам Perplexity down note.
- Создатели сообщили о «множествах сервисов» офлайн, в то время как сбои Ring подчёркивали масштаб, выходящий за рамки одной вертикали Outage comment, Ring outage note.)
- Для контекстного обзора воздействия на потребительские и творческие приложения (Fortnite, Alexa, Snapchat) смотрите подборку инцидентов The Verge report.)
Apob AI делает паузу во время сбоя AWS, затем возвращает системы в онлайн-режим и предлагает компенсацию.
Apob AI временно приостановил публикацию виртуальных инфлюенсеров во время сбоя AWS, пообещав компенсацию за пропущенные автоматизации, и позже подтвердил, что все системы снова работают. Создатели контента могут возобновить запланированные посты и рендеры ReVideo. Уведомление об остановке Apob, Системы снова работают
[изображение:https://pbs.twimg.com/media/G3tz3CEWQAAOLOP.png|пик отключения Ring]
Для более широкого контекстa инцидента и затронутых платформ помимо инструментов для создателей, смотрите освещение сбоя сообщение The Verge и проверьте статус учетной записи на панели управления Apob главная Apob.
Pictory сообщает об остановке сервиса из-за сбоя AWS.
Pictory разместил обновление статуса, в котором объясняется, что текущие простои вызваны глобальным сбоем AWS, и команда работает над восстановлением функциональности. Создатели, использующие его новые инструменты генерации изображений и видео, должны ожидать временные перебои и повторные попытки. Pictory status, Pictory app

Ожидайте задержки в очереди, неудачные рендеры и сбои вебхуков до стабилизации AWS; повторный запуск неудачных задач должен быть успешным после восстановления.