Krea Realtime 14B стримит 11 кадров в секунду на одном B200 – веса Apache‑2.0 в реальном времени

Stay in the loop

Free daily newsletter & Telegram daily report

Executive Summary

Krea открыл исходники Realtime 14B, текст‑в‑видео модель, которая реально умеет стримить, и она появляется там, где команды могут ею пользоваться. На одном NVIDIA B200 она держит 11 кадров в секунду с примерно 1 с временем до первого кадра (TTFF), а веса Apache‑2.0 находятся на Hugging Face. Эта связка — открытые веса плюс реальное интерактивное воспроизведение — выводит видеопоток из демонстрационных роликов в конвейеры.

fal запустил хостинг в день ноль с текст‑в‑видео и видео‑в‑видео конечными точками, сменой подсказок на полпути и демонстрацией в браузере; цена составляет 0,025 доллара за выводенную секунду, рассчитана на 16 кадров в секунду, что упрощает расчёт стоимости для живых сессий. Под капотом дистилляция Self‑Forcing от Krea превращает диффузионную модель Wan 2.1 в автогenerator, в то время как повторное вычисление KV‑кеша и коррекция внимания подавляют накапливание ошибок, чтобы долгие потоки оставались стабильными на одной GPU. Krea заявляет, что модель в 10× крупнее любого открытого аналога, и TTFF держится около секунды в публичных демо. Уже проходит встреча ICCV с демонстрацией вживую, 68 подтверждений участия, что является подходящей аудиторией для выявления проблем с временем выполнения и интерфейсом пользователя.

Если вы давно выбираете между Sora или Veo ради реалистичности, теперь открытые проекты получают realtime‑вариант с продакшн‑дружелюбным хостингом с первого дня.

While you're reading this, something just shipped.

New models, tools, and workflows drop daily. The creators who win are the ones who know first.

Last week: 47 releases tracked · 12 breaking changes flagged · 3 pricing drops caught

Feature Spotlight

Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме.

С открытым исходным кодом, текст‑в‑видео в реальном времени достигает 11 FPS на одном B200 с интерактивными правками подсказок и переработкой стиля, весами Apache‑2.0 на HF и конечными точками day‑0 fal — что приносит живое, длинноформатное ИИ‑видео для создателей.

История между аккаунтами сегодня: Krea открывает исходный код 14-миллиардной модели преобразования текста в видео в реальном времени с интерактивной потоковой передачей; fal выпускает эндпойнты на нулевой стадии; создатели получают демонстрации плюс встречу ICCV. В основном — ссылки на модель и рабочий процесс.

Jump to Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме. topics

🎥 Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме.

Krea открывает исходники Realtime 14B T2V на одном B200, веса под лицензией Apache-2.0 доступны прямо сейчас.

Krea выпустила открытую модель авто‑регрессивного преобразования текста в видео размером 14 млрд параметров, которая транслирует длинные видеоматериалы со скоростью 11 кадров в секунду, используя всего четыре шага на одном NVIDIA B200, заявляя, что она в 10× крупнее любого аналога с открытым исходным кодом Обсуждение с открытым исходным кодом. Данный релиз включает технический отчет и веса Apache‑2.0 на Hugging Face, со временем до первого кадра около одной секунды и поддержкой изменения подсказки по потоку посередине Технические заявления, Ссылка на веса, Репозиторий Hugging Face, Пост в блоге Krea.

Krea Realtime 14B стримит 11 кадров в секунду на одном B200 – веса Apache‑2.0 в реальном времени

Executive Summary

While you're reading this, something just shipped.

Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме.

Table of Contents

🎥 Krea Realtime 14B выходит в открытый доступ и запускается в онлайн-режиме.

Krea открывает исходники Realtime 14B T2V на одном B200, веса под лицензией Apache-2.0 доступны прямо сейчас.

fal поставляет day‑0 Krea Realtime эндпойнты с интерактивной потоковой передачей, а также живые демонстрации

За кулисами: самопринудительная дистилляция и трюки с кэшем KV позволяют генерировать длинный контент в реальном времени

Krea × fal ICCV happy hour начинается с демонстраций в реальном времени на месте

🎬 Veo 3.1: приемы управления и возможности редактирования

Veo‑3.1 получил прозвище «нанобанан» за быстрые редактирования добавления и удаления элементов

10 первых/последних кадров экспериментов Veo 3.1 показывают, как зафиксировать ключевые моменты сюжета в LTX Studio

Подсказки типа "Ингредиент" обеспечивают последовательные кадры Veo 3.1 под разными углами и в условиях множественных разрезов.

Редактирование реального видеоматериала с помощью текстовых подсказок VEO поднимает важный вопрос: какое будет разрешение после редактирования.

Veo 3.1 отлично справляется с начальной сценой в стиле видеоигры; полное предложение промпта скоро будет.

Ужасный концепт-трейлер «My Beautiful LoRA», полностью снятый на Veo 3.1

✨ Grok Imagine: один промпт, множество вариаций и настроение

Grok Imagine теперь выводит последовательности с несколькими кадрами и синхронизированным аудио из одного промпта

Шаблоны и хитрый трюк «супергерой» ускоряют моушн‑графику в Grok

Рецепт запроса: медленная 360° орбита от дня к ночи, которая точно передает композицию и настроение

Черно-белые анимации Grok вызывают восхищение за выразительный контроль над тоном.

Кейс-исследование: MJ-кадры, Grok video и музыка ElevenLabs для минимального пайплайна

Эфирные мифические и ангельские образы демонстрируют чувство Грока к трансцендентному

📽️ Производства Sora 2, подсказки и предложения платформы

Freepik выпускает гигантский пакет промптов Sora 2, охватывающий стили инфлюенсеров, киноэпохи, вещания, CCTV и натуралистные документальные стили о природе.

Higgsfield предлагает неделю «Unlimited Sora 2» со Sketch‑to‑Video, Max/Pro Max, Enhancer и Upscale Preview

Одноподсказочное рекламное объявление Sora 2 Pro со спецификациями (тайский банк), поставляется с музыкой и озвучкой, сгенерированными Sora.

Создатель отмечает ненадёжность API Sora и рассматривает перенос сборки на Veo 3.1

🎛️ Режиссура исполнения: кадры, лица, ритм

Hedra добавляет стартовые и конечные кадры, чтобы зафиксировать ваши открывающие и завершающие кадры.

OmniHuman 1.5 обеспечивает кинематографическую синхронизацию движений губ и жестов по одному фото и голосу.

Ray3 от Luma позволяет аннотировать микро‑выражения в Dream Machine

LTX Studio показывает инструменты обеспечения согласованности: позы с несколькими эталонами и движение с ключевыми кадрами для съемок продукции

Функция Ingredient в Veo 3.1 обеспечивает одинаковые углы и множественные разрезы по одному запросу.

Grok Imagine генерирует модное освещение в нескольких кадрах со звуком по одному запросу.

Создатели проводят стресс-тест управления первым и последним кадром с 10 кадрами Veo 3.1 в LTX Studio.

🧰 Плейбук по модной и продуктовой съемке в LTX Studio

LTX Studio выпускает пятишаговый гайд по съемке моды и продуктов, который обеспечивает согласованный стиль и динамику.

💸 Сохранить кредиты: предпросмотр → рабочие процессы масштабирования до 4K

PixVerse Preview Mode позволяет создавать черновик в разрешении 360p/540p, затем масштабировать до 4K и экономить до 60% кредитов

Хиггсфилд продвигает Sora 2 с Upscale Preview и промо на 200 кредитов, направленное на более дешёвые итерации

PixVerse намекает на грядущую функцию после запуска режима предпросмотра.

📊 Таблицы лидеров и мониторинг моделей

Veo 3.1 превосходит LM Arena как для преобразования текста в видео, так и для преобразования изображения в видео.

«lithiumflow» и «orionmist» появляются на LM Arena; ранний тест показывает, что они уступают GPT‑5

🎵 Компоновка музыки и SFX: профессиональное аудио в петле

Модель-маэстро Beatoven выходит на fal с музыкой 44,1 кГц и 1 млн SFX

Креаторы полагаются на встроенную музыку и озвучку Sora 2 Pro, чтобы завершать рекламу

Grok Imagine’s однопромптовые мульти‑шоты приходят с встроенным аудио

Музыка ElevenLabs появляется в озвучке и саундтреке короткометражного фильма, созданного с помощью Grok.

🏆 Звонки, стенды и демонстрации

OpenArt Music Video Awards открыты: призовой фонд свыше $50k на 27 призов, Kling AI назван золотым спонсором

Выиграйте до 1000 долларов США в кредитах fal за публикацию ваших лучших рабочих процессов Reve

Сессия по искусственному интеллекту в кинопроизводстве на Adobe MAX: Promise Studios презентует новый короткометражный фильм

«Dumb Things AI Hackathon» возвращается вместе с DigitalOcean и OpenAI — присоединяйтесь к работе над проектом.

Higgsfield’s Unlimited Sora на две недели включает вознаграждение в 200 кредитов в личные сообщения за подписку/ретвит/ответ.

PixVerse добавляет режим предпросмотра и раздачу 300 кредитов (72 часа) за ретвиты

Replicate разместит стенд на Next.js Conf в Сан-Франциско 22 октября.

Живая демонстрация Builder.io 30 октября: команды дизайна выпускают продукты с помощью ИИ без передачи задач разработчикам

🖼️ По-прежнему — рецепты в стиле и мудборды.

MJ v7 рецепт: хаос 8, 3:4 AR, sref 264564311, sw 500, stylize 500

Сложный шаблон запроса к внутреннему устройству для эффектных светящихся разрезанных кадров

Настроение классической мифологии: храмы, космические небеса и орлиные стражи

Тизеры Freakbags задают образ персонажа в неоново‑жестком стиле.

Звонок по созданию миров: редакционный портрет + фон губ в стиле поп-арт

🛠️ Помощники разработчикам для творческих программистов

Claude Code выходит в веб-версию с подагентом Explore, поддержкой навыков и переключателем мышления в VSCode

Google заигрывает идеей vibe‑кодинга в AI Studio, чтобы ускорить переход от промптов к продакшену, запуск близок.

OpenRouter хвастается доступом к варианту GPT‑5, недоступному в приложении OpenAI.

🧭 Сигналы подлинности и доверие аудитории

Студии добавляют в финальные титры оговорку «No Generative AI»

xAI задерживает Grokipedia, чтобы очистить пропаганду, сигнализируя о качественном рывке

Зрители теперь оценивают «реальность» по длительности клипа в эпоху Соры.

Создатели предупреждают: не доверяйте обзорам ИИ.

🧪 Статьи к просмотру: омни‑модальные, 3D‑правки, редактирование в масштабе

Google VISTA предлагает самоулучшающийся генератор видео, который обучается во время тестирования.

Ditto выпускает набор данных из 1 млн примеров для редактирования видео на основе инструкций и модели Editto.

NANO3D обещает редактирование 3D без обучения и без масок для ассетов и игрового контента.

OmniVinci дебютирует с открытым omni‑модальным LLM для зрения, аудио и времени, утверждая, что обошёл Qwen2.5‑Omni