Google Veo 3.1 поставляет встроенное аудио и управление кадрами — клипы продолжительностью 4–8 секунд.

Executive Summary

Google’s Veo 3.1 наконец‑то переходит от статуса «непосредственно» к живому режиму, и это обновление управления, которое режиссеры действительно хотят: нативный звук, контроль первого/последнего кадра, связь «ссылка на видео» и расширение сцены. Вы можете выбрать Fast или Quality в Flow прямо сейчас и генерировать клипы длительностью 4–8 секунд с включённым «Beta Audio». После вчерашнего предпросмотра конечных точек, который мы отмечали, развёртывание достаточно широкое, чтобы иметь значение в реальных рабочих процессах, а не только в демо.

Партнёры на Day‑0 пришли быстро. fal показал текст→видео, изображение→видео, и интерполяцию первого/последнего кадра с нативным диалогом, а добавил кредиты по 20 долларов для первых 500 регистраций. Replicate добавил 3.1 и 3.1 Fast с более строгим соблюдением подсказок, а также ссылочные изображения и контроль последнего кадра, в то время как Freepik предлагает неограниченные генерации до воскресенья для годовой Premium+/Pro и пониженной цене Pro/Max 75% для Krea. Lovart открыл бесплатную пробную на период до 20 октября, ComfyUI выпустил API‑ноды, приложение Veo 3.1 Fast Gradio вышло на Hugging Face, и разработчики уже видят конечные точки Veo внутри Gemini API.

Ранние тесты создателей подтверждают идею: ссылки фиксируют идентичность и окружение, диалог звучит более естественно, а расширение сцены избегает обычных приемов кроссфейда. Некоторые все ещё оценивают общую достоверность ниже Sora 2, но поверхность управления и доступность «из коробки» на разных платформах выглядят как настоящий прорыв.

Feature Spotlight

Veo 3.1 повсюду: управление, аудио, расширения

Veo 3.1 выходит на Flow, fal, Replicate, Freepik, Leonardo, Krea, Lovart и ComfyUI — приносит встроенное аудио, управление первым и последним кадрами, ссылки на источники и расширения в повседневные рабочие процессы креаторов.

Сегодняшняя история кросс‑аккаунтов — Google Veo 3.1 выходит на платформах создателей с нативным звуком, управлением первым и последним кадром, ссылкой на видео и расширением сцены. Несколько ведущих добавили доступ, промо‑материалы и API для кинематографистов.

Jump to Veo 3.1 повсюду: управление, аудио, расширения topics

📑 Table of Contents

🎬 Veo 3.1 повсюду: управление, аудио, расширения

Сегодняшняя история кросс‑аккаунтов — Google Veo 3.1 выходит на платформах создателей с нативным звуком, управлением первым и последним кадром, ссылкой на видео и расширением сцены. Несколько ведущих добавили доступ, промо‑материалы и API для кинематографистов.

Higgsfield интегрирует Veo 3.1 с нативным 1080p, Draw‑to‑Video, Multi‑Shot и Director Controls

Higgsfield включил Veo 3.1 с неограниченным количеством генераций до понедельника и поверх него наложил свой собственный набор инструментов контроля — Director Controls, Draw‑to‑Video, Multi‑Shot — и нативный 1080p с интерполяцией между ключевыми кадрами. Higgsfield launch 1080p note

Подача идеи: за пределами базового Veo эти инструменты продвигают планирование съемок и постоянство к использованию в производстве.

Krea добавляет Veo 3.1 с ссылками на изображения, интерполяцией и улучшенным звуком — 75% скидка для Pro/Max

Krea интегрировала Veo 3.1 с опорными изображениями, интерполяцией кадров и усовершенствованным аудио, и соединила запуск с 75%-ной скидкой для подписчиков Pro и Max. Krea announcement)

Это даёт пользователям Krea более доступный способ протестировать процессы многокадровой непрерывности и согласованности персонажей уже в первый день.

Lovart запускает бесплатную пробную версию Veo 3.1 до 20 октября с неограниченным количеством стандартных генераций.

Lovart включил бесплатную пробную версию Veo 3.1 до 20 октября; переход на годовую Pro/Ultimate к 23 октября разблокирует месяц неограниченных Standard Veo 3.1 & Sora 2, а также 10 дневных High‑Spec Veo 3.1 и 10 Sora 2 Pro видео. Free trial info

The push targets commercial creators who need both rapid ideation and high‑spec renders in one workflow.

Runware добавляет Veo 3.1 и Fast в день 0 с точностью R2V и первыми/последними кадрами

Runware включает Veo 3.1 и Fast с реалистичным движением, синхронизированным аудио, прецизией соответствия видеоматериалу и управлением как первого, так и последнего кадра для более плавных переходов; попробуйте это в их хабе моделей. Запуск Runware Страница моделей)

Карточка запуска Runware

Интеграция нацелена на готовые к API‑уровню производственные рабочие процессы, в которых важны идентификация и соблюдение сцены.

Veo 3.1 Fast выходит на Hugging Face в виде приложения Gradio

Общественное приложение Gradio для Veo 3.1 Fast размещено на Hugging Face и предлагает быстрые пробы Text→Video и Image→Video в браузере (мобильная ссылка предоставлена для удобства). HF app Gradio space

Кредиты и промо‑акции на день старта расширяют доступ к Veo 3.1 для тестирования

Несколько платформ подняли ставки на день запуска кредитами и скидками: код fal’s “veo3.1” ($20 для первых 500), Freepik’s неограниченный доступ для годовых планов, и 75% скидка от Krea для пользователей Pro/Max. Credit code Unlimited details Krea announcement

Ожидается волна сравнительных тестов на согласованность идентичности, плавность движения и синхронизацию аудио в результате.

Создатели подтверждают ссылки Veo 3.1 → реалистичность видео и диалогов в ранних тестах

Практические запуски показывают, что Veo 3.1 точно повторяет эталонные изображения по внешнему виду и окружению, с аудио, соответствующим акустике сцены; подача диалога и жесты выглядят естественнее, чем в предыдущих версиях. Посмотрите тест галерейной беседы с двумя эталонами и номером стенда. Reference example Stand‑up test

Reference art pair

Не всем это нравится — некоторые оценивают общее качество ниже Sora 2 — но большинство соглашается, что новые элементы управления и инструменты (extend, первый/последний кадр) являются сильными шагами вперед. Critical take First/last test

Ссылка на видео — ключевой элемент управления идентичностью и стилем в этом цикле.

У разных хостов опорные изображения (персонажи, логотипы, стили) являются наиболее используемым средством контроля — закрепляя идентичность, в то время как действие и камера эволюционируют. Replicate и fal обе освещают рабочий процесс, а создатели делятся примерами строгого соблюдения. Анонс размещения Обзор конечной точки

Ожидаются более глубокие интеграции от приложений-партнёров (например, идентификация HeyGen), чтобы усилить это преимущество. Идентификация HeyGen)

Hedra выпускает Veo 3.1 для фотореалистичного ИИ-видео в любой воображаемой сцене

Hedra объявила о поддержке Veo 3.1, позиционируя его как новый стандарт фотореализма благодаря расширенным возможностям управления и точности модели. Hedra announcement

Hedra users can now combine Veo’s reference and framing controls with Hedra’s creative UX for fast, cinematic renders.

Мобильный интерфейс фиксирует параметры Veo 3.1: Быстрый/Качество в Flow

Дополнительные скриншоты от создателей показывают Veo 3.1, размещённый наряду с устаревшими моделями Veo 2/3, с тегами «Beta Audio» и руководством по бюджету — полезно для команд, планирующих запуски на скорости против качества. Flow model picker

Это отражает веб-развертывание и подчёркивает стремление Google сделать новые элементы управления Veo доступными на каждой поверхности. Web picker shot


🌦️ Приложения Runway для VFX с одним кликом продолжают расширяться.

Runway выпускает новую партию приложений, сфокусированных на VFX — погоде, фонах, времени суток и повторном освещении — чтобы редакторы могли преобразовывать отснятый материал простым языком. Это следует за дебютом приложений вчера, но добавляет новые, конкретные инструменты.

Runway удаляет данные о погоде, фоновую картинку, время суток и приложения для повторной подсветки

Runway расширяет свои новые Apps набором VFX — Change Weather, Change Background, Change Time of Day и Relight Scene — чтобы редакторы могли преобразовывать отснятый материал одним промптом Release thread. Следуя за Web rollout, который представил Apps, эти инструменты доступны в вебе с страницами «get started» чтобы попробовать сейчас Apps available.

  • Change Weather: Сделайте солнечный день пасмурным или принесите проливной дождь одним указанием Release thread.
  • Change Background: Перемещайте объекты в новые сцены без ротоскопирования или масок App page.
  • Change Time of Day: Превратите день в ночь или настройте магический час по тексту App page.
  • Relight Scene: Настройте настроение и направление освещения с помощью перенастраиваемого подсветки по запросу App page.

✨ Grok Imagine: анимационные трюки и стили

Создатели обращаются к Grok для стилизованной анимации: стартовые кадры на основе коллажей, игривые утилиты и кадры, задаваемые настроением. Threads демонстрируют приверженность к референсам, аниме‑образам и быстрым атмосферным подсказкам.

Коллаж‑хак показывает строгое соблюдение идентичности Grok по сравнению с Veo 3.1

Создатели сообщают, что при использовании одного стартового кадра коллажа Grok Imagine удерживает персонажей и окружение зафиксированными, в то время как Veo 3.1 дрейфует — особенно заметно в уютной семейной сцене на Хэллоуин; это расширяет ранее отмеченный однозображный конвейер, продолжая тему 20 Grok videos, что доказало масштабируемость подхода от одного статичного кадра. См. сравнение бок о бок и точный промпт для воспроизводимости в Collage test results и Prompt details.

Grok вообрази поэтические образы в OVA‑аниме

Стилевые исследования показывают, что Grok создает лирическое, насыщенное движением аниме, которое вызывает моменты арт-хауса — подобно фрагментам, напоминающим The Piano — при этом поддерживая единую эстетику на протяжении последовательностей Ода аниме.)

Зловещее аниме Грока отлично передает тревожную атмосферу аналового хоррора.

Подталкивая к дискомфорту — подумайте: «стены вопят на вас» — Grok Imagine погружается в зловещую анимацию, которая читается как аналоговый хоррор, давая рассказчикам быстрый путь к по-настоящему тревожному настроению Horror anime clip.)

Простой атмосферный промпт поднимает снимки Grok: серия кадров, включающая окна и ворона.

Маленькое добавление меняет всё: добавление «окна внезапно распахиваются от порыва ветра» и ворона в подсказки Grok Imagine надёжно углубляют настроение и движение для более кинематографичных последовательностей Atmosphere tip.

«Добавить девушку» в Grok питает позитивные, мемные анимации

Игривый функционал «добавить подругу» стал быстрым способом осветлять ленты и сеять мем‑готовые, хорошее настроение дающие биты; создатели отмечают, что он даже покоряет скептиков, когда его используют в повседневных Reels Feature note.


🖊️ Higgsfield Sora 2 MAX + импульс Sketch‑to‑Video

Помимо вчерашних новостей о Enhancer, сегодня создатели подчеркивают глобальную доступность MAX и процесс Sketch-to-Video: рисуй — и оно движется — 1080p, без таймлайнов и ключевых кадров. В постах акцент делается на весе/движении/ощущении от набросков.

Sora 2 MAX открывается по всему миру на Higgsfield — без регионов, очередей или кодов

Sora 2 MAX от Higgsfield теперь доступен для всех без региональных ограничений, очередей или кодов доступа, продолжая тему запуска Sketch‑to‑Video 1080p launch. MAX также поддерживает встроенный дефликер, временную стабилизацию и модули повышения разрешения, нацеленные на выход кинематографического уровня качества Access note, Model overview, Deflicker claim, Higgsfield page.

Скетч‑видео: нарисуйте один раз — получите 1080p анимацию без таймлайнов

Создатели подчёркивают рабочий процесс Higgsfield «draw‑to‑motion»: эскизы превращаются в кинематическое движение за считанные секунды, без таймлайнов или ключевой анимации, и рендерятся в 1080p Sketch pitch, Napkin to 1080p.

Sketch‑to‑Video адаптирует кадрировку: 16:9 для кино и 9:16 для мобильных устройств.

Поток автоматически учитывает замысел по соотношению сторон — широкое 16:9 для кинематографического повествования или 9:16 для охвата мобильной аудитории — чтобы создатели могли планировать итоговые материалы без повторной постановки кадров Aspect guidance.

От эскиза до сцены со звуком: MAX выводит движение с синхронизированным аудио.

Помимо визуального ряда, публикации подчеркивают, что Sketch‑to‑Video Sora 2 MAX генерирует последовательности с синхронизированным звуком, нацеленные на единое настроение и плавность исполнения без отдельных звуковых проходов Звук в движении, Безупречное звучание.

Сигналы Sketch управляют анимацией: вес, движение и эмоции интерпретируются.

Пользователи сообщают, что система «считывает» толщину линий, сигналы движения и эмоциональный тон непосредственно из эскизов, чтобы повлиять на выбор исполнения и движения — тем самым уменьшая микроманagement подсказок во время постановки сцены Signal claim.


🖼️ Runware Riverflow 1 для однократного редактирования изображений

Riverflow 1 появляется как точный редактор изображений, который “думает как дизайнер”, обрабатывая множество изменений текста, целевые детали и встроенное удаление фона. Запуск включает ценообразование, мини-уровень и вызов #OneShot.

Runware Riverflow 1 запускается с правками высшего уровня дизайна за одно применение

Runware выпустила Riverflow 1, прецизионный редактор изображений, который «понимает, что вы имеете в виду», чтобы выполнять единоразовые, готовые к продакшену правки, такие как изменения нескольких текстов, целенаправленные настройки деталей и нативное удаление фона — продолжая работу над Riverflow tease, который previewed intent‑aware editing. Модель была разработана внутри компании с использованием Sourceful и сейчас доступна через API Runware и Playground Release thread, с примерами композитов, демонстрирующими сложные локальные коррекции за один проход Examples set.

Editing examples grid

Создатели могут присоединиться через Playground для мгновенного тестирования и интеграции в рабочий процесс Playground links.

Цены Riverflow: $0.066 за изображение (Base), $0.05 (Mini), Pro в раннем доступе

Подробные цены Runware на первый день для Riverflow 1: База по $0.066 за изображение, Mini за $0.05, и тариф Pro в раннем доступе, сначала доступный в API и Playground Pricing post. Директ‑точки входа в Playground уже работают для обеих тарифов, чтобы тестировать перед масштабированием в рабочие процессы Playground base, и Playground mini.

Запуск карточек цен

Для команд это обеспечивает точный, ориентированный на намерения редактор с ценами ниже десяти центов за изображение, позволяющий массово обновлять продукты и исправлять бренд без бесконечного проматывания.

Riverflow 1 занимает первое место на арене редактирования благодаря точности в один выстрел.

Runware говорит, что Riverflow 1 опережает другие модели редактирования изображений на арене Artificial Analysis «в большинстве случаев», представляя её как мощную систему, работающую за один шаг, которая «думает как дизайнер» и достигает намерения с первой попытки Arena claim. The launch thread подчёркивает те же сильные стороны — множественные текстовые изменения, целевые правки деталей и нативное удаление фона — теперь подкреплённые общественными бенчмарками, sentiment Release thread.

Arena performance chart

Если результаты подтвердятся в рамках тестов сообщества, это может снизить количество итераций в таких задачах, как ретушь товаров для электронной коммерции, замены упаковки и локализация кампаний.

Челлендж Runware’s #OneShot: приз 1 000 долларов и кредиты на 10 долларов, чтобы попробовать Riverflow.

Runware запустил челлендж #OneShot: сгенерируйте одно изображение с Riverflow и опубликуйте его с хештегами #Riverflow #OneShot для возможности выиграть $1,000; поставьте лайк и переразошлите стартовую ветку, затем отправьте личное сообщение, чтобы получить $10 в кредит Runware для участия Challenge details. Это адаптировано под акцент на заявлении Riverflow — получение правки с первого раза — при этом снижаются затраты на эксперименты для пользователей, делающих первые шаги.


📣 Рекламные конвейеры: мульти‑ссылочные варианты, обработки и доски объявлений

Команды, работающие в коммерческой сфере, делятся тем, как они планируют и стилизуют рекламу: многоэлементные компоновки товаров и питомцев, цветовые палитры и сборку сториборда — плюс пайплайн от treatment до стартового кадра, организованный в Figma. Исключено покрытие функций Veo 3.1.

От тритмента до стартовых кадров: рекламный конвейер Wander, организованный в досках Figma

Кинематографист PJ Accetturo поделилсяpipeline рекламы, готовым к производству: начните с письменного тритмента, чтобы зафиксировать тон и персонажей, затем сгенерируйте точные стартовые кадры с выделенными операторами-постановщиками и организуйте выборы в Figma для контроля на уровне кадра (при необходимости — часы на каждый кадр-герой) Treatment notes, Figma board, Process thread.

Start frame selects

Подход демонстрирует, как тритменты переводятся в согласованные доски перед любым движущимся изображением — полезно для бренд‑клиентов, требующих непрерывности между сценами.

LTX Studio выстраивает чистый конвейер по созданию рекламы: мультиреференс, композиция, палитра, сториборд

LTX Studio выделил практичный, повторяемый рабочий процесс для коммерческих креаторов: начните с композиций с несколькими эталонами, чтобы чисто объединить продукт и питомца, определите композицию (окружение, освещение, ракурс), чтобы формировать энергию, зафиксируйте цветовую палитру для согласованности, затем соберите раскадровку, чтобы уточнить поток transitions между кадрами Подсказка по множественным ссылкам, Советы по композиции, Контроль палитры, Этап раскадровки. Вы можете попробовать полный конвейер напрямую в их приложении LTX Studio.

Коллаж‑ориентированный бренд‑рабочий процесс: Grok Imagine закрепляет идентичность, углы и завершающую карточку с логотипом

Создатель Billy Woodward демонстрирует гибкий бренд‑пайплайн: создать одну коллажную композицию с персонажами и окружением для кадров, соответствующих идентичности бренда, генерировать альтернативные ракурсы по запросу, затем завершить кастомной анимированной конечной открыткой, созданной из логотипа Collage method, Alternate angles, End card prompt.

Alt angle examples

Этот поток стартовый кадр→вариации угла→бренд‑тег является быстрым путём к последовательным, готовым к размещению социальным рекламам без тяжёлой постобработки.


🎨 Стилизованные кадры: карографический кутюр + рецепты MJ v7

Изображение‑ориентированные создатели делятся повторно используемыми наборами стилей и параметрами. Подборка под названием «Cartographic Couture» в модной/редакционной стилистике появляется с примерами ATL, наряду с коллажами параметров Midjourney v7 и сезонными жуткими образами.

Пакет подсказок Cartographic Couture выходит на рынок с впечатляющими примерами ATL.

Azed AI выпустил повторно используемый промпт "Cartographic Couture" для модных/редакционных кадров — одежда, созданная из плавных топографических карт с контурами — в сочетании с несколькими примерами в стиле ATL, которыми можно подражать в ваших собственных съемках Prompt and examples.

Topographic fashion shots

Пакет подчеркивает приглушённые базовые палитры + яркие акцентные палитры, мягкую фокусировку и элементы движения, вызванные ветром, чтобы передать вайб Vogue x GIS; репосты уже циркулируют как рецепт для более широкого ремиксирования Repost reach.

Midjourney v7: согласованные образы на основе компактного набора параметров

Новый коллаж MJ v7 показывает, как лаконичная настройка — --chaos 15, --ar 3:4, --sref <id>, --sw 500, --stylize 500 — обеспечивает последовательные, богато скомпонованные кадры по разным субъектам Parameter collage, following up on neon recipe that mapped similar settings to wireframe aesthetics).

MJ v7 collage

Создатели могут вставлять свой собственный sref, чтобы зафиксировать стиль, в то же время позволяя хаосу вносить мягкую вариацию; распространение идет через дополнительные репосты для быстрого вставления в рабочие процессы Further share.

Сезонные жуткие образы появляются вместе с параметрами, которыми можно поделиться, и мини-зином

Бри Гай

Topaz Astra увеличивает масштаб и повышает резкость кадров MJ для печати и в соцсетях.

Джеймс Юнг продемонстрировал работы из Midjourney, обработанные через апскейлер Astra от Topaz, отмечая заметное улучшение четкости для постов, пригодных для распространения, и возможного использования в печати Astra showcase,), с другим акцентом под названием «Wonders», также приписываемым Astra Astra example.).

Вывод для создателей статических кадров: завершайте обработку ML-апскейлером, чтобы устранить шум, подтянуть мелкую деталировку и сохранить связность на больших разрешениях без повторной перерендерации исходного арта.


🔊 Аудио, голос и SFX для создателей

Звуковые пайплайны получают обновления: корпоративный голос в агентах, автоматические звуковые эффекты при загрузке и мгновенная сборка аудио и видео. Полезно редакторам, работающим над короткометражками, трейлерами и объясняющими видеороликами.

Нативное аудио Veo 3.1 и реалистичный диалог появляются на основных платформах для создателей контента.

Стек аудио Veo 3.1 (диалоги, музыка, SFX) активно разворачивается повсеместно, предоставляя кинематографистам и монтажерам единый путь с одной моделью к звуку на видео. fal выпустила эндпойнты day-0 с «Realistic Dialogue» помимо преобразования текста в видео, изображений в видео и управления по первому/последнему кадрам Запуск Day 0, с выделенными ссылками на эндпойнты, доступными как для стандартной, так и для быстрой вариации Ссылки на эндпоинты. Replicate добавил Veo 3.1 и 3.1 Fast с улучшенной генерацией аудио и более точным соблюдением подсказок Replicate rollout, в то время как подборщики моделей Google Flow теперь помечают 3.1 Fast/Quality как "Beta Audio" для немедленного использования Model picker. См. детали модели в Replicate model.

Выбор модели с аудио

fal добавляет Mirelo SFX v1.5: загрузите видео, получите синхронизированный звуковой трек обратно.

Mirelo SFX v1.5 on fal превращает любое загруженное видео в версию с автоматически сгенерированными, временно синхронизированными звуковыми эффектами, возвращая новый саундтрек за один проход (расположенный как MMAudio). Это быстрая победа для шортов, трейлеров и рилов, которым нужны мгновенные, правдоподобные SFX без ручного Foley SFX model.)

video-to-audio graphic

Голоса ElevenLabs для Salesforce Agentforce обеспечивают разговорный опыт взаимодействия с клиентами.

ElevenLabs подтвердила, что обеспечивает голос Salesforce Agentforce, внедряя TTS промышленного уровня в корпоративных агентов, продемонстрированных на Dreamforce. Для креаторов, создающих интерактивные объяснения и потоки поддержки, это напрямую вставляет голос, близкий к человеческому, в пайплайны агентов без дополнительного связующего кода Agentforce partnership.

Ovi I2V от Character.ai получает 25%-ную скидку на Replicate, с синхронизированным голосом и видео.

Скидка 25% на Ovi (модель Character.ai для преобразования изображения/текста в видео с родным звуком) через Replicate действует до 29 октября, делая путь к 5‑секундным клипам с частотой 24 кадра в секунду и синхронизированным диалогом/ЗВК дешевле в нескольких соотношениях сторон. Модель поддерживает ввод только текста или текст+изображение для быстрых музыкальных промо, вступлений и социальных роликов Pricing promo, с возможностями и примерами на Replicate model page.


🧰 Инструменты разработчика Creator: Replicate, Comfy, облако

Платформенные настройки, упрощающие производство: сортировка API по новейшим моделям, более дешёвые мультимодальные запуски и сигналы доступа к аппаратному обеспечению и облаку для более тяжёлых локальных или облачных задач. Не включаются элементы функционала Veo 3.1.

ComfyUI получает оборудование DGX Spark, планирует отчёты по бенчмаркам

ComfyUI подтвердила специальную поставку оборудования NVIDIA DGX Spark и заявляет, что более широкие бенчмарки уже на подходе обновление оборудования, продолжая работу над Поддержка DGX, который продемонстрировал быструю локальную генерацию). Для студий, планирующих локальное ускорение на месте, предстоящие цифры помогут оценить соотношение локального и облачного для тяжелых графиков изображений/видео.

Replicate API добавляет sort-by-created, чтобы программно выводить самые новые модели.

Replicate’s HTTP API теперь поддерживает сортировку моделей по дате создания, упрощая автоматическое обнаружение и тестирование последних выпусков в пайплайнах и задачах cron Примечание по сортировке API. Это небольшой, но практичный выигрыш для команд, настраивающих непрерывную оценку или ночные обновления в быстро движущихся каталогах моделей.

Comfy Cloud открывает больше мест в частной бете через код-дроп.

ComfyUI раздает дополнительные приватные бета-коды для Comfy Cloud, приглашая сообщество запросить доступ в треде тред с бета-кодами.). Для создателей, которым больше нравятся облачные запуски, чем локальные узлы, это расширяет доступ к управляемым, совместно используемым рабочим процессам без расходов на настройку GPU.

Ovi I2V на Replicate получает скидку 25% до 29 октября включительно.

Ovi от Character.ai (текст/изображение → видео+аудио) на Replicate на 25% дешевле до 29 октября, что снижает затраты на эксперименты с кросс‑модальными материалами и короткими роликами pricing update. Подробности и примеры есть на странице модели, полезно для быстрых испытаний или пакетных запусков в production backends Replicate model page.


📅 Конкурсы создателей, этапы и бесплатные эффекты

Многое для кинематографистов и музыкантов: программа наград за музыкальные клипы на сумму более 50 тысяч долларов, призы за эффекты к Хэллоуину и состав спикеров конференции по генеративным медиа в заливах Сан-Франциско.

OpenArt Music Video Awards стартуют с более чем 50 тысячами долларов и 27 призами

OpenArt открыл прием заявок на свои награды в области музыкального видео, предлагая более $50,000 на 27 наград, окно подачи заявок с 10/15 по 11/16, и шансы быть замеченными на билбордах на Таймс-сквер — продолжение того, что вчера отмечалось в billboards live. Полные подробности подачи, правила и условия использования песен опубликованы, с упоминанием артистов-победителей Awards announcement, Submissions live. См. официальные материалы в правилах и на странице программы rulebook, awards page.

Запуск конкурса PolloHalloween: главный приз — iPhone 17, подарочные карты на 10 долларов за вовлечённые публикации

Конкурс PolloAI на Хэллоуин открыт до 3 ноября: главный приз — iPhone 17; первые 300 постов, достигших 30 и более совместных ретвитов и ответов, получат подарочную карту Amazon на 10 долларов, а хэллоуин-эффекты на этой неделе можно использовать бесплатно Contest details. Требуется участие с использованием хэллоуин-эффекта, пометка @itsPolloAI, добавление #PolloHalloween и отправка через форму How to enter, submission form. Бонус: доступен новый эффект “Halloween Pet Hat” для пробы Free effect.

Конференция по генеративным медиа объявляет состав спикеров: Катценберг, Блаттманн, Мильденхолл

Конференция по Generative Media (23 октября, Сан-Франциско) объявила трио ведущих — Джеффри Катценберг (WndrCo), Андриас Блаттманн (Black Forest Labs) и Бен Милденхолл (World Labs) — в рамках своей творческой и технической программы Speaker lineup. Black Forest Labs также зафиксировала появления в Заливном регионе на следующей неделе вокруг мероприятий PyTorch Conference, что подчеркивает насыщенный график создателей Week of events. Speaker portraits

Вызов Runware’s #OneShot: 1000 долларов за лучшее одиночное изображение Riverflow

Runware открыл челлендж #OneShot: сгенерируйте изображение с новой моделью Riverflow, опубликуйте с хештегами #Riverflow и #OneShot, и их любимый one-shot выиграет $1,000. Лайкните и перепостите публикацию о запуске и отправьте личное сообщение, чтобы получить $10 в кредит Runware для участия Challenge info. Riverflow 1, построенная на Sourceful, сосредоточена на точных, учитывающих намерения правки и доступна в песочнице Runware сегодня Model launch.

Riverflow previews

Музыкальный конкурс ElevenLabs на Хэллоуин предлагает призы в размере 2 000 долларов.

ElevenLabs объявила о музыкальном конкурсе на тему Хэллоуина с общим призовым фондом в 2 000 долларов и пригласила создателей сочинять и делиться работами, созданными с ее инструментами Contest post.

баннер конкурса музыки

Конкурс видеороликов к запуску Wondercraft: 10 участников соревнуются за 25 000 долларов

Wondercraft объявляет набор из десяти видеороликов о запуске, чтобы побороться за призовой фонд в размере $25,000, приглашая создателей представить короткие фильмы о запуске, созданные с помощью инструментов ИИ Промо-тизер конкурса.


🧪 Малые модели и мультимодальный поиск для просмотра

Несколько исследовательских сигналов для творческих инструментов: быстрый и недорогой Haiku 4.5 от Anthropic появляется на разных платформах, а DeepMMSearch‑R1 от Apple нацелена на более эффективные потоки веб-поиска. Также сообщество отмечает поддельный скриншот спецификации Gemini.

Claude Haiku 4.5 выходит на Replicate и Hugging Face за одну треть стоимости и более чем в два раза быстрее по сравнению с Sonnet 4.

Небольшой быстрый Claude Haiku 4.5 от Anthropic стал доступен на Replicate и появляется в выборе Hugging Face, заявляется как эквивалент производительности Sonnet 4 за долю цены и задержки Replicate model page, Hugging Face picker.

Benchmarks table

Ранние тесты и маркетинговые материалы указывают на стоимость в одну треть и более чем вдвое большую скорость, наряду с высоким уровнем использования инструментов и оценками по зрению, что делает его привлекательным для творческих помощников, генерации черновиков и рабочих процессов без устройства Benchmarks chart. Для практического использования смотрите карточку модели Replicate и примеры Replicate model card.

Apple раскрывает DeepMMSearch‑R1: многошаговый мультимодальный веб‑поиск по запросу для MLLMs

Исследователи Apple предлагают DeepMMSearch‑R1,框 рамку обучения и использования инструментов, которая позволяет мультимодальным LLM планировать и осуществлять многошаговые веб‑поиски по тексту и изображениям по требованию, а затем самостоятельно корректировать результаты на основе полученных доказательств — полезна для обоснованных творческих ссылок и мудбордов Обсуждение статьи, Статья ArXiv.

Тизер статьи

Система объединяет супервизированную тонкую настройку с онлайн‑обучением с подкреплением (RL) и вводит набор данных DeepMMSearchVQA, чтобы обучать, когда и что искать и как рассуждать над результатами; обсуждение подчеркивает потенциальное влияние на агентов, которые запрашивают руководства по стилю, местоположения и фактоспроверку во время генерации Ссылка на обсуждение.)

Сообщество развенчало скриншот с ценами на «Gemini 3.0 Pro» как подделку.

Широко распространенная карта цен на «Gemini 3.0 Pro» была помечена как подделка — критики отмечают отсутствие пометки «experimental», которая обычно сопровождает ранние релизы DeepMind, и предостерегают от восприятия её как официальной спецификации Screenshot critique.

Pricing card image

Разрозненные публикации строк из приложений намекают на грядущий апгрейд до «3.0 Pro», но без подтверждённой цены или порогов; креативам следует дождаться официальной документации перед планированием бюджетов или миграций App strings.


⚖️ Сдвиги в политике: чат-боты и ограничения на контент для взрослых

Короткие, но релевантные новости и политика: Калифорния приняла первые в стране меры по защите AI‑партнёров, а ChatGPT очерчивает будущие личности и фильтрацию взрослого контента. Полезный контекст для голосовых и нарративных приложений.

Калифорния приняла первый в стране закон о мерах защиты для AI‑партнёров‑помощников (SB 243)

Калифорния подписала SB 243, первый в США закон, специально регулирующий чат-ботов-компаньонов на базе искусственного интеллекта, который вступит в силу с 1 января 2026 года. Он требует явного уведомления об использовании ИИ, защищает несовершеннолетних от сексуального контента и обязывает внедрять протоколы реагирования на кризисные ситуации при мыслях о самоповреждении law summary.

скриншот пресс-релиза

  • Чат-боты должны ясно сообщать, что они являются ИИ, а не людьми.
  • Сексуальный контент запрещён для несовершеннолетних; ожидается внедрение механизмов проверки возраста.
  • Поставщики обязаны внедрять протоколы для случаев суицидальных мыслей, включая направление к кризисным службам.
  • Требуется ежегодный доклад об воздействии, и у пользователей появляется право на частный иск против разработчиков, не выполняющих требования.

ChatGPT добавит различные личности и контент для взрослых с возрастным ограничением к декабрю.

OpenAI зафиксировала смену политики: ChatGPT внедрит «личности» в ближайшие недели и включит взрослый контент для проверенных взрослых в декабре, следуя возрастной верификации и обновлению политики, оформленному как «обращайтесь с взрослыми пользователями как с взрослыми» policy screenshot.

policy screenshot

  • График: личности в течение недель; взрослый контент — в декабре.
  • Доступ будет ограничен для проверенных взрослых после возрастной верификации; более широкий спектр разрешенного контента будет сопровождаться обновленными мерами предосторожности.

On this page

Executive Summary
🎬 Veo 3.1 повсюду: управление, аудио, расширения
Higgsfield интегрирует Veo 3.1 с нативным 1080p, Draw‑to‑Video, Multi‑Shot и Director Controls
Krea добавляет Veo 3.1 с ссылками на изображения, интерполяцией и улучшенным звуком — 75% скидка для Pro/Max
Lovart запускает бесплатную пробную версию Veo 3.1 до 20 октября с неограниченным количеством стандартных генераций.
Runware добавляет Veo 3.1 и Fast в день 0 с точностью R2V и первыми/последними кадрами
Veo 3.1 Fast выходит на Hugging Face в виде приложения Gradio
Кредиты и промо‑акции на день старта расширяют доступ к Veo 3.1 для тестирования
Создатели подтверждают ссылки Veo 3.1 → реалистичность видео и диалогов в ранних тестах
Ссылка на видео — ключевой элемент управления идентичностью и стилем в этом цикле.
Hedra выпускает Veo 3.1 для фотореалистичного ИИ-видео в любой воображаемой сцене
Мобильный интерфейс фиксирует параметры Veo 3.1: Быстрый/Качество в Flow
🌦️ Приложения Runway для VFX с одним кликом продолжают расширяться.
Runway удаляет данные о погоде, фоновую картинку, время суток и приложения для повторной подсветки
✨ Grok Imagine: анимационные трюки и стили
Коллаж‑хак показывает строгое соблюдение идентичности Grok по сравнению с Veo 3.1
Grok вообрази поэтические образы в OVA‑аниме
Зловещее аниме Грока отлично передает тревожную атмосферу аналового хоррора.
Простой атмосферный промпт поднимает снимки Grok: серия кадров, включающая окна и ворона.
«Добавить девушку» в Grok питает позитивные, мемные анимации
🖊️ Higgsfield Sora 2 MAX + импульс Sketch‑to‑Video
Sora 2 MAX открывается по всему миру на Higgsfield — без регионов, очередей или кодов
Скетч‑видео: нарисуйте один раз — получите 1080p анимацию без таймлайнов
Sketch‑to‑Video адаптирует кадрировку: 16:9 для кино и 9:16 для мобильных устройств.
От эскиза до сцены со звуком: MAX выводит движение с синхронизированным аудио.
Сигналы Sketch управляют анимацией: вес, движение и эмоции интерпретируются.
🖼️ Runware Riverflow 1 для однократного редактирования изображений
Runware Riverflow 1 запускается с правками высшего уровня дизайна за одно применение
Цены Riverflow: $0.066 за изображение (Base), $0.05 (Mini), Pro в раннем доступе
Riverflow 1 занимает первое место на арене редактирования благодаря точности в один выстрел.
Челлендж Runware’s #OneShot: приз 1 000 долларов и кредиты на 10 долларов, чтобы попробовать Riverflow.
📣 Рекламные конвейеры: мульти‑ссылочные варианты, обработки и доски объявлений
От тритмента до стартовых кадров: рекламный конвейер Wander, организованный в досках Figma
LTX Studio выстраивает чистый конвейер по созданию рекламы: мультиреференс, композиция, палитра, сториборд
Коллаж‑ориентированный бренд‑рабочий процесс: Grok Imagine закрепляет идентичность, углы и завершающую карточку с логотипом
🎨 Стилизованные кадры: карографический кутюр + рецепты MJ v7
Пакет подсказок Cartographic Couture выходит на рынок с впечатляющими примерами ATL.
Midjourney v7: согласованные образы на основе компактного набора параметров
Сезонные жуткие образы появляются вместе с параметрами, которыми можно поделиться, и мини-зином
Topaz Astra увеличивает масштаб и повышает резкость кадров MJ для печати и в соцсетях.
🔊 Аудио, голос и SFX для создателей
Нативное аудио Veo 3.1 и реалистичный диалог появляются на основных платформах для создателей контента.
fal добавляет Mirelo SFX v1.5: загрузите видео, получите синхронизированный звуковой трек обратно.
Голоса ElevenLabs для Salesforce Agentforce обеспечивают разговорный опыт взаимодействия с клиентами.
Ovi I2V от Character.ai получает 25%-ную скидку на Replicate, с синхронизированным голосом и видео.
🧰 Инструменты разработчика Creator: Replicate, Comfy, облако
ComfyUI получает оборудование DGX Spark, планирует отчёты по бенчмаркам
Replicate API добавляет sort-by-created, чтобы программно выводить самые новые модели.
Comfy Cloud открывает больше мест в частной бете через код-дроп.
Ovi I2V на Replicate получает скидку 25% до 29 октября включительно.
📅 Конкурсы создателей, этапы и бесплатные эффекты
OpenArt Music Video Awards стартуют с более чем 50 тысячами долларов и 27 призами
Запуск конкурса PolloHalloween: главный приз — iPhone 17, подарочные карты на 10 долларов за вовлечённые публикации
Конференция по генеративным медиа объявляет состав спикеров: Катценберг, Блаттманн, Мильденхолл
Вызов Runware’s #OneShot: 1000 долларов за лучшее одиночное изображение Riverflow
Музыкальный конкурс ElevenLabs на Хэллоуин предлагает призы в размере 2 000 долларов.
Конкурс видеороликов к запуску Wondercraft: 10 участников соревнуются за 25 000 долларов
🧪 Малые модели и мультимодальный поиск для просмотра
Claude Haiku 4.5 выходит на Replicate и Hugging Face за одну треть стоимости и более чем в два раза быстрее по сравнению с Sonnet 4.
Apple раскрывает DeepMMSearch‑R1: многошаговый мультимодальный веб‑поиск по запросу для MLLMs
Сообщество развенчало скриншот с ценами на «Gemini 3.0 Pro» как подделку.
⚖️ Сдвиги в политике: чат-боты и ограничения на контент для взрослых
Калифорния приняла первый в стране закон о мерах защиты для AI‑партнёров‑помощников (SB 243)
ChatGPT добавит различные личности и контент для взрослых с возрастным ограничением к декабрю.