
Google Gemini 3 Pro выходит в AI Studio — $2 за вход и анализ видео на 1 млн токенов
Stay in the loop
Free daily newsletter & Telegram daily report
Executive Summary
Google’s Gemini 3 Pro действительно запущен в AI Studio и появляется в веб-приложении Gemini, что означает, что вы можете использовать его сегодня. Утечённые цены указывают на 200K токенов или менее за $2 входа и $12 выхода, а более высокие уровни — за $4 входа и $18 выхода, с порогом в январе 2025 года. Основные темы: агентное кодирование, генеративный UI/визуальная компоновка и контекст на 1 млн токенов для анализа длинных видео.
Что нового с наших наблюдений за выходными: реальные демонстрации агентов. Antigravity запускает кодирующих агентов, которые редактируют бэкенд Supabase, управляют браузером и закрывают баги от начала до конца, в то время как Generative UI формирует кликабельные макеты и мини-приложения прямо в чате. Превью Deep Think публикует 45% по ARC‑AGI‑2 (ARC Prize подтверждён), 88% по ARC‑AGI‑1 и 93,8% по GPQA Diamond, но доступ ограничен тестерам по безопасности; Pro достигает примерно 31% по ARC‑AGI‑2. Запускайте агентов в песочницах и требуйте диффы — всё ещё острый инструмент, а не автопилот.
Ранние сигналы выглядят сильными: один создатель сообщает 72,7% по ScreenSpot‑Pro, и сообщества в целом вешают Gemini 3 Pro на верхние позиции по тексту, визуальному восприятию и веб‑разработке. По словам Андрея Карпати, считайте открытые лидеры-листы как подсказки, а не вердикты — проведите неделю A/B‑тестов на вашей рабочей нагрузке, затем смените настройки по умолчанию, если результат сохранится.
Feature Spotlight
Gemini 3 для создателей контента: агенты, UI и развертывание
Gemini 3 Pro + Deep Think привносят агентное кодирование и генеративный пользовательский интерфейс для создателей, с доступом к AI Studio и демо Antigravity, поднимая планку в создании приложений, инструментов и визуальных материалов напрямую из подсказки.
Массовая история кросс‑аккаунтов: Gemini 3 Pro запускается с агентным кодированием (Antigravity), генеративным UI/визуальным макетом, анализом видео на 1 млн токенов и доступом к AI Studio. В основном практические демонстрации, утечки по ценам и ранние эффекты бенчмарков.
Jump to Gemini 3 для создателей контента: агенты, UI и развертывание topicsTable of Contents
✨ Gemini 3 для создателей контента: агенты, UI и развертывание
Массовая история кросс‑аккаунтов: Gemini 3 Pro запускается с агентным кодированием (Antigravity), генеративным UI/визуальным макетом, анализом видео на 1 млн токенов и доступом к AI Studio. В основном практические демонстрации, утечки по ценам и ранние эффекты бенчмарков.
Deep Think: превью‑посты достигли 45% на ARC‑AGI‑2; ограниченный доступ на данный момент.
Гемини 3 Deep Think превью достигло 45% на ARC‑AGI‑2 (ARC Prize подтверждён), с 88% на ARC‑AGI‑1 и 93,8% на GPQA Diamond, в то время как Pro фиксирует 31% на ARC‑AGI‑2 ARC‑AGI results. Доступ в настоящее время ограничен для тестировщиков безопасности, с запланированным развёртыванием для подписчиков Ultra после дополнительных проверок Safety testers note.
Суть в том, что это сузит разрыв в долгосрочном рассуждении. Он дорог за каждое задание в превью, поэтому придерживайтесь внимательного бюджета для незначительных запусков и используйте Pro как режим по умолчанию до более широкого развёртывания режима.
Gemini 3 Pro выходит в AI Studio и Gemini web
Google начал развертывать Gemini 3 Pro в AI Studio, и создатели сообщают о живом доступе, а также он появляется в веб-приложении Gemini. Это переводит модель из предположений в ежедневное использование для разработчиков. В продолжение к UI strings, ранние подсказки в строках приложения теперь соответствуют широкому охвату. См. подтверждения от создателей и глобальный монтаж в запусках клипов AI Studio check и Web app check.

Так что дальше? Вы можете начинать создавать vibe‑coding приложения, тестировать мультимодальные подсказки и опробовать новые агентные поведения сегодня. Ожидайте поэтапного включения по учетной записи и региону, поэтому периодически возвращайтесь к выбору модели в AI Studio Global rollout.)
IDE Antigravity от Google демонстрирует агентное кодирование, управление браузером и исправления в реальном времени.
Несколько демо-показов показывают, как Антигравити порождает агентов, тестирующих приложения, управляющих браузером, вносящих изменения в Supabase, и даже играющих в симулятор пинбола — наряду с примерами на белой доске и трекере полетов Early tester thread Demo set. Один создатель сообщил, что агент нашел баг, отредактировал бэкенд и решил проблему от начала до конца без ручной склейки.

Вот подвох: контроль по-прежнему важен. Запускайте в изолированных учетных записях, следите за областью разрешений и ожидайте редких ошибок редактирования. Но для прототипирования и QA-циклов это сводит часы к минутам.
Генеративный UI-пейзаж: динамические макеты, мини-приложения и анализ видео на 1 млн токенов
Создатели видят, как Gemini 3 на лету собирает визуальные макеты и индивидуальные инструменты — планы туров с кликабельными карточками, симуляторы и мини-приложения с поддержкой кода. Один демонстрационный пример подчёркивает режим «Visual Layout» («Визуальная раскладка»), а другой показывает, как он генерирует калькуляторы и визуализации физики непосредственно в ответе Visual layout explainer Tool coding demo. Модель также хвастается контекстом в 1M‑token для анализа длинного видео Visual layout explainer.

Попробуйте конкретные запросы, нацеленные на результат («сравнить три кредита AAA») и позвольте ей выбрать формат — таблицы vs. виджеты. Для образовательных и исследовательских объяснений используйте стили prompts трёх тел (three‑body sim), чтобы принудительно задействовать визуальное рассуждение Three body sim.
Gemini 3 Pro поднимается на первую позицию во всех основных рейтингах Arena.
Обзор лидеров сообщества показывает, что Gemini‑3‑Pro занимает топовые места в текстовом, визуальном и WebDev, обгоняя Grok‑4.1, Claude‑4.5 и варианты GPT‑5 Обзор арены. Создатели также поделились размещениями LMArena/WebDev и заметками по сайту после того, как модель стала доступна Видео рейтинга.
- Эло текста: ~1,501 (сообщено) и значительный рост WebDev по сравнению с 2.5 Обзор арены
- Видимость: также отмечено как доступное в веб-приложении Gemini Проверка веб-приложения)
Используйте это для приоритизации вашей очереди A/B. Затем проверьте на ваших задачах перед изменением значений по умолчанию.
Утечки цены на Gemini 3 Pro и детали документации уточняют уровни токенов, отсечка — январь 2025 года.
Экранные цены показывают две тарифные группы по токенам: ≤200K токенов по $2.00 вход / $12.00 выход, и >200K токенов по $4.00 вход / $18.00 выход, с пометкой о пороге знаний на январь 2025 г. Pricing details. Доки вскоре появились как “Confidential” и затем выдались 404 для некоторых пользователей, что свидетельствует о поэтапном развертывании документации Docs 404.
Для команд, планирующих эксперименты, эти скорости вывода важны. Официальный путь конечной точки появился в документах API Google, прежде чем исчезнуть — следите за повторной публикацией страницы, когда она стабилизируется API docs.
«Vibe coding» на практике: индивидуальные инструкции и сборка приложения на один промпт
Разработчики делятся дисциплиной prompting для Gemini 3 Pro: сначала планируйте, элегантно отлаживайте, создавайте тесты с замкнутым контуром и полностью контролируйте проверки интерфейса — затем позвольте модели выполнить внутреннюю итерацию, прежде чем вернуть результат Prompting guide. В отдельном демо полнофункциональное интерактивное приложение было создано из одного высокоуровневого запроса за один заход Vibe coding demo.)

Практически применимо сегодня: закодируйте эти инструкции в системном слоте, попросите самопроверки и требуйте диффы для изменений. Это снижает необходимость постоянного присмотра и обеспечивает более стабильные сборки.
Карпати призывает к практическим тестам моделей на фоне всплесков публичных бенчмарков.
Андрей Карпати называет Gemini 3 ориентиром уровня tier‑1 по темпераменту, письму, кодированию и юмору — но предупреждает, что публичные бенчмарки можно подтягивать за счёт соседних данных, советуя людям проводить A/B сравнение моделей напрямую Karpathy notes. Он поделился забавной перепиской, в которой модель отказалась принять дату 2025 года, пока не были включены инструменты поиска, затем смирилась Round‑up post.
Вывод: держите свой собственный eval‑набор ближе к своему рабочему процессу. Ежедневно чередуйте модели в течение недели, прежде чем выбрать дефолт.
Gemini 3 набирает 72.7% на ScreenSpot‑Pro, что намекает на более сильные навыки работы с пользовательским интерфейсом.
В бенчмарке ScreenSpot‑Pro автор сообщает, что Gemini 3 достигает 72.7%, а следующий лучший модель — 36.2% Screenspot score. Претензия, если она окажется верной, намекает на более быстрый путь к устойчивым агентам, использующим вычисления.
Рассматривайте это как направление до появления более широких репликаций. Но для задач типа RPA сначала проводите испытания через Gemini 3 и сравнивайте напрямую.
Экосистемы движутся вперед: Lovart, Kilo Code и Verdent принимают Gemini 3
Сторонние инструменты ускоряют поддержку: Lovart сообщает, что Gemini 3 запущен для исследований UI-дизайна Lovart availability, Kilo Code делится внутренними кодировочными баллами (Gemini 3 Pro 72% vs Claude 4.5 54% vs GPT‑5.1 Codex 18%) Kilo Code test, и Verdent рынки мульти-агентной оркестрацией, которая запускает параллельные сессии Gemini с шагами авто-проверки Verdent orchestration.
И что дальше? Модель уже там, где работают дизайнеры и инженеры. Попробуйте небольшой спринт внутри одного из этих инструментов, прежде чем мигрировать полноценные пайплайны.
🎬 Съемка в дикой природе: рекламное видео на высоте 30 тысяч футов, дуэли моделей, управляемое движение
Практические выигрышные примеры в производстве и тесты инструментов: полный рекламный ролик авиакомпании, созданный за 14 часов во время полета, сравнение создателей Grok/Kling/Veo и новая узловая система управления движением в ComfyUI. Исключение запуска Gemini 3 (см. раздел функционал).
Полная реклама Qatar Airways была создана за 14 часов на высоте 30 000 футов с использованием инструментов ИИ
Креативная команда за 14 часов на полёте создала два рекламных ролика Qatar Airways, сочетав подключение Google/Starlink, Gemini для планирования/ресурсов, Figma для макета, Veo 3.1 для анимации кадров и Suno для музыки; они уложились до посадки обзор проекта.). Они снимали эталонные фотографии, чтобы соответствовать деталям самолёта фото для справки,), использовали чистые промпты движения камеры для анимации сцен в Veo 3.1 пример промпта,) и финал смонтировали на основе индивидуального трека, созданного в Suno музыкальный рабочий процесс,), завершая всё менее чем за 15 минут до вылета финальная доставка.).

Veo 3.1 превращает статичные кадры в отполированные съемки с простыми подсказками по движениям камеры
Создатели демонстрируют, как Veo 3.1 надежно анимирует отдельные изображения в пригодные кадры, используя лаконичные директивы вроде «фотореалистично; медленный виток слева; сделать глоток кофе; приближение крупным планом», что сохраняет движение естественным и избегает излишней актерской игры prompt example. Развернутый обзор подчеркивает соблюдение подсказок Veo 3.1, точное аудио‑визуальное выравнивание и сильные редактирования на уровне объектов — полезно при синхронизации с музыкой или корректировке реквизита Veo overview.

Adobe Firefly теперь автоматически оценивает ваше видео с лицензированной музыкой
Новая функция Firefly Generate Soundtrack анализирует загруженный вами клип, предлагает подходящую подсказку и возвращает четыре синхронизированных трека; вы можете настроить настроение/стиль/темп и заново сгенерировать, затем скачать стемы или звуковую дорожку с оценкой. Она основана на лицензированном контенте, поэтому результаты можно использовать в коммерческих целях обзор функции. Пошаговый процесс показывает полный рабочий цикл от загрузки до выбора и экспорта этапы рабочего процесса.

Grok, Kling 2.5 Turbo и Veo 3.1 сравнены по эмоциональному диапазону
Параллельный тест создания контента сравнивает Grok Imagine, Kling 2.5 Turbo и Veo 3.1 по способности передавать нюансированное, правдоподобное эмоциональное выражение в коротких сценах. Монтаж упрощает командам выбор модели для каждой последовательности — например, крупные планы, требующие микро‑выражений, против стилизованного afetka model comparison.

Time‑to‑Move от ComfyUI добавляет управляемое движение в конвейеры Wan 2.2
ComfyUI проводит углублённое исследование Time‑to‑Move (TTM), техники plug‑and‑play для внедрения намеренного, управляемого движения в Wan 2.2 — полезно для точных панорам, толчков и ритмов действий персонажа deep dive session.) Есть также руководство, охватывающее блокировки и намерение движения для анимации последовательностей внутри ComfyUI tutorial video."\n\n
Тесты Леонардо: когда обращаться к Sora 2, Veo 3.1, Kling 2.5 или Hailuo 2.3
ЛеонардоAI поделился заметками из реальных проектов, сопоставляющими сильные стороны моделей с задачами: Sora 2 для физически точных, учитывающих ограничения кадров Sora summary; Veo 3.1 для строгого соблюдения промптов, аудиовизуального тайминга и редактирования объектов Veo brief; Kling 2.5 Turbo для профессиональных переходов и контроля начального→конечного кадра Kling summary; и Hailuo 2.3 для бюджетных запусков, которые выглядят все равно убедительно Hailuo summary. Этот ролик — удобная шпаргалка по планированию кадров и маршрутизации бюджета model highlights.

🖼️ Фотореалистичные текстуры, чистый шрифт и повторно используемые стили.
Инструменты обработки изображений сегодня склоняются к верности и контролю: ImagineArt 1.5 продвигает текстуру пор на уровне пор и корректно набранную типографику; создатели делятся надежными референсами стиля. В основном тесты от создателей — немного заметок о политике платформы.
ImagineArt 1.5 демонстрирует реализм на уровне пор и чистый, правильно написанный шрифт.
Создатели сообщают, что ImagineArt 1.5 сохраняет детали материалов микроуровня (поры, ткани, отражения), точно передает текст для постеров/UX, следует сложным подсказкам с низким уровнем галлюцинаций и сохраняет верность при увеличении до пикселей, продолжая тему после первых взглядов на монтаж. Смотрите утверждения о фокусе на текстуре в ветка по функциям, текстовая точность пример текста, точность выполнения запроса утверждение об точности выполнения запроса, и тест узкого зума пример зума, с местом для опробования в студии студия изображений ImagineArt.

Midjourney бумажная скульптура sref 2499912115 создает эффект ручной вырезанной бумаги
Многоразовый рецепт MJ V7 (--sref 2499912115), приводящий к эстетике поп-ап книги/картонной диорамы для детской редакционной съемки и сцен в стиле стоп‑мошн, позволяя вам унаследовать внешний вид без длинных подсказок Стиль рецепта.
)
Grok Imagine получает портативные наборы стилей: лексикон токенов и наборы промптов
Два пакета сообщества облегчают повторение стиля Grok Imagine: компактный список токенов для редакционного/ретро-образа (например, «Glitchwave», «LomoChrome Metropolis») Список токенов, плюс набор подсказок с несколькими изображениями, который другие ремиксуют в единообразные последовательности Набор подсказок.\n\n
Новый рецепт MJ V7 (sref 87144643), поделённый с хаосом 22 и выходом 3:4
Свежая настройка Midjourney V7 — --sref 87144643, --chaos 22, --raw, --ar 3:4, --sw 500, --stylize 500 — обеспечивает единый стиль, который создатели могут повторно использовать в разных запусках V7 prompt.
🧰 Дизайн прототипирования с ИИ: Figma Make, vibe‑coded приложения
Применённые достижения в UI/UX: ранние тесты Make в Figma показывают, как ИИ превращает доски в функциональные прототипы с анимациями и связками с бэкендом. Исключает запуск Gemini 3 (см. функцию); сосредоточено на рабочих процессах дизайна на первый день.
Figma Проведите тесты Gemini 3 Pro для сборок от промпта к прототипу.
КРИТИЧЕСКИЕ ПРАВИЛА:
- Сохраните ВСЕ заполнители точно так, как они выглядят (например, MARKER_0, https://video.twimg.com/amplify_video/1990906616506376196/vid/avc1/3840x2160/lX7H0rh4wMHR_196.mp4?tag=21, SOURCELINK_2)
- НЕ переводите какие-либо заполнители
- Переводите только читаемый человеком текст между заполнителями
- Поддерживайте ту же структуру, тон и форматирование
- Держите технические термины подходящими для аудитории ИИ/технологий
- Сохраняйте форматирование markdown (жирный, курсив, списки и т. д.)
Заполнители означают:
- MARKER_X: Маркеры цитирования с метками, встроенные в текст
- URL_X: веб-URL-адреса, которые не следует переводить
- SOURCELINK_X: компоненты React, которые не следует переводить
Переводите естественно, сохраняя все заполнители в их точных позициях.
Figma включил Gemini 3 Pro как экспериментальную модель внутри Make, с тем, что ранние запуски превращали статическую доску в работоспособный прототип — SVG, анимации в стиле физики и подключение Supabase, сгенерированное по подсказке Демонстрация Figma Make.). Дизайнеры могут переключать это в экспериментальных настройках и наблюдать, как он отображает смену стилей (Chrome Y2K → бруталистский стиль), сохраняя взаимодействия без изменений.

Инструмент для макетов iPhone с одной подсказкой, поставляемый вместе с Gemini 3 + Anycoder
Дизайнер запустил генератор макетов iPhone с одним запросом, используя Gemini 3 и Anycoder — удобен для вставки снимков экрана в рамки устройств во время обзоров Анонс. Вы можете опробовать живое Space и изучить подход Hugging Face space, с обновлённым интерфейсом Anycoder, также доступным для более широкой инфраструктуры приложений Anycoder space.
Однопромптовый UI-инструмент для Nano Banana, созданный в AI Studio.
Создатель использовал Gemini 3 в AI Studio для одношагового создания обозревателя изображений-моделей: пакетные повторные запуски, состояния ожидаемого вывода, привязки клавиш, предпросмотр во всплывающем окне в полном размере, редактирование и повторная генерация, загрузки поодиночке/пакетом — всё построено на одном запросе Builder thread. Это «vibe coding»-рабочий процесс на практике для быстрых внутренних инструментов и спецификаций интерфейсов."}
{
Lovart запускает Gemini 3 для быстрого создания макетов интерфейса и исследований
Lovart сообщает, что Gemini 3 запущен на своей платформе для задач по дизайну пользовательского интерфейса Feature note. Снеговая триптиховая лента демонстрирует быструю эстетическую исследовательскую работу, которая может служить как мудборды или фоны экранов перед переходом к компонентам.

Веб-игра на базе Vibe выходит с таблицей лидеров, чатом и возможностью делиться результатами.
В основном созданный в Google AI Studio с Gemini 3, «Tie Drop» демонстрирует скорость прототипирования от начала до конца: интерфейс, геймплей, экспорт PNG‑результатов и живой чат, реализованные за часы Game thread. Это конкретный шаблон для быстрого тестирования UX‑петлей и обмена сборками для обратной связи Live game.
ИИ предлагает редизайн в стиле газеты на основе существующего персонального сайта.
Мэтт Шумер попросил Gemini 3 переработать его сайт и получил несколько направлений, включая поразительный вариант в стиле «газета», который переосмысливает иерархию и типографику Before/after mocks. For快速 ideation, это низкофрикционный способ протестировать голоса макета перед привязкой к компонентам.
🎵 Автоматически оцениваемые фрагменты и доступное чтение
Новые аудиопотоки для редакторов и рассказчиков: Firefly оценивает видео прямо по монтажу, Producer ускоряет воспоминание о сессии, и ElevenLabs открывает бесплатный доступ к чтению с NFB. В основном — инструкции и партнерства.
Adobe Firefly теперь автоматически оценивает ваше видео, предлагая 4 варианта трека и коммерчески безопасное использование.
Новая функция Adobe Generate Soundtrack берет видео, автоматически формулирует музыкальный запрос на основе темпа и настроения, а затем возвращает четыре синхронизированных варианта, которые можно настраивать по атмосфере, стилю, темпу и длине — лицензировано для коммерческого использования Feature brief. Шаги: загрузка → авто-подсказка → редактирование настроек → повторная генерация → загрузка, что делает это прямым музыкальным проходом из монтажа для редакторов Tutorial steps Firefly soundtrack.

ElevenLabs сотрудничает с NFB, чтобы предоставить слепым участникам бесплатный доступ к ElevenReader Ultra.
Программа Impact от ElevenLabs теперь предоставляет членам Национальной федерации слепых бесплатную 12-месячную лицензию ElevenReader Ultra, добавляя реалистичное озвучивание, совместимость с программами чтения с экрана и голоса по выбору пользователя для доступного чтения в масштабе Публикация о партнёрстве Блог ElevenLabs. Программы доступны через Программу Impact, цель — поддержать один миллион голосов Подробности программы.

Продюсер добавляет «Go to Session» для мгновенного повторного открытия временной шкалы любой песни.
Producer выпустил «Перейти к сессии», кнопку возврата под Song → Details, которая заново открывает ту же сессию, в которой вы создавали трек, чтобы вы могли продолжать итерации без рыскания по проектам Feature note. Он дополняет новый контекст Memories, представленный ранее на этой неделе, ускоряя вспоминание и сохранение вашего творческого состояния Memories feature.
🧊 Персонажи и 3D из текста или эскиза
Реализм персонажей и быстрое создание 3D‑активов готовят создателей к работе: HD‑ролики Hedra’s Character‑3 и инструмент, превращающий текст или 2D‑рисунки в пригодные для использования 3D‑модели. В основном — практические демонстрации и промо‑материалы.
Промо-ролик Character‑3 HD и тесты живого диалога
Хеда продвигает Character‑3 HD с пробным тестом на 2 500 кредитов (подписка + репост + ответ), и создатели уже проводят стресс‑тестирование его для разговорных выступлений model reel.). Продолжая тему realism reel, который показал кинематографические крупные планы и предложение теста, сегодняшние клипы подчеркивают естественный обмен репликами с «реальными голосами», что полезно для персонажно‑ориентированных короткометражек и рекламных роликов с говорящими головами creator test.

Для команд преимущество — быстрое получение очень правдоподобных лиц и достаточная консистентность для последовательных кадров. Примечание: лицензирование голоса по‑прежнему имеет значение, даже если лицо продает сцену."
Текст или эскиз — в готовую к использованию 3D-модель с помощью Aicad
Aicad App привлекает внимание создателей тем, что за считанные секунды превращает обычный текст или простые 2D‑рисунки в готовые к производству 3D‑модели — ориентирован на инженерное дело, прототипирование, разработку игр и 3D‑печать обзор приложения. пример создателя демонстрирует рабочую концепцию подставки под ноутбук, созданную по одной строке брифа, подчёркивая её CAD‑направленную полезность как для практических деталей, так и для реквизита пример продукта.
Суть в том, что она сокращает цикл идеи → сеточная модель. Вам всё равно придется проверить допуски и материалы перед изготовлением, но для быстрой итерации это заменяет часы ручного моделирования.
Нативный 3D-мультимодальный LLM, тизер Tencent
У Tencent Part‑X‑MLLM намекали как на родной 3D мультимодальный LLM, который объединяет задачи вроде привязки к контексту (grounding), генерации и более широкого 3D‑понимания в одной модели paper mention. Для 3D‑создателей обещание состоит в меньшем числе переключений между сегментацией, пониманием сцены и созданием активов — то есть быстрее блокирование и чище передача в инструменты DCC.
Если модель окажется такой, как описано, ожидайте лучшую связность от подсказки до сцены и более простые пайплайны для размещения персонажей и взаимодействия объектов в синтетических кадрах.
📚 Агентное исследование, слияние моделей и физические 3D-активы
Публикации, релевантные творческим рабочим процессам: более мощные агенты, использующие инструменты; усреднение по весам моделей; рассуждения по физике олимпийского уровня; и 3D-объекты, готовые к симуляции, полученные из одного изображения.
MiroThinker v1.0 масштабируется до 600 вызовов инструментов с высокими оценками GAIA/HLE/BrowseComp
Открытый исследовательский агент MiroMind работает с контекстом 256K и до 600 вызовов инструментов за задачу, сообщая результаты: 81,9% по GAIA, 37,7% по HLE и 47,1% по BrowseComp. Это полезно для глубокой творческой исследовательской работы, библий по историям и длительных веб‑задач без привязки к поставщику papers page, с кратким обзором здесь paper thread.
PhysX‑Anything: одно изображение → 3D‑ассеты, готовые к симуляции, с новым набором PhysX‑Mobility
PhysX‑Anything представляет фреймворк для создания готовых к симуляции, артикулированных 3D‑активов из одного изображения, а также набор данных PhysX‑Mobility, состоящий из более чем 2,000 объектов. Новая токенизация геометрии уменьшает число токенов примерно в 193 раза, делая явное обучение геометрии выполнимым в рамках обычных бюджетов VLM — перспективно для превращения фотографий реквизита в активы, пригодные для физического риггинга papers page.

P1 физические модели демонстрируют уровень золотой медали IPhO; перенести достижения в математику/код
Серия P1, обученная с помощью обучения с подкреплением для физического рассуждения, заявляет о золотой медали на IPhO 2025 (12 золотых медалей) и демонстрирует сильные междоменных преимуществ в математике и программировании. Для рабочих процессов с визуальными эффектами и моделированием, улучшенное физическое рассуждение могло бы автоматически проверять непрерывность и ловить невозможное движение papers page, с более ранним указателем здесь paper link.))
)
Souper-модель Meta демонстрирует неравномерный «модельный суп», повышающий вызовы функций до уровня SOTA.
Meta предлагает Souper‑Model (SoCE), Супа Категориальных Экспертов, который неравномерно усредняет контрольные точки экспертов, чтобы поднять передовые результаты в вызовах функций и улучшить мультиязычность, математику и использование инструментов — без повторного обучения. Для разработчиков он намекает на недорогой прирост производительности за счёт объединения существующих моделей, а не масштабирования одной гигантской модели ArXiv paper) и идет чтение сообщества discussion thread.)
)
📣 Сделки, вызовы и найм для создателей контента
Платформенные промо-акции и призывы к созданию доминируют: продленные скидки, списания кредитов и праздничные испытания. Полезно для команд, планирующих бюджетированные эксперименты на этой неделе.
Higgsfield продлевает Черную пятницу и киберпонедельник на 3 дня с промо на 9 часов и 300 кредитов
Продолжая работу над Higgsfield BF (скидка 65% + снижение на 300 кредитов), команда принесла извинения за прежние ошибки и продлила цены Черной пятницы еще на три дня Извинительное видео. Разделная социальная промо-акция предлагает 300 бесплатных кредитов за 9‑часовой период, если вы ретвитнёте, подпишитесь, поставите лайк и оставите комментарий — полезно для тестирования пайплайнов изображений/видео на бюджете Credit giveaway.

Glif расширяет поддержку платежей в десятки новых стран.
Glif запустил поддержку платежей в десятках дополнительных стран, устранив ранее возникшие отклонения по картам, связанные с регионом выставления счетов Обновление платежей. Этот шаг должен упростить для команд за пределами США возможность оплаты и отгрузки с использованием инструментов Glif; детали соответствуют карте глобальной доступности Stripe Карта глобальной доступности Stripe.

Promise набирает 17 креативных ролей в области ИИ со долей в компании
AI‑native студия Promise объявила 17 открытых вакансий, охватывающих создание историй с использованием ИИ и продакшн, отмечая, что позиции включают долю в компании Hiring thread. Если вы хотите работать над конвейерами фильмов и контента на базе ИИ, это редкая возможность присоединиться к ранней команде с upside владения Equity note.
FLUX проводит 32‑часовой хакатон в Сан-Франциско с призовым фондом более 25 тыс. долларов.
BFL проводится 32‑часовой хакатон FLUX в Сан-Франциско 22–23 ноября с 150 местами и призовым фондом свыше $25K — создавайте с моделями FLUX и сдавайте работу к сроку Hackathon post.). Партнёры включают NVIDIA, DigitalOcean, Vercel, Anthropic и Cerebral Valley, что сигнализирует о сильной инфраструктуре и поддержке моделей на месте Partners update.).
)
Pollo 2.0 запускает рождественский видеочеллендж с денежными призами
Pollo AI запустил рождественский конкурс для создателей контента, который пройдет с 18 по 30 ноября, выплачивая $2 за каждую отобранную работу. Поданные материалы должны использовать модель Pollo 2.0; в публикации приведены правила и ссылка на подачу для быстрого участия Challenge details. Это лёгкий способ монетизировать короткие праздничные клипы на этой неделе.
Verdent предлагает 70% скидку на Gemini 3 Pro на 30 дней с удвоенными кредитами.
Verdent снижает использование Gemini 3 Pro на 70% на 30 дней и удваивает кредиты на подписки Deal details. Платформа предлагает параллельные, изолированные сессии Gemini, которые планируют → кодируют → проверяют автономно — стоит короткий, со скидкой пробный вариант, если ваш текущий цикл AI-кодирования требует меньше переходов.
💬 Дискурс создателей: критика, преодоление и осторожность с бенчмаркaми
Живые обсуждения легитимности искусственного интеллекта в искусстве, тактики противодействия атакам толпы и напоминание доверять практическим оценкам, а не шумихе вокруг лидербордов.
Эндрю Карпати призывает к практическому тестированию моделей на фоне ажиотажа вокруг таблицы лидеров Gemini 3.
Андрей Карпати высказался по Gemini 3, назвав его одним из лучших решений для повседневного использования, при этом предупредив, что общедоступные бенчмарки можно обмануть переподгонкой и они не должны заменять прямые A/B‑испытывания. Он поделился характерным анекдотом: модель отказалась принять, что сейчас 2025 год, пока не включил веб‑инструмент, подчёркивая, почему использование инструментов и реальные задачи важны в оценке Summary thread.)
Создатели выступают против ярлыка «AI slop» и переосмысливают спор между профи и любителями.
ИИ-художники ответили на насмешки о «шлаке», утверждая, что оплата определяет профессионализм, в то время как инструменты вторичны по отношению к результату и вкусу. Этот поток вызвал множество ответов, когда создатели склонялись к рыночным результатам больше, чем к чистоте носителя, и бросили вызов ограде вокруг «реального искусства» Pro vs hobby post Slop rebuttal Market frame Pile-on comment.)
«Mute, don’t block» распространяется как руководство по работе с «толпами ненависти», созданными ИИ.
Тактический пост рекомендует мьютить (молчать) постоянных критиков вместо блокировки, утверждая, что это лишает внимания атаки толп, но сохраняет охват. Советы появляются наряду с тем, как авторы экспериментируют с ограничением ответов и настройками видимости, чтобы обескровить бригады, продолжая тему только подтвержденные как более раннюю тактику давления толпы Тактика мьютинга.
Создатели предлагают использовать «интеллект за секунду» как более надёжный способ оценки моделей.
На фоне быстрых релизов, которые сжимают ощущение прогресса, автор предложил отслеживать «интеллект за секунду», чтобы сбалансировать качество и скорость, и отметил, что законы масштабирования все ещё работают, даже если скачки кажутся меньшими из-за ритма выпуска. Это побуждение учитывать задержку и пропускную способность наряду с эталонами при выборе повседневных инструментов Metric idea Scaling laws take.