Google Gemini 3 появляется в интерфейсах — 69% шанс, объем ставок $803k

Stay in the loop

Free daily newsletter & Telegram daily report

Executive Summary

Gemini 3 уже близко: в темном режиме выбора модели теперь отображается «3 Pro» рядом с «2.5 Pro», и карточка Google Vids для “Nano Banana Pro” буквально говорит «работает на Gemini 3 Pro». Сандар Пичай сделал подмигивающий твит об предсказании падения Polymarket на 22 ноября; рынок на 69% Да с ~803 тыс. долларов торгуется, достаточно сигналов, чтобы выделить время на эвалуацию и планы миграции.

Почему это важно: если вы запускаете творческие или агентские пайплайны, на этой неделе, скорее всего, будет принято решение по маршрутизации. Создатели уже публикуют рендеры «Nano Banana Pro» — включая чистую сцену Nether в Minecraft — и макет телефона утверждает более высокую точность вывода SVG, хотя оба не подтверждены. Готовьтесь заранее: зафиксируйте промпты, клонируйте ваши тесты 2.5 Pro и подготовьте сопоставления «вручную» между изображением и текстом, надежности экспорта SVG и поведению при использовании инструментов, чтобы вы могли перенаправить трафик в течение часов после появления документации. И да, имя банана созревает для мемов; держите взгляд на задержках и кривых стоимости, а не на брендинге.

Feature Spotlight

Особенность: обратный отсчет до Gemini 3 и утечки «Nano Banana Pro»

Gemini 3 уже близко к выходу: внутренний интерфейс показывает «3 Pro», шанс по Polymarket около 69% к 22 ноября, а утечки Google Vids упоминают «Nano Banana Pro» (питается Gemini 3 Pro). Создатели уже публикуют выходы более высокого качества.

Сильные межаккаунтные сигналы о скором выпуске Gemini 3, а также утечки о создателе и пользовательском интерфейсе вокруг стека изображений («Nano Banana Pro»). Значительное влияние на выбор моделей и творческие конвейеры. Исключает RAG/поиск файлов и релизы не Gemini, которые освещаются отдельно.

Jump to Особенность: обратный отсчет до Gemini 3 и утечки «Nano Banana Pro» topics

🪩 Особенность: обратный отсчет до Gemini 3 и утечки «Nano Banana Pro»

«Nano Banana Pro» утечка в Google Vids показывает, что «работает на Gemini 3 Pro»

Промо‑карточка Google Vids для «Nano Banana Pro» появляется в интерфейсе с кнопкой Try it и надписью «powered by Gemini 3 Pro», что подразумевает доставку обновленного стека изображений вместе с Gemini 3. Утечка имеет значение для творческих пайплайнов, выбирающих между инструментами OpenAI/Gemini для изображений на следующей неделе. Подробности смотрите в визуализации функции leak screenshot и в статье full scoop.

Google Gemini 3 появляется в интерфейсах — 69% шанс, объем ставок $803k

Executive Summary

Особенность: обратный отсчет до Gemini 3 и утечки «Nano Banana Pro»

Table of Contents

🪩 Особенность: обратный отсчет до Gemini 3 и утечки «Nano Banana Pro»

«Nano Banana Pro» утечка в Google Vids показывает, что «работает на Gemini 3 Pro»

Интерфейс чата отображает модель «3 Pro» рядом с «2.5 Pro», что намекает на внутреннюю доступность.

Эмодзи-цитата Сундара подогревает шансы Polymarket на Gemini 3 к 22 ноября.

Гуглеры и трекеры намекают на «хорошую неделю», а также короткий фрагмент экрана «Gemini 3.0»

Создатели публикуют рендеры «Nano Banana Pro», включая детальный Nether из Minecraft.

Утверждается, что качество рендеринга SVG Gemini 3 проявляется в новом макете пользовательского интерфейса.

📊 Бенчмарки: кодирование, рассуждения и оценки приложений

IBM study: 7–8B models reached 100% identical outputs at T=0; 120B at 12.5%

Sherlock Think Alpha публикует 1805.67 на LisanBench с валидностью 0.96

Socratic Self‑Refine повышает точность в математике и логике примерно на 68% за счет пошаговых проверок

AlphaEvolve находит более сильные математические решения; зафиксирован обход системы вознаграждений.

Безопасно выровненные LLMs сталкиваются с трудностями при роли злодеев; точность падает на ролях эгоистов.

Обнаружение аномалий по трассам помечает сбои нескольких агентов с точностью до 98%.

Появился новый бенчмарк видеоподсказок, предлагающий сравнение подсказок бок о бок.

Kimi K2 теперь лидирует в Vending‑Bench среди моделей с открытым исходным кодом

Обзор ERNIE 5.0: более чистые результаты, средние показатели по сравнению с Kimi K2 и MiniMax M2

Сообщество «RL‑Shizo» тесты выявляют чрезмерное обдумывание бессмысленных подсказок

🏗️ ИИ‑суперфабрики, проектирование дата-центров и разрывы мощности

США сталкиваются с дефицитом мощности дата‑центров на 44 ГВт к 2028 году, для устранения которого потребуется примерно 4,6 трлн долл.

OpenAI и Microsoft строят кластеры из «сотен тысяч» GPU.

Американские облачные гиганты, как ожидается, потратят около 1,7 трлн долларов на ИИ в 2025–2027 годах, по сравнению с примерно 210 млрд долларов у Китая.

Внутри двухэтажного дата-центра Fairwater AI от Microsoft, оптимизированного для низкой задержки

Google говорит, что TPU возрастом 7–8 лет по‑прежнему работают на 100% загрузке.

🧰 Агентные инструменты разработки и рабочие процессы

Conductor добавляет живой параллельный вид агентов с кликабельными субагентами

Руководство Google по агентам формализует CI/CD и Agent2Agent для производственной среды.

«oracle» CLI объединяет контекст и файлы, чтобы спросить GPT‑5 Pro, когда агенты застревают.

LangCode CLI объединяет OpenAI/Claude/Gemini с режимами ReAct и Deep.

CopilotKit AI Canvas поддерживает синхронное состояние пользовательского интерфейса и агента через LangGraph

Poltergeist представляет панель различий на основе ИИ с наблюдателями за линтингом, сборкой и тестированием.

Обнаружение аномалий на уровне трассировки сигнализирует о скрытых сбоях в многоагентных запусках.

Amp CLI теперь выводит чистые, возобновляемые сводки потоков после выхода.

Trimmy (57 КБ) исправляет переносы строк в TUI, чтобы вставки в терминал выполнялись без проблем.

v0 SDK Playground отлаживает вызовы API «vibe coding» в одном месте

🗂️ RAG без RAG? Поиск файлов Google и извлечение запрашивают

Поиск файлов Gemini от Google выпускает «RAG in a box» с бесплатным тарифом.

Живой бот показывает поиск файлов и привязку поиска к источникам при ответе на документы Gemini.

“Google уничтожил все стартапы RAG”, спор вокруг File Search разгорается.

Призыв подключить Google Scholar и Books к Deep Research/Gemini

🧠 Скрытые и альтернативные модели (не Gemini)

OpenRouter выпускает скрытные модели «Шерлок» с контекстом 1,8 млн и сильными оценками

LM Arena позволяет GPT‑5.1‑high работать с видением и текстом и открывает Code Arena для Codex

Обзор Deep ERNIE 5.0: более чистые результаты, значительные улучшения, но пробелы в рассуждениях

KAT‑Coder‑Pro V1 выходит в раздел OpenRouter Trending, занимая топ-10 по суточному использованию токенов.

🧪 Рассуждение, детерминизм и дистилляция (новые статьи)

Меньшие модели на 7–8 млрд достигают 100% детерминированных выводов при T=0; 120 млрд — всего 12,5%

AlphaEvolve от DeepMind находит лучшие решения по 67 математическим задачам; репозиторий доступен онлайн.

Socratic Self‑Refine повышает точность в математике/логике примерно на 68%, исправляя лишь шаги с низкой степенью уверенности.

Обнаружение аномалий только по трассировке отмечает смещения и зацикливания нескольких агентов с точностью до 98%.

Языковые модели, ориентированные на безопасность, испытывают трудности с ролью злодеев; новый бенчмарк количественно оценивает разрыв.

Гибридный решатель ARC сочетает быстрые догадки с простыми программами правил для повышения обобщающей способности.

🎬 Креативные стеки: превращение фотографий в движение и визуализации почти в реальном времени

FlexFX от InVideo превращает статичные фотографии в движение с помощью 60‑секундных рецептов.

Grok Imagine вызывает восхищение у создателей благодаря реалистичным микро‑клипам и игривым подсказкам.

Новый бенчмарк видеоподсказок выходит для прямых сравнений TTV (один на один)

Gemini 3 SVG наблюдение намекает на более высокую точность векторного вывода

🛡️ Управление и сигналы безопасности

IBM сопоставляет уровни детерминизма: небольшие модели на 7–8 млрд параметров достигают 100% идентичных выходов при T=0

Пользователи заявляют, что явная текстовая водяная пометка OpenAI исчезла, что усложняет прослеживание происхождения.

Сулейман призывает к сдерживанию и регулированию автономных агентов ИИ.

ChatGPT управляет групповыми чатами с настройками конфиденциальности и защитой несовершеннолетних.

Как показывают исследование, безопасностно-ориентированные LLM испытывают трудности с ролью злодеев.

Статья призывает к раскрытию информации и прослеживаемым оценкам для науки с участием искусственного интеллекта

🤖 Воплощенная ловкость и трюки

ALLEX роботизированная рука обеспечивает деликатное и точное манипулирование

Unitree G1 проходит тест на бытовые задачи

Бипедный робот выполняет туз на лунке.

Роботизированные конусы обеспечивают безопасность на месте аварии менее чем за 10 секунд.

On this page