Google Gemini 3 Pro достигает Search и мобильного — лимиты API растут в 5×, 20 млрд токенов в день

Executive Summary

Google расширил Gemini 3 Pro по большей части стека и включил Gemini Agent для Ultra-пользователей на настольных устройствах в США. Почему это важно: пропускная способность и безопасность оба выросли. Пределы внешних API поднялись примерно в 5 раз, и один оператор обработал 20 млрд токенов за день, прежде чем снова столкнулся с лимитами. Карта безопасности DeepMind указывает на более сильную устойчивость к промпт‑инжекции и рейтинг 11/12 по самому сложному сегменту своей оценки кибербезопасности, плюс управление состоянием при использовании инструментов.

История агента прагматична. Он разлагает задачи, подключается к Gmail и Calendar с согласием, составляет черновики ответов и требует подтверждений для рискованных действий, таких как покупки. AI-режим в Поиске стал более визуальным и интерактивным, с динамическими макетами и даже моделированием на лету (да, маятниковая игрушка может появиться в ваших результатах). На мобильных устройствах теги SynthID помогают проверить изображения, сгенерированные Gemini, а Gemini в вебе теперь может подтягивать данные из Google Photos, чтобы обосновывать подсказки.

Для разработчиков экосистема засияла быстро: Weaviate выпустил нулевую миграцию RAG через Gemini API/Vertex, Replicate добавил мультимодальную конечную точку для быстрых испытаний, Zed IDE включила Gemini 3 Pro, и MagicPath продемонстрировал одностадийную генерацию изображения→сайта. Если вы опробуете агента, следуйте аналогичным у Google этапам подтверждения и регистрируйте каждый вызов инструмента; лимитная пропускная способность реальна, но спрос доказывает, что его легко насытить.

Feature Spotlight

Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google

Google выпускает Gemini 3 Pro и настольного Gemini Agent (Ultra, США). Контекст на 1 млн токенов, быстрые ответы и опубликованная карточка безопасности сигнализируют о готовности; увеличение лимита частоты запросов и ранние интеграции демонстрируют быстрое принятие экосистемы.

Сегодняшняя повестка дня доминируется Google Gemini 3 Pro и новым Gemini Agent: запуск ядра, карточка модели безопасности, повышение лимита частоты запросов и первые интеграции. Этот раздел посвящён развертыванию и доступности платформы; бенчмарки и инструменты сторонних разработчиков упоминаются в другом месте.

Jump to Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google topics

Table of Contents

Stay in the loop

Get the Daily AI Primer delivered straight to your inbox. One email per day, unsubscribe anytime.

Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google

Сегодняшняя повестка дня доминируется Google Gemini 3 Pro и новым Gemini Agent: запуск ядра, карточка модели безопасности, повышение лимита частоты запросов и первые интеграции. Этот раздел посвящён развертыванию и доступности платформы; бенчмарки и инструменты сторонних разработчиков упоминаются в другом месте.

DeepMind публикует отчет по безопасности Gemini 3 Pro; повышенное сопротивление к инъекциям.

DeepMind выпустила отчет Frontier Safety Framework для Gemini 3 Pro и карточку модели, подчеркивая более широкое тестирование в области CBRN/кибербезопасности, улучшенную устойчивость к инъекциям подсказок и управление состоянием использования инструментов model card, с подробностями в загружаемом PDF-файле FSF report. Особенно Gemini 3 Pro набрал 11 из 12 по самой сложной части их оценки кибербезопасности и продемонстрировал новую осведомлённость о «synthetic environment» во время тестов results highlights, включая ставшую вирусной анекдоту «virtual table flip» заметка поведения.

Поиск Google внедряет динамические макеты и симуляции на основе Gemini.

Google начал развёртывать динамические визуальные макеты под управлением Gemini в режиме AI — подумайте об ответах в журнальном стиле с интерактивными модулями и инструментами на лету, такими как физические симуляции демо маятника. Пользователи также видят более богатые, исследовательские маршруты и настраиваемые карточки на той же поверхности образцы макетов.

Weaviate активирует Gemini 3 через Gemini API/Vertex для векторных и RAG‑потоков

Weaviate подтвердил отсутствие миграционной поддержки Gemini 3 для Google Gemini API и Vertex AI, что позволяет агентному поиску и генерации RAG внутри своей стеки векторной базы данных integration note. Они также опубликовали руководство по пайплайнам SageMaker + Weaviate и единому студийному потоку для корпорати­вного RAG в масштабе Weaviate guide.

Агент Jules SWE запущен для Gemini Ultra; Slack и Live Preview находятся в разработке.

Кодовый агент Jules, работающий на Gemini, теперь доступен подписчикам Gemini Ultra, планируется более широкое внедрение Pro rollout note. Google также разрабатывает уведомления Slack/управление задачами для Jules и режим Live Preview, чтобы запускать и проверять результаты перед слиянием integrations plan.

Gemini web добавляет импорт Google Фото для контекста запроса

Gemini в вебе теперь позволяет импортировать Google Photos в качестве источника, что упрощает привязку подсказок к личным изображениям при суммировании поездок, извлечении деталей или создании альбомов опция импорта фотографий.

Replicate предлагает конечную точку Gemini 3 Pro с вводом изображений/видео/аудио

Gemini 3 Pro теперь работает на Replicate, поддерживая мультимодальный ввод (изображение, видео, аудио) для быстрых безсерверных экспериментов или размещённой инференции использование API. Это полезно для команд, тестирующих Gemini 3 без настройки проектов Vertex или Google Cloud сначала.

Stitch может экспортировать дизайны в AI Studio, чтобы запустить приложения Gemini.

Stitch теперь экспортирует UX‑дизайны напрямую в Google AI Studio, чтобы команды могли превращать макеты в Gemini‑powered приложения без длительного цикла передачи задач export demo. Это попадает в контекст планов для мобильного клиента приложения AI Studio, что указывает на растущую многоуровневую цепочку инструментов Gemini для приложений.

NotebookLM для iOS добавляет источники камеры и изображений, а также возобновление прогресса воспроизведения аудио

Приложение NotebookLM для iOS добавило камеры и загрузку изображений в качестве источников знаний и теперь сохраняет прогресс прослушивания в Аудиообзорах обновление функции. Для команд, экспериментирующих с помощниками для обучения или внутренних исследовательских ботов, это расширяет область ввода, не приходится возиться с облачными дисками.

Zed IDE добавляет поддержку модели Gemini 3 Pro

Zed выпустил v0.213.0 с поддержкой Gemini 3 Pro для Zed Pro и пользователей BYOK, наряду с улучшениями редактора, такими как липкая прокрутка и усовершенствованные фрагменты примечание к выпуску. Полный журнал изменений и настройка моделей находятся на странице стабильных релизов Zed стабильные релизы.

)

Как работает Gemini Agent: планирование шагов, подключённые приложения, подтверждения

Google изложила рабочую модель Gemini Agent: она разлагает задачи на меньшие шаги, может подключаться к Gmail и Calendar с разрешением, составляет черновики ответов и требует подтверждения перед высокорискованными действиями, такими как покупки feature explainer. Это ментальная модель для разработки подсказок, утверждений и журналирования вокруг корпоративного использования.


Развертывания передовых моделей: OpenAI, xAI и Deep Cogito

Сконцентрированный набор обновлений моделей, полезный для разработчиков: развёртывание GPT‑5.1 Pro от OpenAI и Codex‑Max для кодирования на длинной перспективе, Grok 4.1 Fast от xAI + API инструментов агента, и открытая модель Deep Cogito размером 671 млрд параметров. Gemini 3 исключается (раскрыт в разделе Особенности).

GPT‑5.1‑Codex‑Max становится Codex по умолчанию с миллион‑токенным сжатием и новыми SOTA‑показателями

OpenAI сделал GPT‑5.1‑Codex‑Max настройкой по умолчанию в Codex CLI, расширении IDE и облачных поверхностях, введя нативное «сжатие» so агенты могут урезать и сохранять контекст для стабильной работы через многомиллионные токены, 24‑часовые сессии cli update, OpenAI post. Он публикует 77.9% на SWE‑Bench Verified, 79.9% на SWE‑Lancer IC SWE и 58.1% на TerminalBench 2.0, при этом часто используя примерно на 30% меньше токенов мышления при среднем уровне усилий (так же pricing как и у предыдущего Codex) OpenAI post.

Внешние оценки: Codex‑Max достигает временного горизонта 2 ч 42 мин при 50% (METR), улучшается по сравнению с CVE‑Bench

Независимое тестирование ставит GPT‑5.1‑Codex‑Max примерно на 2 часа 42 минуты для метрики METR по времени достижения 50% успеха, и METR не прогнозирует модель катастрофического риска на примерно 6 месяцев на основе текущих тенденций metr report. Сообщества также демонстрируют более сильную производительность на CVE‑Bench, который исследует обнаружение реальных веб‑уязвимостей в песочнице cve-bench results. Некоторые пользователи отмечают, что запуск METR оказался дороже GPT‑5, — компромисс, который следует отслеживать в циклах агентов eval cost.

Почему это важно: помимо лидеров на таблицах результатов, эти оценки отслеживают, сохраняются ли агенты эффективными в течение часов и могут ли они безопасно обрабатывать живые, враждебные задачи — ключевые сигналы готовности к эксплуатации.

OpenAI выпускает GPT‑5.1 Pro для всех пользователей Pro.

OpenAI продвигала GPT‑5.1 Pro к Pro‑аккаунтам, обещая более ясные, более компетентные ответы на сложные задачи в сфере письма, науки о данных и бизнес‑задачах заметка по развёртыванию. Ранние пользователи сообщают, что это ощутимый шаг вперёд для глубокой работы; одна подробная рецензия оценивает рост примерно на 10–15% по сравнению с GPT‑5 Pro для их рабочих нагрузок обзорное обсуждение, обзорный пост.

xAI запускает Grok 4.1 Fast (2M контекст) и API инструментов агентов, бесплатно в течение двух недель на OpenRouter

xAI представила Grok 4.1 Fast с контекстом на 2 миллиона токенов и агентским API инструментов уровня продакшн (web/X поиск, выполнение Python, извлечение файлов, цитирования), доступный бесплатно две недели и маршрутизируемый через провайдеров OpenRouter launch thread, openrouter page. Модель нацелена на использование инструментов и рабочие процессы с длинным контекстом, и выпускает варианты «рассуждения» и «без рассуждений» launch thread, tools demo clip.

На открытых досках и мета‑оценках она ставит 64 в Intelligence Index от Artificial Analysis и обходит τ²‑Bench Telecom на 93.3%, выполняя набор AA за ~$45 (71M токенов) pareto analysis, benchmarks details. Vals AI фиксирует скачок с #10→#8 в Vals Index и рост финансового агента с 37%→44% vals index. Это выходит после веб‑беты Grok 4.1 и продвижения позиций в рейтингах web beta.

Почему это важно: недорогая, с длинным окном, модель вызова инструментов расширяет стек агентов — полезно для бюджетно‑чувствительных конвейеров и задач, которые зависят от поиска, просмотра в сети или скриптовых действий.

Deep Cogito выпускает 671B Cogito с открытым весом v2.1; инференс за $1,25 за тысячу токенов на Together

Новая модель с открытым весом от Deep Cogito, Cogito v2.1 671B, запущена с гибридным рассуждением, окном контекста 128K, встроенным вызовом инструментов и API, совместимым с OpenAI. Together AI публикует цены примерно $1.25 за 1M токенов; сообщенные результаты включают AIME‑2025 89.47%, MATH‑500 98.57% и GPQA Diamond 77.72% при низком среднем использовании токенов together post. Также доступна через библиотеку моделей Baseten и появляется в экосистемах Ollama/Kimi‑связанными и в сообществах (топ-10 открытого исходного кода на WebDev) baseten page, ollama library, arena webdev.

Почему это важно: очень крупная модель с открытым весом, лицензированная MIT, представляет командам достоверную альтернативу закрытым моделям для задач математики/кодирования с выгодной экономикой по единицам и несколькими вариантами размещения.


Stay first in your field.

No more doomscrolling X. A crisp morning report for entrepreneurs, AI creators, and engineers. Clear updates, time-sensitive offers, and working pipelines that keep you on the cutting edge. We read the firehose and hand-pick what matters so you can act today.

I don’t have time to scroll X all day. Primer does it, filters it, done.

Renee J.

Startup Founder

The fastest way to stay professionally expensive.

Felix B.

AI Animator

AI moves at ‘blink and it’s gone’. Primer is how I don’t blink.

Alex T.

Creative Technologist

Best ROI on ten minutes of my day. I’ve shipped two features purely from their daily prompts.

Marta S.

Product Designer

From release noise to a working workflow in 15 minutes.

Viktor H

AI Artist

It’s the only digest that explains why a release matters and shows how to use it—same page, same morning.

Priya R.

Startup Founder

Stay professionally expensive

Make the right move sooner

Ship a product

WebEmailTelegram

On this page

Executive Summary
Feature Spotlight: Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google
🛠️ Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google
DeepMind публикует отчет по безопасности Gemini 3 Pro; повышенное сопротивление к инъекциям.
Поиск Google внедряет динамические макеты и симуляции на основе Gemini.
Weaviate активирует Gemini 3 через Gemini API/Vertex для векторных и RAG‑потоков
Агент Jules SWE запущен для Gemini Ultra; Slack и Live Preview находятся в разработке.
Gemini web добавляет импорт Google Фото для контекста запроса
Replicate предлагает конечную точку Gemini 3 Pro с вводом изображений/видео/аудио
Stitch может экспортировать дизайны в AI Studio, чтобы запустить приложения Gemini.
NotebookLM для iOS добавляет источники камеры и изображений, а также возобновление прогресса воспроизведения аудио
Zed IDE добавляет поддержку модели Gemini 3 Pro
Как работает Gemini Agent: планирование шагов, подключённые приложения, подтверждения
🧬 Развертывания передовых моделей: OpenAI, xAI и Deep Cogito
GPT‑5.1‑Codex‑Max становится Codex по умолчанию с миллион‑токенным сжатием и новыми SOTA‑показателями
Внешние оценки: Codex‑Max достигает временного горизонта 2 ч 42 мин при 50% (METR), улучшается по сравнению с CVE‑Bench
OpenAI выпускает GPT‑5.1 Pro для всех пользователей Pro.
xAI запускает Grok 4.1 Fast (2M контекст) и API инструментов агентов, бесплатно в течение двух недель на OpenRouter
Deep Cogito выпускает 671B Cogito с открытым весом v2.1; инференс за $1,25 за тысячу токенов на Together
👨‍💻 Агентные стеки разработки: Codex CLI, Warp Agents 3.0, Cline, OpenCode
Codex принимает GPT‑5.1‑Codex‑Max; рабочие процессы в Windows и поиск восстановлены
Warp Agents 3.0 приносит интерактивные REPL-среды, отладчики и планы, ориентированные на спецификацию.
Cline добавляет Gemini 3 Pro и более точное преобразование речи в код
Использование Gemini 3 от OpenCode резко возросло после увеличения лимита в пять раз.
RepoPrompt охватывает несколько репозиториев и принимает Codex‑Max
Code Wiki поясняет незнакомые репозитории для контрибьюторов
Обновления Crush: поддержка Gemini 3 и хук планирования кода
📊 Таблицы лидеров и оценки: приросты Grok, нюанс LiveBench, обновление METR
Grok 4.1 Fast опережает τ²-Telecom, набирает 64 балла в AA Intelligence Index при стоимости оценки около $45
METR: GPT‑5.1‑Codex‑Max достигает приблизительно 2 ч 42 мин временного горизонта при 50% вероятности успеха; ожидается отсутствие модели с катастрофическим риском примерно в течение 6 месяцев.
Grok 4.1 Быстро поднимается по Vals Index до №8; рейтинг Finance Agent повышается до 44%
LiveBench: Gemini 3 обходит GPT‑5 в целом; Claude 4.5 лидирует в кодировании/агентности — но различия в пределах погрешности.
Арена: GPT‑5.1‑high поднимается на #3 в рейтинге Expert, #4 в рейтинге Text
Arena WebDev: Cogito v2.1 вошёл в топ‑10 проектов с открытым исходным кодом и делит 18‑е место в общем рейтинге.
🏗️ Развертывание вычислительных мощностей для ИИ: NVIDIA превзошла ожидания, Grok DC 500 МВт, гипермасштабные мощности
NVIDIA публикует выручку в 57,01 млрд долл.; прогнозирует примерно 65 млрд долл.; дата-центр достигает примерно 51,2 млрд долл.
Anthropic обеспечивает $30 млрд вычислительных мощностей в Azure, сотрудничает с NVIDIA; Claude расширяется на Microsoft
xAI построит дата-центр для ИИ в Саудовской Аравии мощностью 500 МВт на аппаратном обеспечении NVIDIA.
Brookfield создаёт программу инфраструктуры ИИ на 100 млрд долларов с чертежом DSX от NVIDIA.
Lambda привлекает свыше 1,5 млрд долл., заключает много-миллиардную сделку Microsoft по GPU; строит собственные дата-центры.
Epoch картирует мегадата-центры; Meta Hyperion прогнозирует примерно в 4 раза больше Центрального парка
🛡️ Безопасность и управление: утечка агентов и федеральное верховенство закона
Исследователи предупреждают об угрозе утечки данных в IDE Antigravity через загрузку изображений в Markdown
Черновой указ Белого дома обошёл бы правила штатов в области искусственного интеллекта и наделил бы Минюст полномочиями возбуждать иски.
Factory AI внедряет AIRS от Palo Alto для сканирования запросов и вызовов инструментов в реальном времени.
💼 Корпоративные шаги: Perplexity–US Gov, Udio–Warner, платформы для создателей
Anthropic подписывает сделку на $30 млрд по вычислениям в Azure, становится партнером NVIDIA; Claude входит в стек Microsoft.
Perplexity обеспечивает безопасность канала GSA с Enterprise Pro для правительства
Cloudflare приобретает Replicate, чтобы интегрировать инференс открытых моделей в Workers AI
Factory AI интегрирует AIRS от Palo Alto для сканирования агентов на риски инъекции подсказок.
OpenAI запускает ChatGPT для учителей, бесплатно для школ США K–12 до июня 2027 года
Udio сотрудничает с Warner Music; инструменты для создателей остаются доступными
Midjourney запускает профили пользователей; 5 бесплатных часов быстрой настройки на начальном этапе.
Perplexity добавляет оформление через PayPal для покупок на платформе
🧾 RAG и повторная ранжировка в продакшене
ZeroEntropy выпускает переранжировщик zerank‑2 с многоязычной поддержкой и улучшениями в следовании инструкциям
Perplexity превращает ответы в редактируемые Docs/Slides/Sheets
LlamaCloud улучшает разбор сложных таблиц для надёжной загрузки данных в RAG
OpenRouter выпускает 13 новых эмбеддингов для RAG
Автоматизация документов получает первоклассные трассировки и хуки eval
Быстрое создание корпуса для RAG с помощью сбора данных за два клика
🎨 Видение и креативные стеки: SAM3, Nano Banana Pro, Поисковые интерфейсы
Meta выпускает SAM 3 с текстовыми подсказками, видеоотслеживанием, демонстрацией WebGPU и поддержкой Transformers.
Поиск на базе Gemini теперь генерирует динамические визуальные инструменты и макеты в стиле журнала
«Nano Banana Pro» утечки показывают генерацию изображений в 4K и продвинутую отрисовку текста во всех приложениях Google
Gemini 3 генерирует мини‑игры YouTube Playables из подсказок и нескольких изображений.
Воспроизведите хосты моделей Retro Diffusion для спрайтов, тайлсетов и рабочих процессов пиксельного искусства.
ImagineArt добавляет Video Upscale; создатели могут повысить качество клипов в приложении
🦾 Роботы в производстве: карта показателей BMW от Figure
Гуманоид Figure публикует KPI завода BMW через 11 месяцев
🗣️ Голосовые интерфейсы для инженеров
Cline 3.38.0 приносит Avalon STT в кодирование с точностью жаргона 97,4%.
ElevenLabs задаёт дорожную карту, ориентированную на голос: платформа агентов и творческая платформа
Исследовательская демонстрация: проактивные слуховые помощники изолируют ваш разговор в шуме