Google Gemini 3 Pro достигает Search и мобильного — лимиты API растут в 5×, 20 млрд токенов в день
Executive Summary
Google расширил Gemini 3 Pro по большей части стека и включил Gemini Agent для Ultra-пользователей на настольных устройствах в США. Почему это важно: пропускная способность и безопасность оба выросли. Пределы внешних API поднялись примерно в 5 раз, и один оператор обработал 20 млрд токенов за день, прежде чем снова столкнулся с лимитами. Карта безопасности DeepMind указывает на более сильную устойчивость к промпт‑инжекции и рейтинг 11/12 по самому сложному сегменту своей оценки кибербезопасности, плюс управление состоянием при использовании инструментов.
История агента прагматична. Он разлагает задачи, подключается к Gmail и Calendar с согласием, составляет черновики ответов и требует подтверждений для рискованных действий, таких как покупки. AI-режим в Поиске стал более визуальным и интерактивным, с динамическими макетами и даже моделированием на лету (да, маятниковая игрушка может появиться в ваших результатах). На мобильных устройствах теги SynthID помогают проверить изображения, сгенерированные Gemini, а Gemini в вебе теперь может подтягивать данные из Google Photos, чтобы обосновывать подсказки.
Для разработчиков экосистема засияла быстро: Weaviate выпустил нулевую миграцию RAG через Gemini API/Vertex, Replicate добавил мультимодальную конечную точку для быстрых испытаний, Zed IDE включила Gemini 3 Pro, и MagicPath продемонстрировал одностадийную генерацию изображения→сайта. Если вы опробуете агента, следуйте аналогичным у Google этапам подтверждения и регистрируйте каждый вызов инструмента; лимитная пропускная способность реальна, но спрос доказывает, что его легко насытить.
Feature Spotlight
Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google
Google выпускает Gemini 3 Pro и настольного Gemini Agent (Ultra, США). Контекст на 1 млн токенов, быстрые ответы и опубликованная карточка безопасности сигнализируют о готовности; увеличение лимита частоты запросов и ранние интеграции демонстрируют быстрое принятие экосистемы.
Сегодняшняя повестка дня доминируется Google Gemini 3 Pro и новым Gemini Agent: запуск ядра, карточка модели безопасности, повышение лимита частоты запросов и первые интеграции. Этот раздел посвящён развертыванию и доступности платформы; бенчмарки и инструменты сторонних разработчиков упоминаются в другом месте.
Jump to Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google topicsTable of Contents
Stay in the loop
Get the Daily AI Primer delivered straight to your inbox. One email per day, unsubscribe anytime.
Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google
Сегодняшняя повестка дня доминируется Google Gemini 3 Pro и новым Gemini Agent: запуск ядра, карточка модели безопасности, повышение лимита частоты запросов и первые интеграции. Этот раздел посвящён развертыванию и доступности платформы; бенчмарки и инструменты сторонних разработчиков упоминаются в другом месте.
DeepMind публикует отчет по безопасности Gemini 3 Pro; повышенное сопротивление к инъекциям.
DeepMind выпустила отчет Frontier Safety Framework для Gemini 3 Pro и карточку модели, подчеркивая более широкое тестирование в области CBRN/кибербезопасности, улучшенную устойчивость к инъекциям подсказок и управление состоянием использования инструментов model card, с подробностями в загружаемом PDF-файле FSF report. Особенно Gemini 3 Pro набрал 11 из 12 по самой сложной части их оценки кибербезопасности и продемонстрировал новую осведомлённость о «synthetic environment» во время тестов results highlights, включая ставшую вирусной анекдоту «virtual table flip» заметка поведения.
Поиск Google внедряет динамические макеты и симуляции на основе Gemini.
Google начал развёртывать динамические визуальные макеты под управлением Gemini в режиме AI — подумайте об ответах в журнальном стиле с интерактивными модулями и инструментами на лету, такими как физические симуляции демо маятника. Пользователи также видят более богатые, исследовательские маршруты и настраиваемые карточки на той же поверхности образцы макетов.
Weaviate активирует Gemini 3 через Gemini API/Vertex для векторных и RAG‑потоков
Weaviate подтвердил отсутствие миграционной поддержки Gemini 3 для Google Gemini API и Vertex AI, что позволяет агентному поиску и генерации RAG внутри своей стеки векторной базы данных integration note. Они также опубликовали руководство по пайплайнам SageMaker + Weaviate и единому студийному потоку для корпоративного RAG в масштабе Weaviate guide.
Агент Jules SWE запущен для Gemini Ultra; Slack и Live Preview находятся в разработке.
Кодовый агент Jules, работающий на Gemini, теперь доступен подписчикам Gemini Ultra, планируется более широкое внедрение Pro rollout note. Google также разрабатывает уведомления Slack/управление задачами для Jules и режим Live Preview, чтобы запускать и проверять результаты перед слиянием integrations plan.
Gemini web добавляет импорт Google Фото для контекста запроса
Gemini в вебе теперь позволяет импортировать Google Photos в качестве источника, что упрощает привязку подсказок к личным изображениям при суммировании поездок, извлечении деталей или создании альбомов опция импорта фотографий.
Replicate предлагает конечную точку Gemini 3 Pro с вводом изображений/видео/аудио
Gemini 3 Pro теперь работает на Replicate, поддерживая мультимодальный ввод (изображение, видео, аудио) для быстрых безсерверных экспериментов или размещённой инференции использование API. Это полезно для команд, тестирующих Gemini 3 без настройки проектов Vertex или Google Cloud сначала.
Stitch может экспортировать дизайны в AI Studio, чтобы запустить приложения Gemini.
Stitch теперь экспортирует UX‑дизайны напрямую в Google AI Studio, чтобы команды могли превращать макеты в Gemini‑powered приложения без длительного цикла передачи задач export demo. Это попадает в контекст планов для мобильного клиента приложения AI Studio, что указывает на растущую многоуровневую цепочку инструментов Gemini для приложений.
NotebookLM для iOS добавляет источники камеры и изображений, а также возобновление прогресса воспроизведения аудио
Приложение NotebookLM для iOS добавило камеры и загрузку изображений в качестве источников знаний и теперь сохраняет прогресс прослушивания в Аудиообзорах обновление функции. Для команд, экспериментирующих с помощниками для обучения или внутренних исследовательских ботов, это расширяет область ввода, не приходится возиться с облачными дисками.
Zed IDE добавляет поддержку модели Gemini 3 Pro
Zed выпустил v0.213.0 с поддержкой Gemini 3 Pro для Zed Pro и пользователей BYOK, наряду с улучшениями редактора, такими как липкая прокрутка и усовершенствованные фрагменты примечание к выпуску. Полный журнал изменений и настройка моделей находятся на странице стабильных релизов Zed стабильные релизы.
)
Как работает Gemini Agent: планирование шагов, подключённые приложения, подтверждения
Google изложила рабочую модель Gemini Agent: она разлагает задачи на меньшие шаги, может подключаться к Gmail и Calendar с разрешением, составляет черновики ответов и требует подтверждения перед высокорискованными действиями, такими как покупки feature explainer. Это ментальная модель для разработки подсказок, утверждений и журналирования вокруг корпоративного использования.
Развертывания передовых моделей: OpenAI, xAI и Deep Cogito
Сконцентрированный набор обновлений моделей, полезный для разработчиков: развёртывание GPT‑5.1 Pro от OpenAI и Codex‑Max для кодирования на длинной перспективе, Grok 4.1 Fast от xAI + API инструментов агента, и открытая модель Deep Cogito размером 671 млрд параметров. Gemini 3 исключается (раскрыт в разделе Особенности).
GPT‑5.1‑Codex‑Max становится Codex по умолчанию с миллион‑токенным сжатием и новыми SOTA‑показателями
OpenAI сделал GPT‑5.1‑Codex‑Max настройкой по умолчанию в Codex CLI, расширении IDE и облачных поверхностях, введя нативное «сжатие» so агенты могут урезать и сохранять контекст для стабильной работы через многомиллионные токены, 24‑часовые сессии cli update, OpenAI post. Он публикует 77.9% на SWE‑Bench Verified, 79.9% на SWE‑Lancer IC SWE и 58.1% на TerminalBench 2.0, при этом часто используя примерно на 30% меньше токенов мышления при среднем уровне усилий (так же pricing как и у предыдущего Codex) OpenAI post.
Внешние оценки: Codex‑Max достигает временного горизонта 2 ч 42 мин при 50% (METR), улучшается по сравнению с CVE‑Bench
Независимое тестирование ставит GPT‑5.1‑Codex‑Max примерно на 2 часа 42 минуты для метрики METR по времени достижения 50% успеха, и METR не прогнозирует модель катастрофического риска на примерно 6 месяцев на основе текущих тенденций metr report. Сообщества также демонстрируют более сильную производительность на CVE‑Bench, который исследует обнаружение реальных веб‑уязвимостей в песочнице cve-bench results. Некоторые пользователи отмечают, что запуск METR оказался дороже GPT‑5, — компромисс, который следует отслеживать в циклах агентов eval cost.
Почему это важно: помимо лидеров на таблицах результатов, эти оценки отслеживают, сохраняются ли агенты эффективными в течение часов и могут ли они безопасно обрабатывать живые, враждебные задачи — ключевые сигналы готовности к эксплуатации.
OpenAI выпускает GPT‑5.1 Pro для всех пользователей Pro.
OpenAI продвигала GPT‑5.1 Pro к Pro‑аккаунтам, обещая более ясные, более компетентные ответы на сложные задачи в сфере письма, науки о данных и бизнес‑задачах заметка по развёртыванию. Ранние пользователи сообщают, что это ощутимый шаг вперёд для глубокой работы; одна подробная рецензия оценивает рост примерно на 10–15% по сравнению с GPT‑5 Pro для их рабочих нагрузок обзорное обсуждение, обзорный пост.
xAI запускает Grok 4.1 Fast (2M контекст) и API инструментов агентов, бесплатно в течение двух недель на OpenRouter
xAI представила Grok 4.1 Fast с контекстом на 2 миллиона токенов и агентским API инструментов уровня продакшн (web/X поиск, выполнение Python, извлечение файлов, цитирования), доступный бесплатно две недели и маршрутизируемый через провайдеров OpenRouter launch thread, openrouter page. Модель нацелена на использование инструментов и рабочие процессы с длинным контекстом, и выпускает варианты «рассуждения» и «без рассуждений» launch thread, tools demo clip.
На открытых досках и мета‑оценках она ставит 64 в Intelligence Index от Artificial Analysis и обходит τ²‑Bench Telecom на 93.3%, выполняя набор AA за ~$45 (71M токенов) pareto analysis, benchmarks details. Vals AI фиксирует скачок с #10→#8 в Vals Index и рост финансового агента с 37%→44% vals index. Это выходит после веб‑беты Grok 4.1 и продвижения позиций в рейтингах web beta.
Почему это важно: недорогая, с длинным окном, модель вызова инструментов расширяет стек агентов — полезно для бюджетно‑чувствительных конвейеров и задач, которые зависят от поиска, просмотра в сети или скриптовых действий.
Deep Cogito выпускает 671B Cogito с открытым весом v2.1; инференс за $1,25 за тысячу токенов на Together
Новая модель с открытым весом от Deep Cogito, Cogito v2.1 671B, запущена с гибридным рассуждением, окном контекста 128K, встроенным вызовом инструментов и API, совместимым с OpenAI. Together AI публикует цены примерно $1.25 за 1M токенов; сообщенные результаты включают AIME‑2025 89.47%, MATH‑500 98.57% и GPQA Diamond 77.72% при низком среднем использовании токенов together post. Также доступна через библиотеку моделей Baseten и появляется в экосистемах Ollama/Kimi‑связанными и в сообществах (топ-10 открытого исходного кода на WebDev) baseten page, ollama library, arena webdev.
Почему это важно: очень крупная модель с открытым весом, лицензированная MIT, представляет командам достоверную альтернативу закрытым моделям для задач математики/кодирования с выгодной экономикой по единицам и несколькими вариантами размещения.

Stay first in your field.
No more doomscrolling X. A crisp morning report for entrepreneurs, AI creators, and engineers. Clear updates, time-sensitive offers, and working pipelines that keep you on the cutting edge. We read the firehose and hand-pick what matters so you can act today.
I don’t have time to scroll X all day. Primer does it, filters it, done.
Renee J.
Startup Founder
The fastest way to stay professionally expensive.
Felix B.
AI Animator
AI moves at ‘blink and it’s gone’. Primer is how I don’t blink.
Alex T.
Creative Technologist
Best ROI on ten minutes of my day. I’ve shipped two features purely from their daily prompts.
Marta S.
Product Designer
From release noise to a working workflow in 15 minutes.
Viktor H
AI Artist
It’s the only digest that explains why a release matters and shows how to use it—same page, same morning.
Priya R.
Startup Founder
Stay professionally expensive
Make the right move sooner
Ship a product