Google Gemini 3 Pro достигает Search и мобильного — лимиты API растут в 5×, 20 млрд токенов в день

Stay in the loop

Free daily newsletter & Telegram daily report

Executive Summary

Google расширил Gemini 3 Pro по большей части стека и включил Gemini Agent для Ultra-пользователей на настольных устройствах в США. Почему это важно: пропускная способность и безопасность оба выросли. Пределы внешних API поднялись примерно в 5 раз, и один оператор обработал 20 млрд токенов за день, прежде чем снова столкнулся с лимитами. Карта безопасности DeepMind указывает на более сильную устойчивость к промпт‑инжекции и рейтинг 11/12 по самому сложному сегменту своей оценки кибербезопасности, плюс управление состоянием при использовании инструментов.

История агента прагматична. Он разлагает задачи, подключается к Gmail и Calendar с согласием, составляет черновики ответов и требует подтверждений для рискованных действий, таких как покупки. AI-режим в Поиске стал более визуальным и интерактивным, с динамическими макетами и даже моделированием на лету (да, маятниковая игрушка может появиться в ваших результатах). На мобильных устройствах теги SynthID помогают проверить изображения, сгенерированные Gemini, а Gemini в вебе теперь может подтягивать данные из Google Photos, чтобы обосновывать подсказки.

Для разработчиков экосистема засияла быстро: Weaviate выпустил нулевую миграцию RAG через Gemini API/Vertex, Replicate добавил мультимодальную конечную точку для быстрых испытаний, Zed IDE включила Gemini 3 Pro, и MagicPath продемонстрировал одностадийную генерацию изображения→сайта. Если вы опробуете агента, следуйте аналогичным у Google этапам подтверждения и регистрируйте каждый вызов инструмента; лимитная пропускная способность реальна, но спрос доказывает, что его легко насытить.

Feature Spotlight

Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google

Google выпускает Gemini 3 Pro и настольного Gemini Agent (Ultra, США). Контекст на 1 млн токенов, быстрые ответы и опубликованная карточка безопасности сигнализируют о готовности; увеличение лимита частоты запросов и ранние интеграции демонстрируют быстрое принятие экосистемы.

Сегодняшняя повестка дня доминируется Google Gemini 3 Pro и новым Gemini Agent: запуск ядра, карточка модели безопасности, повышение лимита частоты запросов и первые интеграции. Этот раздел посвящён развертыванию и доступности платформы; бенчмарки и инструменты сторонних разработчиков упоминаются в другом месте.

Jump to Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google topics

🛠️ Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google

DeepMind публикует отчет по безопасности Gemini 3 Pro; повышенное сопротивление к инъекциям.

DeepMind выпустила отчет Frontier Safety Framework для Gemini 3 Pro и карточку модели, подчеркивая более широкое тестирование в области CBRN/кибербезопасности, улучшенную устойчивость к инъекциям подсказок и управление состоянием использования инструментов model card, с подробностями в загружаемом PDF-файле FSF report. Особенно Gemini 3 Pro набрал 11 из 12 по самой сложной части их оценки кибербезопасности и продемонстрировал новую осведомлённость о «synthetic environment» во время тестов results highlights, включая ставшую вирусной анекдоту «virtual table flip» заметка поведения.

Google Gemini 3 Pro достигает Search и мобильного — лимиты API растут в 5×, 20 млрд токенов в день

Executive Summary

Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google

Table of Contents

🛠️ Функция: Gemini 3 Pro и Agent появляются на разных поверхностях Google

DeepMind публикует отчет по безопасности Gemini 3 Pro; повышенное сопротивление к инъекциям.

Поиск Google внедряет динамические макеты и симуляции на основе Gemini.

Weaviate активирует Gemini 3 через Gemini API/Vertex для векторных и RAG‑потоков

Агент Jules SWE запущен для Gemini Ultra; Slack и Live Preview находятся в разработке.

Gemini web добавляет импорт Google Фото для контекста запроса

Replicate предлагает конечную точку Gemini 3 Pro с вводом изображений/видео/аудио

Stitch может экспортировать дизайны в AI Studio, чтобы запустить приложения Gemini.

NotebookLM для iOS добавляет источники камеры и изображений, а также возобновление прогресса воспроизведения аудио

Zed IDE добавляет поддержку модели Gemini 3 Pro

Как работает Gemini Agent: планирование шагов, подключённые приложения, подтверждения

🧬 Развертывания передовых моделей: OpenAI, xAI и Deep Cogito

GPT‑5.1‑Codex‑Max становится Codex по умолчанию с миллион‑токенным сжатием и новыми SOTA‑показателями

Внешние оценки: Codex‑Max достигает временного горизонта 2 ч 42 мин при 50% (METR), улучшается по сравнению с CVE‑Bench

OpenAI выпускает GPT‑5.1 Pro для всех пользователей Pro.

xAI запускает Grok 4.1 Fast (2M контекст) и API инструментов агентов, бесплатно в течение двух недель на OpenRouter

Deep Cogito выпускает 671B Cogito с открытым весом v2.1; инференс за $1,25 за тысячу токенов на Together

👨‍💻 Агентные стеки разработки: Codex CLI, Warp Agents 3.0, Cline, OpenCode

Codex принимает GPT‑5.1‑Codex‑Max; рабочие процессы в Windows и поиск восстановлены

Warp Agents 3.0 приносит интерактивные REPL-среды, отладчики и планы, ориентированные на спецификацию.

Cline добавляет Gemini 3 Pro и более точное преобразование речи в код

Использование Gemini 3 от OpenCode резко возросло после увеличения лимита в пять раз.

RepoPrompt охватывает несколько репозиториев и принимает Codex‑Max

Code Wiki поясняет незнакомые репозитории для контрибьюторов

Обновления Crush: поддержка Gemini 3 и хук планирования кода

📊 Таблицы лидеров и оценки: приросты Grok, нюанс LiveBench, обновление METR

Grok 4.1 Fast опережает τ²-Telecom, набирает 64 балла в AA Intelligence Index при стоимости оценки около $45

Grok 4.1 Быстро поднимается по Vals Index до №8; рейтинг Finance Agent повышается до 44%

LiveBench: Gemini 3 обходит GPT‑5 в целом; Claude 4.5 лидирует в кодировании/агентности — но различия в пределах погрешности.

Арена: GPT‑5.1‑high поднимается на #3 в рейтинге Expert, #4 в рейтинге Text

Arena WebDev: Cogito v2.1 вошёл в топ‑10 проектов с открытым исходным кодом и делит 18‑е место в общем рейтинге.

🏗️ Развертывание вычислительных мощностей для ИИ: NVIDIA превзошла ожидания, Grok DC 500 МВт, гипермасштабные мощности

NVIDIA публикует выручку в 57,01 млрд долл.; прогнозирует примерно 65 млрд долл.; дата-центр достигает примерно 51,2 млрд долл.

Anthropic обеспечивает $30 млрд вычислительных мощностей в Azure, сотрудничает с NVIDIA; Claude расширяется на Microsoft

xAI построит дата-центр для ИИ в Саудовской Аравии мощностью 500 МВт на аппаратном обеспечении NVIDIA.

Brookfield создаёт программу инфраструктуры ИИ на 100 млрд долларов с чертежом DSX от NVIDIA.

Lambda привлекает свыше 1,5 млрд долл., заключает много-миллиардную сделку Microsoft по GPU; строит собственные дата-центры.

Epoch картирует мегадата-центры; Meta Hyperion прогнозирует примерно в 4 раза больше Центрального парка

🛡️ Безопасность и управление: утечка агентов и федеральное верховенство закона

Исследователи предупреждают об угрозе утечки данных в IDE Antigravity через загрузку изображений в Markdown

Черновой указ Белого дома обошёл бы правила штатов в области искусственного интеллекта и наделил бы Минюст полномочиями возбуждать иски.

Factory AI внедряет AIRS от Palo Alto для сканирования запросов и вызовов инструментов в реальном времени.

💼 Корпоративные шаги: Perplexity–US Gov, Udio–Warner, платформы для создателей

Anthropic подписывает сделку на $30 млрд по вычислениям в Azure, становится партнером NVIDIA; Claude входит в стек Microsoft.

Perplexity обеспечивает безопасность канала GSA с Enterprise Pro для правительства

Cloudflare приобретает Replicate, чтобы интегрировать инференс открытых моделей в Workers AI

Factory AI интегрирует AIRS от Palo Alto для сканирования агентов на риски инъекции подсказок.

OpenAI запускает ChatGPT для учителей, бесплатно для школ США K–12 до июня 2027 года

Udio сотрудничает с Warner Music; инструменты для создателей остаются доступными

Midjourney запускает профили пользователей; 5 бесплатных часов быстрой настройки на начальном этапе.

Perplexity добавляет оформление через PayPal для покупок на платформе

🧾 RAG и повторная ранжировка в продакшене

ZeroEntropy выпускает переранжировщик zerank‑2 с многоязычной поддержкой и улучшениями в следовании инструкциям

Perplexity превращает ответы в редактируемые Docs/Slides/Sheets

LlamaCloud улучшает разбор сложных таблиц для надёжной загрузки данных в RAG

OpenRouter выпускает 13 новых эмбеддингов для RAG

Автоматизация документов получает первоклассные трассировки и хуки eval

Быстрое создание корпуса для RAG с помощью сбора данных за два клика

🎨 Видение и креативные стеки: SAM3, Nano Banana Pro, Поисковые интерфейсы

Meta выпускает SAM 3 с текстовыми подсказками, видеоотслеживанием, демонстрацией WebGPU и поддержкой Transformers.

Поиск на базе Gemini теперь генерирует динамические визуальные инструменты и макеты в стиле журнала

«Nano Banana Pro» утечки показывают генерацию изображений в 4K и продвинутую отрисовку текста во всех приложениях Google

Gemini 3 генерирует мини‑игры YouTube Playables из подсказок и нескольких изображений.

Воспроизведите хосты моделей Retro Diffusion для спрайтов, тайлсетов и рабочих процессов пиксельного искусства.

ImagineArt добавляет Video Upscale; создатели могут повысить качество клипов в приложении

🦾 Роботы в производстве: карта показателей BMW от Figure

Гуманоид Figure публикует KPI завода BMW через 11 месяцев

🗣️ Голосовые интерфейсы для инженеров

Cline 3.38.0 приносит Avalon STT в кодирование с точностью жаргона 97,4%.

ElevenLabs задаёт дорожную карту, ориентированную на голос: платформа агентов и творческая платформа

Исследовательская демонстрация: проактивные слуховые помощники изолируют ваш разговор в шуме

On this page