Gemini 3 Pro поддерживает контекст в 1 млн токенов, 1501 Elo — TPU и IDEs выходят на полную мощность
Executive Summary
Gemini 3 Pro наконец стал официальным, а не утекал через подсказки в интерфейсе, и он становится новым мозгом Google по умолчанию повсюду: приложение, API, Поиск и Vertex. Превью открывает окно на 1 048 576 токенов, до 65 536 выходных токенов, и поэтапное ценообразование от $2/$12 до $4/$18 за миллион токенов в зависимости от размера контекста. Ранние тесты скорости показывают ~128 токенов/с, так что вы получаете более крупный мозг без доплаты за задержку.
По результатам эвалюций Gemini 3 Pro подскакивает до 1501 Elo на вершине LMArena, опережает WebDev и Design Arenas, и набирает 73 в Intelligence Index от Artificial Analysis, одновременно доминируя в длинноконтекстных MRCR-сессиях до 128k токенов. Deep Think, более тяжелый режим рассуждений, набирает 93,8% на GPQA Diamond и 41% на Humanity’s Last Exam, но пока доступен только исследовательским партнёрам.
Тем временем новое руководство для разработчиков разоблачает настройки вроде thinking_level, media_resolution и сигнатуры мышления, чтобы можно было обменивать вычисления на надёжность вместо того, чтобы молиться богам подсказок.
Реакция экосистемы была мгновенной: Antigravity запускается как бесплатная агентная IDE, Vercel, Cursor, Zed, Cline и Ollama интегрируют Gemini 3, а OpenRouter сообщает миллиарды токенов в первый день. Но загвоздка в том, что новая ветка взлома показывает, что он всё ещё охотно пройдет через нелегальные инструкции «how-to», поэтому обёртка логики и защитные механизмы не являются необязательными.
Feature Spotlight
Особенность: Gemini 3 Pro от Google и IDE Antigravity появляются
Google выпускает Gemini 3 Pro и Antigravity IDE: 1M ctx, агентское кодирование в редакторе/терминале/браузере и ценообразование $2/$12 за каждый млн токенов — устанавливая новый ориентир продукта и стратегии выхода на рынок для передовых моделей.
Сегодняшняя доминирующая история: Google выпускает Gemini 3 Pro и агент‑ориентированную IDE Antigravity. Широкая доступность продукта, ценообразование и новая агентская поверхность кодирования привлекли большую часть трафика; твиты также намекают на режим Deep Think. Этот раздел охватывает сам запуск; оценка на последующих этапах, интеграции и влияние на предприятия исключены и будут рассмотрены отдельно.
Jump to Особенность: Gemini 3 Pro от Google и IDE Antigravity появляются topicsTable of Contents
Stay in the loop
Get the Daily AI Primer delivered straight to your inbox. One email per day, unsubscribe anytime.
Особенность: Gemini 3 Pro от Google и IDE Antigravity появляются
Сегодняшняя доминирующая история: Google выпускает Gemini 3 Pro и агент‑ориентированную IDE Antigravity. Широкая доступность продукта, ценообразование и новая агентская поверхность кодирования привлекли большую часть трафика; твиты также намекают на режим Deep Think. Этот раздел охватывает сам запуск; оценка на последующих этапах, интеграции и влияние на предприятия исключены и будут рассмотрены отдельно.
Gemini 3 Pro распространяется широко по экосистеме Google.
Google официально запустил Gemini 3 Pro как новую флагманскую модель, включив доступ в приложении Gemini, режим AI в Google Search, Google AI Studio и Vertex AI, после недель намеков на скорый выпуск release window. Она позиционируется как «самая интеллектуальная модель» Google с контекстом на 1M токенов, мультимодальными входами (текст, изображения, аудио, видео) и акцентом на рассуждения и агентное кодирование, и уже доступна для многих пользователей, которые выбирают новый режим «Thinking» в веб/приложении Gemini UI Gemini 3 thread thinking mode rollout. Для разработчиков это означает, что та же основная модель теперь питает потребительский чат, ответы на запросы и облачные API, что должно сделать поведение более последовательным на разных UX-платформах и уменьшить необходимость juggling разных семейств Gemini launch overview.
Antigravity дебютирует как бесплатный агентский IDE от Google, работающий на Gemini 3 Pro
Наряду с моделью Google DeepMind выпустила Google Antigravity, IDE в стиле VS Code, в которое встроены агенты, которые могут управлять редактором, терминалом и браузерным субагентом для тестирования приложений от начала до конца анонс antigravity пост в блоге antigravity. При этом отдельный план «публичного предварительного просмотра» стоит 0$/мес и, что особенно примечательно, включает «агентную модель» с доступом к Gemini 3 Pro, а также Claude Sonnet 4.5 и GPT‑OSS, неограниченные автодополнения и запросы команд, и «щедрые» лимиты скорости, а планы для команд и предприятий «скоро будут» снимок цены. Antigravity работает на macOS, Windows и Linux и записывает артефакты вроде планов, скриншотов и записей браузера, поэтому для многих разработчиков теперь это бесплатный способ опробовать полностью агентные рабочие процессы кодирования, не оплачивая подписку на уровне Cursor объявление о загрузке.
Gemini 3 Pro Preview появляется в AI Studio с контекстом до 1 млн и ступенчатой тарифной политикой.
Со стороны разработчика Google запустила модель gemini-3-pro-preview в AI Studio и Gemini API/Vertex AI с окном контекста в 1 миллион токенов и новыми настройками для thinking_level, по‑части media_resolution, структурированными выводами и обязательными «подписьями рассуждений», направленными на обеспечение аудита рассуждений разработчик feature thread руководство разработчика. Цена установлена на $2/входной токен и $12/выходной токен для подсказок до 200k токенов, и $4/вход, $18/выход выше этого, с отдельными сниженными ставками кэш‑чтения/записи, показанными в пользовательском интерфейсе карточки модели ai studio pricing card. Для большинства рабочих нагрузок приложений это делает Gemini 3 Pro чуть дороже Gemini 2.5 Pro, но конкурентоспособной с другими передовыми моделями, и огромный контекст плюс управление рассуждениями дают командам основание запускать параллельные оценки в AI Studio или через свои шлюзы прямо сейчас pricing screenshot.
Приложение Gemini получает режим Gemini 3 «Thinking», генеративные макеты и режим Агент.
Потребительское приложение Gemini также претерпело значительное обновление: переработанный интерфейс с Gemini 3 в качестве модели по умолчанию «Thinking», новые эксперименты «визуальный макет» и «динамический вид», которые создают персонализированные интерфейсы результатов, и режим Gemini Agent, который может выполнять многошаговые задачи, такие как бронирование поездок или организация электронной почты под контролем пользователя ui refresh thread app rollout. Режим агента запускается для подписчиков Ultra в США и будет расширяться до пользователей Pro, в то время как студенты колледжей США теперь могут получить полный год пакета Gemini Pro бесплатно, который включает расширенный доступ к Gemini 3 Pro, неограниченную загрузку изображений и 2 ТБ хранилища student plan details. Для разработчиков это означает, что ожидания пользователей быстро сместятся в сторону более «приложений»-подобных ответов и выполнения фоновых задач, поэтому согласование UX ваших агентов с моделями Gemini, скорее всего, упростит onboarding.
Google намекает на Gemini 3 Deep Think как на премиум‑режим высокой рассудительности
Google и ранние тестировщики также обсуждают «Gemini 3 Deep Think», новый режим, который работает в той же линейке, но с гораздо большей вычислительной мощностью на запрос, чтобы справляться с особенно трудными задачами по математике, науке и программированию deep think chart thread reviewer impressions. Deep Think пока что доступен не широко — его используют в программах безопасности и оценки и планируется запустить подписчикам Google AI Ultra в ближайшие недели — поэтому на данный момент большинство разработчиков будут ориентироваться на стандартный Gemini 3 Pro, наблюдая за тем, как Deep Think ведет себя, какова задержка и как изменяется ценообразование deep think mention. Наличие этого многоступенчатого режима рассуждений по‑прежнему важно сегодня, потому что он намекает на будущее, где можно явно обменивать стоимость и задержку на более тщательное мышление для каждого запроса, вместо ожидания появления полностью новой линейки моделей.
Таблицы лидеров перераспределены Gemini 3 (за исключением запуска)
В основном сторонние оценки и оценки, опубликованные Google: варианты Gemini 3 перемещают ARC‑AGI, HLE, Design/WebDev, AA‑Omniscience и агентские стенды. Исключает запуск продукта (рассматривается в разделе Feature).
Gemini 3 Deep Think удваивает ARC‑AGI‑2 SOTA до 45,1%.
ARC‑AGI‑2, один из самых жестких бэнчмарков визуального рассуждения, только что получил новый бытовой удар: Gemini 3 Deep Think достигает 45.1% с включенными инструментами, а Gemini 3 Pro — 31.1% без инструментов, по сравнению с 17.6% GPT‑5.1 и 13.6% Claude Sonnet 4.5 без инструментов по результатам benchmark table.). Отдельный график ARC Prize показывает, что Deep Think сильно ударяет по вычислениям — примерно $77 за задачу против примерно $0.81 у Gemini 3 Pro и ~$4.78 у GPT‑5 Pro за ту самую прирост в производительности arc cost chart.)
)
Для инженеров и исследователей это говорит сразу о двух вещах: базовая политика Gemini 3 существенно более экономична по существительным данным на этих задачах в стиле головоломки, чем у предыдущих моделей, и время тестирования вычисления реально приносит выигрыш, если вы готовы потратиться. Кривая стоимость/оценка также упрощает выбор между Pro (для повседневного использования) и Deep Think (для небольших, критически важных партий сложных задач).
Gemini 3 Deep Think ведёт Последний экзамен человечества и GPQA
На последнем экзамене человечества, широком тесте по академическому рассуждению, Gemini 3 Deep Think набирает 41% без использования инструментов, обгоняя Gemini 3 Pro с 37,5% и обходя GPT‑5 Pro (30,7%), GPT‑5.1 (26,5%) и Gemini 2.5 Pro (21,6%) по значению таблица сравнения.). Та же диаграмма показывает Deep Think на 93,8% в GPQA Diamond и Gemini 3 Pro на 91,9%, опередив GPT‑5.1 на 88,1% и Claude Sonnet 4.5 на 83,4% таблица сравнения.)
)
Для тех, кто разрабатывает инструменты, опирающиеся на STEM или рассуждения в стиле экзаменов, это явный сигнал: наиболее сильные варианты Gemini 3 теперь становятся эталоном. Разрыв по сравнению с предыдущими Gemini 2.5 и передовыми моделями — не округление; это тот самый дельта, который проявляется в повседневном решении задач, особенно когда связываешь несколько шагов рассуждений.
Gemini 3 Pro занимает первое место в текстовом лидерборде LMArena с рейтингом 1501 Elo
На общественно‑управляемой текстовой доске LMArena Gemini 3 Pro дебютирует на 1501 Elo, занимая первое место и опрокидывая мышление Grok 4.1 и варианты без мышления к следующим рангам lmarena update. Арена команда отмечает, что этот счёт получен из предварительного голосования помеченного как предварительный, но с более чем 3 000 голосами это уже статистически значимое перераспределение lmarena update.
Если вы пользовались Grok 4.1, Claude 4.5 или GPT‑5.x в качестве вашего субъективного «самого комфортного» дефолтного варианта, это сильный импульс добавить Gemini 3 Pro в вашу ротацию и посмотреть, как его стиль, паттерны отказа и рассуждения сочетаются с вашими рабочими нагрузками. LMArena обычно хорошо коррелирует с тем, что пользователи с высоким уровнем опыта чувствуют в повседневной работе, поэтому этот шаг имеет значение не только ради права похвастаться.
Gemini 3 Pro вдвое превосходит ранее достигнутый передовой уровень в понимании экранов ScreenSpot‑Pro.
On ScreenSpot‑Pro, бенчмарк для понимания изображений богатых приложений (представьте PhotoShop, CAD, сложные интерфейсы), Gemini 3 Pro достигает 72.7%, практически вдвое больше предыдущего лучшего результата Claude Sonnet 4.5 в 36.2% и намного выше Gemini 2.5 Pro’s 11.4% и GPT‑5.1’s 3.5% benchmark table.
Это большое событие для агентов «использования компьютера», которые кликают по GUI вместо обращения к API. Если эти показатели сохранятся на практике, агенты на основе Gemini должны быть гораздо лучше в чтении плотных панелей инструментов, панелей свойств и состояний области просмотра, а затем в принятии правильного действия без хрупких обходных решений, привязанных к конкретному приложению.
Gemini 3 Pro поднимается на первое место на WebDev Arena с рейтингом Elo 1487
В рейтинге WebDev Code Arena Gemini 3 Pro демонстрирует Elo 1487, занимая первое место с ростом примерно +280 очков по сравнению с Gemini 2.5 Pro и опережая варианты GPT‑5.1 и Claude Opus/Sonnet webdev rankings. Это крупнейшее достижение одной модели, которое администраторы видели в этой арене с момента запуска.
Для разработчиков это означает, что Gemini 3 Pro особенно силён в задачах end‑to‑end веб‑приложений — настройке HTML/CSS/JS/React, работе с ассетами и мелкими деталями UX — не только в изолированных фрагментах кода. Если вы оцениваете Copilots для команд с тяжёлой фронтенд‑работой, то это один из немногих публичных, голосованных людьми сигналов, что Gemini на самом деле может выдавать более чистые черновики с первой попытки по сравнению с обычными подозреваемыми OpenAI и Anthropic.
Vending‑Bench 2: Gemini 3 Pro соединения до ~10× начального капитала
На Vending‑Bench 2 от Andon Labs, который моделирует долгосрочный бизнес, протяжённый на сотни дней с поставщиками и контрактами, Gemini 3 Pro достигает средней чистой стоимости около $5,478 за запуск, начиная примерно с ~$500 — примерно 10× рост vending bench post. Та же диаграмма показывает Claude Sonnet 4.5 около $3,839, GPT‑5.1 около $1,473 и Gemini 2.5 Pro застрявший около $574 vending bench post.
Для людей, экспериментирующих с автономными агентами, которые управляют запасами, ценообразованием или закупками, это один из немногих публичных сигналов о том, что Gemini 3 Pro может формировать несложные планы, перепланировать со временем и избегать очевидных ловушек, приводящих к расходованию денег. Это не значит, что безопасно доверить ему управление вашим бизнесом, но это значит, что вы точно должны включить его в ваши внутренние оценки агентов.
Единая таблица бенчмарков показывает, что Gemini 3 Pro опережает во всех трёх областях: математика, компьютерное зрение и инструменты.
Широко распространенная таблица сравнения раскладывает Gemini 3 Pro против Gemini 2.5 Pro, Claude Sonnet 4.5 и GPT‑5.1 по более чем 20 тестам: 100% на AIME 2025 с кодом, 23.4% на MathArena Apex против 1% у GPT‑5.1, 81% на MMMU‑Pro, 87.6% на Video‑MMMU, 2 439 очков Эло на LiveCodeBench Pro и 85.4% на использование инструментария τ²‑Bench, при этом только SWE‑Bench Verified близко к Sonnet 4.5 с 77.2% против 76.2% Gemini 3 Pro benchmark table.)
)
Суть в том: по математике, мультимодальному рассуждению, генерации кода и агентам с усиленной инструментальностью центр тяжести сместился в сторону Gemini 3 Pro. Если вы оптимизируете маршрутизацию или ансамбли вокруг GPT‑5.x + Claude, эта таблица — весомый аргумент заново запустить ваши собственные приватные оценки с Gemini 3 в смеси, чем полагаться на старые ранги, которые все еще считаются действующими.
Индекс искусственного анализа интеллекта возглавляет Gemini 3 Pro как общий лидер.
Artificial Analysis’ Intelligence Index v3.0, который сочетает 10 мощных оценок (MMLU‑Pro, GPQA Diamond, HLE, LiveCodeBench, SciCode, AIME 2025, IFBench, AA‑LCR, Terminal‑Bench Hard, τ²‑Bench) теперь ставит Gemini 3 Pro Preview на первое место с результатом 73, опережая GPT‑5.1 (high) на 70 и GPT‑5 Codex (high) на 68 ai index summary. Индекс задуман так, чтобы 0 означало столько ошибок, сколько верных ответов, и маржа Gemini 3 Pro проявляется как явные победы в рассуждениях, математике и подбенчмарках кодирования.
Если вам не хочется отслеживать каждый отдельный бенчмарк, это самое чистое и пока что единственное число, которое говорит: «Gemini 3 Pro — самая способная общая модель прямо сейчас» для знаний + рассуждений + кода. Это также один из немногих межпоставщиковских обзоров, который учитывает как стандартные задачи, так и агентное кодирование, что ближе к тому, как люди на самом деле используют эти системы.
Design Arena фиксирует рекордное изменение, поскольку Gemini 3 Pro лидирует в категориях 3D/UI.
На Design Arena, которая оценивает модели по веб, игровому, 3D и дизайну элементов интерфейса, Gemini 3 Pro Preview достигает общей оценки Elo 1422 и сейчас обходит 4 из 5 арен кодируемого дизайна (Website, Game Dev, 3D Design, UI Components) design arena chart. Куратор арены называет это «самой большой дельтой производительности» за время существования бенчмарка, с такими прежними лидерами, как GPT‑5.1 и Claude Opus/Sonnet, находящимися в нижних 1300‑х.
GeoBench: Gemini 3 Pro побеждает профессиональных игроков GeoGuessr
Новое оценивание GeoBench, которое тестирует локализацию стран в стиле GeoGuessr по Street View, показывает предварительную версию Gemini 3.0 Pro с точностью на уровне страны 84%, средний балл 4 145 и медианную ошибку дистанции 144 км на карте «легкий мир» geobench results. В той же настройке профессиональный игрок GeoGuessr набирал в среднем 4 100 очков при медиане расстояния 220 км, что означает, что Gemini 3 Pro стал первым LLM, который обошёл человеческого эксперта в этой задаче geobench results.

Stay first in your field.
No more doomscrolling X. A crisp morning report for entrepreneurs, AI creators, and engineers. Clear updates, time-sensitive offers, and working pipelines that keep you on the cutting edge. We read the firehose and hand-pick what matters so you can act today.
I don’t have time to scroll X all day. Primer does it, filters it, done.
Renee J.
Startup Founder
The fastest way to stay professionally expensive.
Felix B.
AI Animator
AI moves at ‘blink and it’s gone’. Primer is how I don’t blink.
Alex T.
Creative Technologist
Best ROI on ten minutes of my day. I’ve shipped two features purely from their daily prompts.
Marta S.
Product Designer
From release noise to a working workflow in 15 minutes.
Viktor H
AI Artist
It’s the only digest that explains why a release matters and shows how to use it—same page, same morning.
Priya R.
Startup Founder
Stay professionally expensive
Make the right move sooner
Ship a product