Модель изображения Nano Banana Pro 4K — 8% ошибок текста, рендеры за 0,13 доллара

Stay in the loop

Free daily newsletter & Telegram daily report

Executive Summary

Google quietly turned on Nano Banana Pro, its Gemini 3 Pro Image model, across Gemini web/app, AI Mode in Search, Flow, NotebookLM, AI Studio, and Vertex. You get 1K/2K/4K outputs, a 1M‑token context inherited from Gemini 3 Pro, and pricing around $0.134 per generated image on top of $2/M input and $12/M output tokens. The pitch: a reasoning‑aware image engine that can lay out multilingual text and infographics without looking like your UI was typeset by a blender.

Early benchmarks back that up. Nano Banana Pro tops GPT‑Image 1, Seedream v4 4K, and Flux Pro Kontext Max on text‑to‑image and editing Elo, with ~100‑point leads in several edit categories. A heatmap puts single‑line text errors near 8% versus ~38% for GPT‑Image 1 across languages, including Arabic, Hindi, and Hebrew. The new “Show thinking (Nano Banana Pro)” toggle also hints that chain‑of‑thought is now a thing for pixels, not just prose.

Third‑party support lit up immediately: fal.ai shipped day‑0 text‑to‑image and edit APIs, Higgsfield is dangling “unlimited 4K” Nano Banana Pro with up to 65% off, and Genspark wired it into its all‑in‑one workspace. If your product depends on legible dashboards, posters, or UI mocks, this model is worth a focused weekend of A/B tests.

Feature Spotlight

Особенность: Nano Banana Pro (Gemini 3 Pro Image) запускается во всех сервисах Google и у партнёров

Модель рассуждений по изображениям Google выпускается широко (Gemini web/app, AI Studio, Vertex) с поддержкой 4K, улучшенным текстом и многоступенчатыми правками — сразу доступна через поверхности Google и партнерские API, что ускоряет творческие и продуктовые рабочие процессы.

Подтверждения между аккаунтами о том, что рассуждающая модель изображений Google теперь широко пригодна: Gemini web/app, AI Studio, Vertex docs и сторонние конечные точки. Основное внимание уделяется выводу в 4K, точному мультиязычному тексту, инструментам редактирования.

Jump to Особенность: Nano Banana Pro (Gemini 3 Pro Image) запускается во всех сервисах Google и у партнёров topics

🍌 Особенность: Nano Banana Pro (Gemini 3 Pro Image) запускается во всех сервисах Google и у партнёров

Nano Banana Pro (изображение Gemini 3 Pro) запускается во всех инструментах Gemini и Google

Google DeepMind официально запустила Nano Banana Pro (Gemini 3 Pro Image), модель генерации и редактирования изображений с учётом рассуждений, которая теперь доступна в приложении Gemini и в вебе, в AI Mode в Search, Flow, NotebookLM и других сервисах, после ранее утечённых тестов 4K вывода и отрисовки текста 4k leak. Модель поддерживает вывод 1K/2K/4K, управление освещением и камерой, изменение соотношения сторон, многоязычную отрисовку текста, композицию нескольких изображений и привязку к Search для визуалов, ориентированных на факты DeepMind feature thread surfaces and getting started.)

Для разработчиков Nano Banana Pro появляется в Google AI Studio как gemini-3-pro-image-preview с ценообразованием $2.00 за 1K входных токенов, $12.00 за 1K выходных токенов и примерно $0.134 за сгенерированное изображение, сохраняя ту же отсечку знаний на январь 2025 года и контекст 1M, как у Gemini 3 Pro текст ai studio pricing.); Платформа Vertex AI Model Garden перечисляет тот же идентификатор модели (publishers/google/models/gemini-3-pro-image-preview), и подчеркивает «рассуждения для генерации изображений», поддержку 4K и опциональное привязку к Search для более фактических изображений vertex docs overview.)

На фронтенде Gemini web теперь показывает переключатель “Show thinking (Nano Banana Pro)” при генерации изображений, что намекает на то, что внутреннее рассуждение в стиле цепочки мышления применяется даже к визуалам и при необходимости становится видимым пользователям show thinking ui. Сообщения сообщества подтверждают успешные запуски в Gemini web («cat shooting power into a wormhole», «minion with nano banana») и в мобильном приложении, что согласуется с заметкой AILeaks о том, что модель широко разворачивается в предложениях Google AI gemini app release rollout confirmation.

Модель изображения Nano Banana Pro 4K — 8% ошибок текста, рендеры за 0,13 доллара

Executive Summary

Особенность: Nano Banana Pro (Gemini 3 Pro Image) запускается во всех сервисах Google и у партнёров

Table of Contents

🍌 Особенность: Nano Banana Pro (Gemini 3 Pro Image) запускается во всех сервисах Google и у партнёров

Nano Banana Pro (изображение Gemini 3 Pro) запускается во всех инструментах Gemini и Google

Бенчмарки ставят Nano Banana Pro вперед GPT‑Image 1 по качеству и рендерингу текста.

fal.ai выпускает на старте Nano Banana Pro API для преобразования текста в изображение и редактирования

Higgsfield предлагает безлимитный 4K Nano Banana Pro с агрессивной скидкой на Черную пятницу.

Genspark интегрирует Nano Banana Pro в своё всеобъемлющее AI‑рабочее пространство.

🧩 Открытые веса: Olmo 3 (7B/32B базовый, Instruct, Think)

Ai2 выпускает полностью открытое семейство Olmo 3 7B/32B

Olmo 3 поставляет 7B RL Zero наборы данных и контрольные точки для математики, кода и инструкций

Olmo 3-Base 32B бросает вызов другим открытым моделям 32B на основных бенчмарках

Olmo 3-Think 32B приближается к Qwen3 по бенчмаркам в математике и рассуждении.

Ai2 и Hugging Face запланировали прямой эфир с подробным разбором Olmo 3.

Команда Olmo 3 намекает на предстоящие материалы о инфраструктуре обучения и выполнении кода

🗺️ Дорожные карты моделей и предстоящие релизы

Сигналы накапливаются в преддверии скорого выпуска Claude Opus 4.5 и Claude Code Desktop

Илон Маск нацеливается на обновление Grok 4.20 «крупное улучшение» к Рождеству

Браузер Comet от Perplexity с агентной архитектурой тихо появился в Android Play Store.

🛠️ Архитектуры агентов: субагенты, контекст и выполнение кода

Anthropic: выполнение кода и умное редактирование контекста повышают эффективность агентов Claude на 39%.

Replit презентует оркестратор субагентов основного цикла как паттерн «Год субагента».

Sourcegraph предупреждает, что потоки кодирования Amp, выходящие за пределы примерно 350 тысяч токенов, ухудшают качество.

Kilo Code демонстрирует цикл от подсказки к игре с встроенным развертыванием.

🛡️ Безопасность агентов/IDE: утечка через prompt-инъекцию и меры противодействия

Ошибка эксфильтрации изображений Markdown снова появляется во многих агентских IDE.

DSPy Spotlight добавляет защиту в продакшене от косвенной инъекции подсказок

⚖️ ЕС смещает акценты в правилах конфиденциальности и в области ИИ, чтобы снизить трение.

Европейский Союз планирует ослабить требования GDPR и отсрочить введение в силу AI Act, чтобы снизить бремя соблюдения требований.

🗣️ Голосовой ИИ в масштабе: новые рынки и использование в корпоративной среде

ElevenLabs выходит в Корее с платформой Agent Platform для предприятий со временем отклика менее 0,5 с.

ElevenLabs обеспечивает 1,5 млн ИИ-мок-интервью для соискателей работы Apna

🎨 Креативный ИИ вне Google

Dreamina MultiFrames превращает 10 кадров в 54-секундное видео, управляемое подсказками

SAM3 от Meta демонстрирует надёжную сегментацию видео в реальных условиях в ранних тестах у создателей контента.

ImagineArt 1.5 Preview поднимается до 3-го места в рейтинге ELO за текст‑к‑изображению от Artificial Analysis

KAT‑Coder‑Pro автоматически кодирует процедурный рождественский дом в стиле Minecraft в three.js

Tencent заигрывает с HunyuanVideo 1.5 и представляет превью в стиле эскиза, переходящего в 3D.

💼 Сигналы принятия в коммерции и корпоративном секторе

Flowith предлагает пакеты акций на Черную пятницу, объединяющие Gemini 3 Pro и предстоящий Banana 2, с крупными скидками.

📈 Пульс сообщества: усталость от моделей и нарратив конкуренции

Сообщество переключается на нарратив «Google против остальных», но гонка по-прежнему открыта.

Сообщество связывает временной горизонт METR 2h40 с дорожной картой OpenAI по программе «AI research intern».

Комментаторы отмечают годовое падение примерно в 300 раз «цены за единицу интеллекта» и предупреждают, что спасения не будет.

Разработчики достигли «100%-ной усталости моделей» после трех дней запусков флагманских моделей.

Разработчики отмечают повторяющийся цикл хайпа вокруг каждого запуска крупной модели.

🤖 Роботы на заводах и в домохозяйствах

Figure делится кадрами с линии производства BMW и выделяет уроки для Figure 03

Sourccey подшучивает над 3’6" открытым исходным кодом домашнего робота, совместимого с LeRobot

On this page