OpenAI реорганизуется под контролем некоммерческой организации — обещает инвестировать $1,4 трлн в более чем 30 ГВт вычислительной мощности.

Stay in the loop

Free daily newsletter & Telegram daily report

Join Telegram Channel

Executive Summary

OpenAI только что переработала свою корпоративную «начинку» в прямом эфире: новая некоммерческая Foundation теперь контролирует OpenAI Group PBC с примерно 26% долей, и IPO считается «скорее всего» в будущем.

Перестройка управления сопровождается дерзким планом масштабирования — более 30 ГВт новой вычислительной мощности и около $1,4 трлн обязательств — призванными поддержать дорожную карту автоматизации, нацеленную на «интерна» в области ИИ к сентябрю 2026 года и на надёжного «исследователя» к марту 2028 года. Это самое ясное заявление на сегодня о том, что OpenAI ожидает, что глубокое обучение будет продолжать накапливаться без экзотических отклонений.

Пересмотренная сделка с Microsoft укрепляет связь: Redmond владеет примерно 27%, эксклюзивность Azure/API сохраняется до тех пор, пока независимая комиссия не подтвердит AGI, и OpenAI добавляет примерно $250 млрд дополнительных расходов на Azure; Microsoft сохраняет права на продукты/модели IP до 2032 года в рамках правил безопасности. OpenAI хочет индустриализировать строительство дата-центров до 1 ГВт в неделю примерно за $20 млрд за ГВт, и это смещает дистрибуцию с ChatGPT на «AI‑облако», где сторонние разработчики создают больший ценностной эффект, чем сама платформа — Atlas для Windows обещан «в неком количестве месяцев». Управление также утверждает, что единичная стоимость интеллекта падает примерно в 40 раз в год, что переносит запуски уровня GPT‑3 на телефоны и приводит к почти краткосрочному скачку модели в течение шести месяцев.

Если эти сроки выдержатся, реальные узкие места станут в электроэнергии, бетоне и пороге верификации AGI, встроенном в соглашение с Microsoft.

Feature Spotlight

Особенность: новая структура OpenAI, график исследований AGI и план вычислений

OpenAI пересмотрела своё управление и стратегию: контроль некоммерческой организации, 27% у Microsoft с эксклюзивностью до проверки AGI, исследования ИИ на уровне стажёра к сентябрю 2026 года, полноценный исследователь к марту 2028 года и примерно $1,4 трлн/более 30 ГВт вычислительных мощностей в полёте.

Сводка по нескольким аккаунтам сегодня: прямой эфир OpenAI подробно рассказал о новой структуре, находящейся под контролем некоммерческой организации, пересмотренном соглашении с Microsoft, дорожной карте к автоматизированным исследованиям ИИ и масштабном наращивании вычислительной мощи. Исключает все прочие пункты OpenAI из оставшейся части отчета.

Jump to Особенность: новая структура OpenAI, график исследований AGI и план вычислений topics

Table of Contents

🌐 Особенность: новая структура OpenAI, график исследований AGI и план вычислений

Сводка по нескольким аккаунтам сегодня: прямой эфир OpenAI подробно рассказал о новой структуре, находящейся под контролем некоммерческой организации, пересмотренном соглашении с Microsoft, дорожной карте к автоматизированным исследованиям ИИ и масштабном наращивании вычислительной мощи. Исключает все прочие пункты OpenAI из оставшейся части отчета.

OpenAI ставит целью автоматизированные исследования в области ИИ: стажер — к сентябрю 2026 года, полный исследователь — к марту 2028 года

Сэм Олтман и Якуб Пахоцки заявили, что OpenAI видит правдоподобный путь к автоматизированному стажеру-исследователю ИИ к сентябрю 2026 года и к «легитимному исследователю ИИ» к марту 2028 года, утверждая, что глубокое обучение может достичь суперинтеллекта по ключевым направлениям менее чем за десять лет timeline clip, scaling slide. Они прогнозируют небольшие открытия в 2026 году и средние открытия к 2028 году, по мере того как горизонты расширяются от часов к задачам более продолжительной продолжительности discoveries slide, timeline recap.

  • Они ожидают резкого скачка качества моделей в пределах ~6 месяцев и ещё одного к сентябрю 2026 года, при этом внутренние результаты повышают уверенность model cadence note, near‑term quality.

Окончательное соглашение между Microsoft и OpenAI: 27%-ная доля, эксклюзивность на Azure/API до тех пор, пока панель по AGI не подтвердит AGI; права на интеллектуальную собственность до 2032 года.

Новый договор между Microsoft и OpenAI устанавливает долю Microsoft примерно на 27% (~$135 млрд) и сохраняет эксклюзивность Azure/API до тех пор, пока независимая экспертная панель не подтвердит AGI; Microsoft сохраняет права на IP продуктов/моделей до 2032 года с рамками безопасности, в то время как OpenAI обязуется дополнительно потратить ~$250 млрд на Azure и получает гибкость для совместной разработки не‑API продуктов вне Azure обзор сделки, документы OpenAI. Отдельная оговорка отмечает, что права Microsoft на исследовательские IP действуют до тех пор, пока AGI не будет подтвержден или до 2030 года, что наступит раньше скриншот условий IP.

[изображение:https://pbs.twimg.com/media/G4VmUlHasAE-iUB.jpg|Reuters скриншот]

Расчёт масштабирования: более 30 ГВт нового строительства и обязательства около 1,4 трлн долларов; цель по производству на заводе — 1 ГВт в неделю при примерно 20 млрд долларов за ГВт

OpenAI сообщил об обязательствах по более чем 30 ГВт новой мощности вычислений и примерно $1,4 трлн обязательств на “следующие многие годы,” и стремлении индустриализировать строительство дата-центров со скоростью примерно 1 ГВт в неделю в течение пяти лет жизненного цикла при примерно $20 млрд за ГВт, с робототехникой для ускорения строительства инфраструктурный стек, инфраструктурные слайды, слайды по расходам на ГВт. Это подчеркивает, что электроэнергия является ограничивающим фактором, и дополняет ранее опубликованный призыв к расширению США на 100 ГВт в год, продолжая работу над power memo.

[изображение:https://pbs.twimg.com/media/G4XZov7XEAAefCj.jpg|Слайд по инфраструктуре]

Детализированная безопасность стека: согласование значений/целей, надёжность, устойчивость, системная безопасность; верность цепочки рассуждений находится на стадии исследования

OpenAI описала пять уровней безопасности — выравнивание ценностей, выравнивание целей, надёжность, противодействие злоупотреблениям и системную безопасность — и текущую совместную работу с коллегами по лабораториям над верностью цепочке рассуждений, которая держит части внутреннего мышления вне поля прямого надзора, с строгими границами конфиденциальности и тщательной оценкой из-за хрупкости safety overview. Принципы выбора продукта будут ставить во главу долгосрочное благополучие (например, откат от форм зависимого поведения), с предстоящим контролем во взрослом режиме и проверкой возраста для настройки маршрутизации и разрешений safety overview.

Фонд OpenAI теперь контролирует OpenAI Group PBC; некоммерческая организация владеет примерно 26% доли капитала по мере преобразования LLC в PBC.

OpenAI представила упрощённую структуру, в рамках которой некоммерческая организация OpenAI Foundation получает контроль над OpenAI Group PBC, с примерно 26% долей на старте и опционами на рост, при этом повторив миссию, связывающую PBC с общественной пользой livestream summary. Фонд изложил первоначальные обязательства и цели стать «самым хорошо финансируемым некоммерческим фондом», при этом прибыльное крыло сохраняет скорость разработки продукта и фокус на платформе structure slide.

  • IPO является наиболее вероятным путём привлечения капитала, по словам Сэма Альтмана, хотя дата не указана ipo comment.

OpenAI подготавливает «AI-облако», в котором разработчики создают больше ценности, чем платформа; Atlas для Windows запланирован.

OpenAI обозначила сдвиг в сторону платформы за пределами ChatGPT к «ИИ-облаку», на который другие будут строить — API, приложения внутри ChatGPT и корпоративные инструменты — задача которого состоит в том, чтобы сторонние разработчики приносили больше ценности, чем сама платформа ai cloud slide, platform stack. Они также отметили, что Atlas для Windows запланирован «в течение некоторого количества месяцев», и что релизы будут менее тесно связаны с названиями моделей по мере роста темпа обновлений platform stack.

Стоимость единицы интеллекта снижается примерно в 40 раз в год; масштаб GPT‑3 можно запустить на телефоне, стоимость GPT‑4 падает быстро.

OpenAI сообщил о среднем снижении примерно в 40× в год «цены за единицу интеллекта», утверждая, что запуски уровня GPT‑3 теперь поместятся в телефон, в то время как затраты на уровень GPT‑4 существенно снизились, что позволяет больше бесплатных функций при большем спросе economics notes. Руководство заявило, что доход должен достигнуть сотен миллиардов со временем, при лидировании корпоративного сектора и вкладе потребителей плюс новые устройства economics notes, и намекнул на крупные шаги в качестве модели в течение шести месяцев model cadence note.

Персональное устройство АГИ, обещанное для повседневного использования как в работе, так и в повседневной жизни.

Команда продемонстрировала «личный AGI, которым можно пользоваться в любом месте» для помощи в работе и личной жизни — подпитывая спекуляции об устройстве ИИ в следующем году наряду с приложениями и браузером Atlas personal agi slide, device and goals. Концепция закрепляет более широкий сдвиг от оракульного помощника к инструментам, которые помогают людям строить будущее.


🛠️ Платформы агентов в IDE и в облаке.

Большой день для создателей агентов: агрегация Agent HQ от GitHub, демонстрации команды Codex, смешанные модели рабочих процессов Factory, бэкенды LangChain DeepAgents и пути хостинга Cloudflare. Исключены элементы прямой трансляции OpenAI, освещённые в материале.

GitHub представляет штаб агентов с агентами сторонних разработчиков; Codex появляется в VS Code Insiders.

GitHub превращает IDE в концентрационный центр агентов: Agent HQ будет размещать агентов от Anthropic, OpenAI, Google, Cognition и xAI непосредственно в вашем рабочем процессе GitHub, в то время как подписчики Copilot Pro+ уже могут запускать Codex внутри VS Code Insiders. Организационные панели показывают использование ИИ и влияние для администраторов. Обзор Agent HQ Детали развертывания Демонстрация Codex Панель метрик

[изображение:https://pbs.twimg.com/media/G4XHPeHW0AAIwYL.jpg|Коллаж Agent HQ]

Для инженерных лидеров это переносит оркестрацию агентов в кодовую платформу, которую вы уже управляете (аутентификация, политика, аудит), сокращая связующее звено между CLI и чат-приложениями; ожидайте, что политики, жизненный цикл сторонних агентов и оценка станут частью администрирования GitHub в ближайшие месяцы.

Cloudflare показывает, как разместить Claude Agent SDK в Sandboxes с включенным инструментом bash

Cloudflare опубликовала пошаговый путь для запуска Claude Agent SDK от Anthropic в своих песочницах, включая безопасное выполнение bash и развёртывание без контейнеров; приведены образцы кода и видеообзор. Это даёт командам быструю, изолированную среду выполнения для агентов, которым нужна файловая система и оболочка без управления Kubernetes. Продолжение темы по SDK guardrails, которое добавило разрешения для контроля использования инструментов. Tutorial thread Video guide Claude docs

Для команд платформы привлекательность остаётся неизменной: ограниченные разрешения, упрощённый хостинг и меньше уникальных операционных путей для навыков агента, которым требуется оболочка, установка пакетов или эфемерное состояние.

Factory 1.9 выпускает сессии смешанных моделей, настраиваемые субагенты и приложение GitHub для встроенных обзоров PR

IDE агентов Factory добавляет фазово-специфические модели (планирование с Sonnet 4.5, реализация с Haiku 4.5), настраиваемых подсистем агентов («Droids») на задачу и приложение GitHub Marketplace, которое публикует контекстный инлайновый обзор кода. Выпуск нацелен на реальные рабочие процессы агентов, которые планируют, выполняют и проверяют внутри репозиториев. Release thread App setup Release notes

Эти функции выносят работу агентов из чата в повторяемые конвейеры CI — особенно полезно для команд, стандартизирующих изменения кода с учетом политики и автоматизированной гигиены PR.

LangChain DeepAgents 0.2 добавляет модульные бэкенды для файловых систем агентов и долговременной памяти

DeepAgents представляет абстракцию «backend», чтобы сборщикам могли менять файловую систему агента между локальным диском, состоянием/хранилищем LangGraph, удалёнными VM или базами данных — плюс утилиты, такие как удаление крупных результатов инструментов и исправление «висячих» вызовов инструментов. Это более чистый путь к устойчивому состоянию, межпоточной памяти и масштабируемому хранению. Release blog LangChain blog

Для платформ агентов это сокращает индивидуальную «лепку» вокруг состояния и упрощает создание прочных проектов, артефактов и выводов инструментов без раздувания контекстных окон.

OpenRouter добавляет сбрасываемые лимиты ключей API и аналитику использования для многоагентных флотилий

OpenRouter внедрил ключи API с дневными/недельными/месячными пределами сброса и более детализированными представлениями использования, что упрощает управление внешними приложениями или доступом подрядчиков, оставаясь в рамках расходов. Ключи можно управлять через панель управления. Feature launch Usage dashboard OpenRouter keys

Для владельцев платформы квоты по каждому ключу и видимость являются базовыми условиями экосистем агентов — это помогает избегать перерасходов, изолировать приложения и ускорять реагирование на инциденты, когда ключ используется злоумышленно.


Хитрости подачи: более быстрые переходы между инструментами и более надёжный вызов инструментов

Обновления сервинга/исполнения, направленные на снижение хвостовой задержки и улучшение совместимости. В основном — объявления о vLLM и заметки об их внедрении.

Режим сна vLLM обеспечивает переключение между моделями без повторной загрузки в 18–200× быстрее и первый токен генерируется на 61–88% быстрее.

vLLM представил Sleep Mode для много‑модельного обслуживания, сохраняя процесс (аллокатор, графы CUDA, JIT‑ядра), чтобы переключения обходили полную перезагрузку; L1 выгружает веса на CPU для самого быстрого пробуждения, в то время как L2 избавляется от весов ради минимального объёма RAM, при этом бенчмарки показывают 18–200× более быструю смену и 61–88% быстрее первую инференцию после холодного старта обзор функций.

Продолжая работу над Semantic Router, который обеспечивал ускорение ядра в 3–4×, Sleep Mode снимает большую часть накладных расходов на обмен моделями — открывая возможность низколатентной A/B маршрутизации и флотилий арендаторов по TP/PP/EP. API простое (POST /sleep?level=1, /wake_up), что упрощает интеграцию в автоскалирование и циклы контроля затрат обзор функций.

vLLM и Kimi K2 устраняют дрейф вызова инструментов; теперь более 99.9% успеха и 76% точности схемы, приближается «Enforcer».

Совместная работа vLLM × Kimi решила три проблемы совместимости (отсутствие add_generation_prompt, обработка пустого содержимого, строгий разбор идентификаторов вызова инструментов), что повышило K2 на vLLM до >99.9% успешных запросов и 76% точности схемы (увеличение в 4.4 раза), планируется компонент «Enforcer» для ограничения генерации инструментов и предотвращения вызовов вне контекста engineering deep dive.

Kimi’s Vendor Verifier также добавил пословно‑параметрические ToolCall‑Trigger Similarity и ToolCall‑Schema Accuracy views для проверки провайдеров, таких как vLLM, Fireworks, Groq и Nebius metrics update, и полный набор инструментов открыт для проверки GitHub repo.

vLLM помечает Sleep Mode как рычаг для снижения затрат на GPU для маркетплейсов моделей; Aegaeon уже работает на vLLM

vLLM заметки Sleep Mode может поддерживать рынки в стиле Aegaeon, высвобождая большую часть VRAM в состоянии покоя и мгновенно просыпаясь для запросов, уменьшая расход энергии в простое при сохранении тепловых исполнителей; сама система обслуживания Aegaeon построена на vLLM согласно их примечаниям по реализации implementation note.

Для операторов, путь Sleep Mode L1 (выгрузка весов на CPU) и путь L2 (удаление весов) позволяют организовать многоуровневое хранение редко используемых моделей без штрафов холодного старта, что естественно подходит для долгого хвоста каталогов и объявлений с оплатой по использованию blog thread.)

vLLM добавляет совместимость с API Anthropic, чтобы облегчить миграцию приложений на основе Claude.

Новый слой совместимости vLLM поддерживает Anthropic API, упрощая перенос рабочих нагрузок на Claude на базе инфраструктуры с поддержкой vLLM без переработки на уровне приложения заметка совместимости. Это снижает трение при переключении для команд, стандартизирующих использование одного высокопропускного рантайма на всех провайдерах, при этом существующий код клиента Anthropic остается без изменений.


🧪 Новые мультимодальные модели появляются у разных провайдеров

Nemotron Nano 2 VL от NVIDIA распространяется на случаи использования OpenRouter (бесплатный тариф с логированием), Replicate, Hyperbolic и Baseten. Совпадений с функциональным содержанием нет.

Nemotron Nano 12B v2 VL выходит на OpenRouter с бесплатным тарифным планом с ведением логов и несколькими провайдерами без ведения журналов.

OpenRouter добавил NVIDIA’s Nemotron Nano 12B v2 VL с бесплатным тарифом, который работает с логированием, плюс набор платных провайдеров, которые отключают логирование, расширяя доступ к мощной мультимодальной модели рассуждений. В продолжение к Together AI, которая раскрыла другую модель семейства Nemotron, это приносит вариант VL (видение‑язык) 12B на рынок с явными режимами конфиденциальности и маршрутизации. Смотрите страницу модели и список провайдеров в OpenRouter listing, с прямыми записями для бесплатного конечного пункта и доступных провайдеров в OpenRouter free model и provider roster; OpenRouter подтверждает разделение логирования/безлогирования в providers update.

Реплицировать хосты Nemotron Nano 12B v2 VL для интеллектуального анализа документов и видео на 10 языках

Replicate теперь поддерживает NVIDIA’s Nemotron Nano 12B v2 VL, позволяя использовать мульти‑изображение (до 4) или одиночное видео в качестве входа для интеллектуальной обработки документов и понимания видео с многоязычным выводом (10 языков). Запуск нацелен на OCR, понимание диаграмм и суммирование клипов прямо из коробки, с готовой карточкой модели и примерами на Replicate model card и на размещённой странице в Replicate model page.

Baseten выпускает Nemotron Nano 2 VL с паттернами агентов финансового уровня и поддержкой с нулевого дня.

Baseten является партнером по запуску на нулевой стадии для NVIDIA’s Nemotron Nano 2 VL и описывает, как на своей платформе строить высокопроизводительных агентов для финансовых услуг — охватывая такие сценарии, как анализ электронных таблиц, разбор документов и рабочие процессы, дополненные поиском. Подробности и руководство по развёртыванию приведены в анонсе Baseten и в блоге Baseten launch](https://x.com/basetenco/status/1983243273171845596), с более глубокими паттернами в Baseten blog.

Hyperbolic добавляет новейшие модели NVIDIA Nemotron, расширяя варианты развертывания VL

Hyperbolic объявила о поддержке последних моделей NVIDIA Nemotron, добавляя еще одну управляемую среду выполнения, в которой команды могут разворачивать семейство VL для нагрузок мультимодального рассуждения. Это дополняет доступность на других рынках и снижает привязку к конкретному поставщику для продукционных приложений Поддержка Hyperbolic.)


🤖 Гуманоиды становятся реальностью: предзаказы на 1X NEO и мышца G1

Робототехника перешла от демонстраций к заказам: 1X открывает предпродажу/подписку на NEO, а Unitree демонстрирует практическую силу тяги. Обсуждения включают первые впечатления и характеристики.

1X открывает предварительные заказы на NEO за $20k или $499/мес; поставки в США в 2026 году и подробный спецификационный лист

Домашний гуманоид NEO от 1X теперь доступен для покупки за наличные на сумму 20 000 долларов или через подписку за 499 долларов в месяц, при этом поставки по США планируются на 2026 год. Технический лист перечисляет 5'6", 66 фунтов мягкого корпуса, вычислительную плату «1X Cortex» на базе NVIDIA Jetson Thor, руки с 22 степенями свободы, подъем 154 фунта, перенос 55 фунтов и максимум шума 22 дБ Spec overview image Order terms Delivery timing.

Unitree G1 тянет автомобиль массой 1400 кг; физика и поза делают трюк правдоподобным

Unitree’s 35 кг, 1,32 м G1 humanoid был показан таскающим ~1 400 кг машину, результат объясняется сопротивлением качению (≈1–2% от веса при низкой скорости на гладком бетоне) плюс поза, благоприятная для сцепления — подчеркивая практическое применение силы, а не чистую подъемную способность Demo claim Physics breakdown.)


🏭 Наращивание вычислительных мощностей для ИИ: суперкомпьютер DOE, DPUs и обучение на нескольких площадках

Аппаратное обеспечение и инфраструктурные сигналы за пределами возможностей OpenAI: новые открытые научные кластеры в США с Blackwell, детали BlueField‑4 от NVIDIA и исследование осуществимости децентрализованного обучения мощностью 10 ГВт.

DOE и NVIDIA создадут суперкомпьютер Solstice с 100 тысячами Blackwells для открытой науки

NVIDIA, Oracle и Министерство энергетики США запустят Solstice с 100 000 графических процессоров Grace Blackwell в Argonne National Laboratory, а также Equinox с 10 000 Blackwells в первой половине 2026 года, нацеливаясь примерно на 2 200 эксафлопсов для задач открытой науки GTC DC slide. План прибыл после power memo, который призвал создать в США 100 ГВт/год для удовлетворения спроса на ИИ.

Системы ориентированы на агентный ИИ, обучение в крупном масштабе и быструю рассуждательность с доступом для открытых исследователей, и будут располагаться рядом с приборами, такими как Advanced Photon Source, чтобы обеспечить анализ в реальном времени GTC DC slide.

NVIDIA прогнозирует 6 млн Grace Blackwells в первые пять кварталов, рост примерно на 500 млрд долларов к 2026 году.

На GTC DC Дженсен Хуанг заявил, что Grace Blackwell разгоняется в пять раз быстрее Hopper, с прогнозом отгрузки 6 миллионов единиц за первые пять кварталов и совокупная стоимость Blackwell вместе с ранним Rubin достигнет примерно 500 миллиардов долларов к 2026 году; он также подтвердил заявления о самой низкой стоимости токенов для GB GTC remarks, keynote video. Ориентиры сигнализируют о устойчивых расходах капитала гиперскейлеров и длительной волне поставок для обучающих и инференса кластеров, специально созданных для рассуждений и агентной нагрузки.

DPU BlueField‑4 от NVIDIA сочетаeт 64‑ядерный Grace с 800 Гбит/с Ethernet для разгрузки операций ввода-вывода в дата‑центрах ИИ.

NVIDIA подробно представляет BlueField‑4 как DPU для дата‑центра, который объединяет 64‑ядерный Grace CPU с ConnectX‑9 800 Gb/s SuperNIC, DOCA‑микросервисы и изоляцию нулевого доверия, заявляя примерно 6× вычислительной мощности BlueField‑3 и раннюю доступность в 2026 году через платформы Vera Rubin feature roundup.). Такие партнеры, как VAST Data, уже запускают полные стеки хранения на оборудовании BlueField, подчеркивая offload‑историю для сетей, хранения данных и безопасности, чтобы GPUs оставались на генерации и извлечении токенов partner usage.)

Для задач с триллионами токенов и с большой нагрузкой RAG_DPUs могут снижать простои процессора и конечную задержку, перераспределяя ввод‑вывод и безопасность от хостов, сохраняя при этом линейную скорость RoCE на 800 GbE feature roundup.)

EpochAI говорит, что многоплощадочное обучение мощностью 10 ГВт в 23 локациях США возможно при использовании широкополосных каналов связи.

EpochAI утверждает, что крупномасштабные обучающие запуски не обязаны ограничиваться одним мегакампусом: сеть длиной 4 800 км из 23 площадок в США может поддержать распределённый кластер мощностью 10 ГВт, используя полностью синхронную параллелизацию данных, хотя требуется более чем в 25 раз больше пропускной способности канала MAREA, чтобы обучить модель размером 72 трлн параметров обзор исследования, подробная нить, аналитический блог. Указан многогигаваттный сайт Fairwater Microsoft как доказательство перехода к географически распределённым регионам Azure AI подробная нить.

Преимущества и недостатки не тривиальны — разрешения, надёжность на дальние расстояния и парадигмы с высокой потребностью в связи — но исследование оценивает минимальное повышение времени обучения и бюджета, если пропускная способность и задержки будут соответствующим образом сконструированы краткий обзор недостатков.

Qualcomm выходит на рынок инференса в дата-центрах с ускорителями AI200/AI250; акции выросли примерно на 11%.

Qualcomm представила ускорители AI200 и AI250, ориентированные на выводы в дата‑центре, упакованные как полноразмерные стойки с жидкостным охлаждением, которые нацелены на меньшую потребляемую мощность и стоимость по сравнению с действующими игроками; объявление подняло акции Qualcomm примерно на 11% news coverage. Positioning squarely against NVIDIA and AMD, the chips are pitched to improve memory footprints and efficiency for scaled inference deployments.

Если производительность и TCO оправдают ожидания, добавленный поставщик сможет диверсифицировать выбор аппаратного обеспечения для инференса у гипермасштабируемых компаний и SaaS‑платформ под давлением задержек и затрат news coverage.)


💼 Внедрение для предприятий и движения на рынке

Новые данные по принятию и вертикальные агенты для операторов. В основном — цифры ROI и сдвиги в стратегиях вывода на рынок; исключаются корпоративные изменения OpenAI (фича).

Уортон: 75% компаний уже видят окупаемость инвестиций в ИИ; лидеры, ежедневно использующие ИИ, достигают 46%

Новая волна трекингового опроса Wharton показывает, что примерно 75% компаний сообщают о положительной окупаемости инвестиций от генеративного ИИ, и 46% бизнес‑лидеров используют ИИ ежедневно, причем меньшие фирмы опережают предприятия свыше $2 млрд по скорости и влиянию Report highlight, Survey summary. Бюджеты растут (88% планируют увеличения), а использование перешло от пилотов к ежедневным рабочим процессам, таким как анализ, сводка, кодирование и найм; полный специальный отчет здесь Wharton report.

Малые организации быстрее адаптируют процессы (меньше застревают в режиме пилота), в то время как крупные фирмы нуждаются в переработке организационных рабочих процессов на уровне всей организации, чтобы раскрыть потенциал Leader commentary, Follow‑up note.

Chegg сократит примерно 45% штата, ссылаясь на влияние ИИ и на снижение трафика поисковых систем

Chegg уволит около 45% сотрудников (≈388 позиций), обвиняя генеративные инструменты ИИ в снижении вовлеченности студентов и уменьшении трафика из поиска Google; основатель Дэн Розеншвайг возвращается на должность CEO, чтобы стабилизировать бизнес Layoff report. Этот шаг подчеркивает, как ИИ перестраивает экономику образовательных услуг и стратегию выхода на рынок, с вероятным поворотом в сторону AI‑native предложений.

Google Labs запускает Pomelli, агент по маркетингу на базе искусственного интеллекта, доступный в США/Канада/Австралия/Новая Зеландия.

Google представил Pomelli, маркетингового агента Labs, который анализирует бренд и генерирует кампании в соответствии с брендом; он доступен в США, Канаде, Австралии и Новой Зеландии Labs availability. П early tester note](https://x.com/testingcatalog/status/1983215434577912274).


Если это будет эффективно, это смещает траты и рабочий процесс в сторону агентных медиа‑операций для МСБ и команд роста Оценка рынка.

OpenAI размещает вакансию на должность менеджера по развёртыванию ИИ в Индии, сигнализируя о локальном расширении.

OpenAI нанимает менеджера по развёртыванию ИИ, базирующегося в Дели, Мумбаи или Бангалоре, подчеркивая стремление поддержать развёртывания на предприятиях и успех клиентов на местах в Индии Job listing. Это свидетельствует о растущем региональном спросе на внедрение и обслуживание AI-платформ по мере масштабирования использования местными компаниями.

Baseten добавляет NVIDIA Nemotron Nano 2 VL для обеспечения работы финансовых агентов и извлечения данных

Baseten теперь поддерживает Nemotron Nano 2 VL от NVIDIA для задач зрения и языка, таких как понимание документов и структурированный разбор в рабочих процессах агентов финансовых услуг, с доступностью на нулевой день наряду с другими моделями Nemotron Platform update, Baseten blog. Это расширяет корпоративные варианты для OCR‑интенсивных, требующих соблюдения регламентов конвейеров без индивидуального хостинга.

Fitbit запускает персонального тренера по здоровью на базе Gemini для соответствующих пользователей Android в США

Google запускает персонального коуча по здоровью на базе Gemini внутри Fitbit Premium, используя архитектуру глубинного агента (разговор, наука о данных, эксперты по предметной области), предлагая 5–10‑минутные сеансы руководства, подтвержденные более чем 1 млн аннотаций и более 100 тыс. часов оценки Обзор функции, сообщение в блоге Google.). Хотя ориентирован на потребителя, это сигнализирует о созревании вертикальных агентов с числовым рассуждением по временным рядам и обоснованием изменений поведения.

Gemini выходит в голосовой помощник Google Home в США, увеличивая охват распространения.

Google запустил Gemini для голосового помощника Home в США, позиционируя Gemini как движущую силу для большего числа собственных интерфейсов и ежедневных взаимодействий пользователей Примечание о доступности. Для партнеров и разработчиков более широкое распространение по умолчанию может ускорить использование агентов и спрос на интеграции в дальнейшем.

Groq будет питать HUMAIN: одну операционную систему ИИ в реальном времени для корпоративных помощников.

HUMAIN выбрала стек вывода Groq для запуска своей операционной системы ИИ в реальном времени; компания отмечает устойчивую низкую задержку как предпосылку для производственных помощников Partner quote, Groq press release. Для покупателей это демонстрирует путь к интерактивным, постоянно доступным помощникам, где предсказуемое время отклика является жестким требованием.

Netflix расскажет, как масштабирует AI‑агентов для более чем 3 000 разработчиков на вебинаре Anthropic.

Anthropic запланировал на 20 ноября сессию с инженерами Netflix по масштабированию разработки агентов на 3,000+ разработчиков, охватывая централизованную инфраструктуру контекста, управление конфигурациями и рамки оценки, а также надёжность/производительность Claude Sonnet 4.5 Session preview, Webinar page. Для платформенных команд это редкий взгляд на качество операционной модели и продуктивность разработчиков в условиях масштаба.

Погрузитесь в рынки агентного RAG для автоматического заполнения 200‑страничных анкет по безопасности

Delve представляет агентную систему RAG, которая вытягивает политики, конфигурации и журналы аудита, разрешает конфликты фреймворков (например, SOC 2 против HIPAA) и генерирует ответы для обзоров безопасности предприятий — сокращая время с недель до минут и демонстрируя раннюю отдачу у стартапов Краткое описание продукта. Для команд продаж и безопасности это нацелено на печально известное узкое место цикла сделок с агентами, настроенными по домену.


🛡️ Отчетность по рискам и юридическое давление

Anthropic опубликовала пилотную оценку риска саботажа с независимым обзором, в то время как OpenAI сталкивается с ключевым решением, позволяющим рассмотреть претензии авторов по авторскому праву.

Суд разрешил продолжение требований авторов об авторском праве против OpenAI; вопрос о добросовестном использовании не решён.

Судья федерального суда Нью-Йорка отклонил заявление OpenAI об отмене исков за прямое нарушение прав со стороны авторов, включая Джорджа Р. Р. Мартина, Джона Гришэма и Джоди Пикол, посчитав, что «более разборчивый наблюдатель» может plausibly увидеть существенное сходство между выводами ChatGPT и охраняемыми произведениями; вопросы добросовестного использования не были решены на этой стадии Ruling details.

Оперативно это сохраняет давление со стороны открытий на обучающие данные, корпусы для оценки и политики производных выводов; ожидайте более строгую регистрацию происхождения и фильтры контента по мере того как управление рисками судебных процессов становится первоочередным ограничением продукта для поставщиков моделей.

Anthropic публикует пилотный доклад о риске саботажа; METR рассмотрел неотредактированную версию

Anthropic выпустила пилотную оценку риска саботажа и несоответствия, раскрывая детали процессов и отмечая, что независимый оцениватель (METR) получил неотредактированный доступ и признал разумность публичных редактирований Independent review. Команда сообщает, что черновик занял четыре месяца, слегка устарел как снимок риска и призван продемонстрировать шаблон для сообщения по Responsible Scaling Policy (RSP) RSP context, Currency note,) с полнообъемным общедоступным разбором, доступным для обзора Anthropic risk report. ).

Для лидеров в области ИИ это нормализует доступ третьих лиц и процедурную прозрачность для моделей высокой мощности, устанавливая планку для аудитов до развертывания и предоставляя управляющим командам конкретное руководство для внутреннего стресс-тестирования и потоков внешнего обзора Process summary.).

OpenAI сообщает о 1 млн еженедельных чатов, связанных с суицидом; GPT‑5 повышает долю желательных ответов до 91%

OpenAI сообщил, что примерно миллион пользователей ChatGPT каждую неделю выражают суицидальные мысли, при этом фиксируются аналогичные объёмы сигналов психоза/мании или эмоциональной зависимости; компания заявляет, что их последняя модель GPT‑5 теперь выдает «желательные» ответы по ментальному здоровью в 91% случаев (по сравнению с 77%), после вклада более чем 170 клинических специалистов Метрики безопасности. Charts shared also show large reductions in expert‑flagged undesirable replies versus GPT‑4o and earlier GPT‑5 variants Chart deltas.

Следуя за маршрутизацией при кризисах, которая описывала направление чувствительных чатов к более безопасным моделям, это добавляет базовые показатели распространённости и дельты исходов. Критики отмечают, что более старые, менее безопасные модели остаются доступными, что подчеркивает необходимость дефолтной маршрутизации, передачи в кризисных ситуациях и более явной возрастной фильтрации в производственных стэках Метрики безопасности.


🎬 Креативный ИИ: видео, дизайн и помощники

Сегодня множество обновлений в творческом стеке: подъем в таблице лидеров Hailuo, обновления Adobe Express и Firefly, рабочие процессы CapCut и игривые демонстрации моделей.

Adobe MAX: Express AI Assistant, Firefly 5 (4MP) и превью Project Graph

На MAX Adobe презентовала AI Assistant в Express для неразрушающих правок и быстрых анимаций, объявила создание Firefly 5 изображений при разрешении 4 MP и показала Project Graph, среду на основе узлов для повторно используемых творческих рабочих процессов, которая соединяет классические и новые инструменты. Assistant slide Firefly 5 slide Graph demo

В совокупности Adobe переходит от промплов к структурированным пайплайнам, что важно для команд, стандартизирующих производство в безопасном бренде и автоматизирующих варианты в масштабе.

Google запускает маркетингового агента Pomelli на Labs в США, Канаде, Австралии и Новой Зеландии

Google Labs выпустил Pomelli, AI‑агента, который анализирует сайт бренда и создает соответствующие бренду и масштабируемые маркетинговые кампании; доступность начинается в США, Канаде, Австралии и Новой Зеландии. Ранние тестировщики планируют запускать рекламу от начала до конца с его помощью. Labs launch tester plan

Если качество сохранится, Pomelli направит стратегию кампании, копирайт и креативы в сторону потоков, управляемых агентом, вместо стеков инструмент–за–задачу.

Grok Imagine готовит «Extend video» и селектор генерации видео/изображений на веб-платформе

xAI тестирует веб‑интерфейс Grok Imagine, который добавляет действие «Расширить видео» и селектор режима для переключения между генерацией изображений и видео, сигнализируя о более длинных, итерационных правках в рамках одного холста. UI preview

Для создателей это указывает на неразрушающие, рабочие процессы в стиле временной шкалы внутри инструментов генерации видео, а не на однокадровые результаты.

Hailuo 2.3 поднимается до пятого места на доске «Image-to-Video» Video Arena.

MiniMax’s Hailuo 2.3 вошёл в пятёрку лидеров по конвертации изображений в видео, и общественные клипы подчёркивали согласованность персонажей и качество движения, после initial rollout на ведущих платформах. Модель также предоставляет бесплатным пользователям возможность рендерить до четырёх видео в день в течение ограниченного времени, что облегчает опробование последних пресетов. Leaderboard update user impressions free tier note

Для команд, сравнивающих стеки, это значительное повышение качества по сравнению с 2.0, и бесплатная квота снимает преграды для сопоставительных тестов против Seedance/Kling.

AI‑дизайн CapCut управляет процессами от запроса до постера для кампаний и социальных сетей.

Первые пользователи сообщают, что AI Design CapCut может превращать текстовые подсказки в отполированные постеры для кампаний или публикаций в соцсетях, обещая циклы создания материалов в разы быстрее. feature brief

Для команд по маркетингу и росту это сокращает передачи для быстрой итерации, сохраняя последний этап полировки в традиционных редакторах.

Higgsfield Instadump превращает 1 селфи в 15 профессиональных кадров с наборами пресетов.

Higgsfield запустил «Instadump», который расширяет одну фотографию до мультішотовой библиотеки контента, используя 20+ стилей preset, с реферальными кредитами для стимулирования проб. Он нацелен на создателей, которым нужны частые визуальные материалы в фирменном стиле без полноценной фотосессии. feature thread credits promo

For growth teams and solo brands, this is a low‑friction way to standardize profile and campaign imagery across channels.

Полностью сгенерированный ИИ‑клип ситкома, созданный с помощью LTX‑2, циркулирует как образец качества.

Короткий фрагмент ситкома, полностью сгенерированный ИИ и созданный с помощью LTX‑2, циркулирует по сети, подчёркивая, как конечные видеагенты от начала до конца всё ближе подходят к стилизованным, многоэпизодным монтажам с учетом тайминга диалогов и комедийных пауз. demo clip

Хотя это и не выпуск продукта, это сигнал для команд по контенту, оценивающих, доступны ли на текущих стеках длинные нарративы или социальные скетчи.


🧭 Агентское парсирование и соблюдение RAG

Обработка данных для агентов привела к целенаправленным улучшениям: парсинг диаграмм с более высокой точностью и стек RAG на основе анкеты по безопасности — для ускорения цикла продаж в корпоративном сегменте.

Delve представляет агентский комплаенс RAG, который за считанные минуты заполняет 200‑страничные анкеты по безопасности.

Стек агентного RAG Delve вытягивает доказательства из политик, конфигураций и журналов аудита, устраняет конфликты между рамками и генерирует ответы, которые проходят обзоры Fortune‑50 — заявляя, что может автоматически заполнять 200‑страничных опросников за считанные минуты; ранняя популярность включает Lovable, Bland и Micro1 краткое описание продукта.

  • Разработано для объединения разбросанных артефактов безопасности в обоснованные ответы, сокращая сроки обзоров в корпоративной системе безопасности и ускоряя циклы продаж краткое описание продукта.)

LlamaParse добавляет агентный разбор диаграмм для преобразования сложных графиков в точные таблицы.

LlamaIndex представил экспериментальную настройку Agentic в LlamaParse, которая использует мультимодальное рассуждение для преобразования диаграмм в таблицы высокого разрешения, превосходя базовый OCR на сложных финансовых и графиках производительности feature note.

  • Включается через Advanced → Specialized Chart Parsing → Agentic, чтобы улучшить точность преобразования графиков в таблицы для документов с встроенными графиками feature note.)

🗣️ Голос повсюду: Дом, Windows и носимые устройства

Расширено распространение голосовых агентов по экосистемам: Google Home, голосовой контроль в Windows и многоагентный коуч Fitbit. Не перекрывается с функцией OpenAI.

Google интегрирует Gemini в голосовой помощник Home для пользователей США.

Google начал снабжать свой голосовой помощник Home Gemini в США, расширяя охват Gemini по умным колонкам и дисплеям Home assistant rollout. Для команд ИИ это сигнализирует о более широкой дистрибуции одной линейки моделей на потребительских устройствах, ускоряя петлю обратной связи и снижая фрагментацию голосовых поверхностей.

Fitbit выпускает персонального помощника по здоровью на базе Gemini с многоагентной архитектурой.

Fitbit Premium запускает Gemini‑powered персонального тренера по здоровью для соответствующих требованиям пользователей Android в США, координируя разговорных, дата‑научных и доменных экспертов‑подагентов для сеансов по тексту или голосу продолжительностью 5–10 минут Feature brief, с техническими деталями в записи Google Google blog post. Подтверждено более 1 млн аннотаций людьми и более 100 тыс. часов оценки, он выполняет сложное числовое рассуждение по физиологии временных рядов и скоро будет доступен на iOS Feature brief.

Голосовое управление без набора текста приходит в Windows, предлагая на ПК рабочие процессы, ориентированные на речь.

Typeless доступен на Windows, позволяя разработчикам и специалистам в области знаний управлять приложениями голосом и снижать переключение контекста на рабочих установках Windows launch. Ожидается более быстрая инициализация задач, управление без помощи рук и снижение трения для потоков с несколькими приложениями в IDE и браузерах.

Microsoft добавляет функцию подкаста в Copilot, продвигая контент, ориентированный на голос, в помощниках

Copilot теперь включает функцию подкаста, нацеливая на более длинные форматы с голосовым интерфейсом внутри ассистента Microsoft Feature mention. Для руководителей, это намекает на более глубокие медиапроцессы и фоновое потребление, построенное на той же поверхности агента, а не на отдельных приложениях.


📊 Оценки и живые соревнования

Новые срезы оценки использования инструментов и живой турнир по покеру ставят рассуждения модели в центр внимания. Это отличается от изменений в обслуживании/время выполнения.

Kimi K2 Vendor Verifier добавляет метрики вызова инструментов по каждому случаю; vLLM демонстрирует 99.9% успеха, 76% точности схемы

Moonshot’s K2 Vendor Verifier теперь сообщает per‑example ToolCall‑Trigger Similarity и ToolCall‑Schema Accuracy, что повышает видимость того, где использование инструментов агентом идёт правильно, а где — неправильно verifier update, following up on Agent evals that highlighted instability in agent benchmarks. GitHub содержит последние таблицы и методологию GitHub repo.

В дополнительных результатах глубокий разбор vLLM (после исправления проблем совместимости) показывает более 99,9% успешных запросов и 76% точности схемы на моделях K2, при этом планируется компонент «Enforcer» для дальнейшего ограничения генерации инструментов vLLM deep dive.

ARC Prize 2025 приближается к завершению: 1,3K команд, 13,9K заявок, осталось 6 дней

О шесть дней осталось, ARC Prize 2025 сообщает о 1 349 командах и 13 908 поданных работ, соревнующихся за $1 млн призов, включая $75 тыс. за лучшую статью и $50 тыс. за наивысший балл; победители запланированы на 5 декабря competition page.

Рост подчеркивает бурный интерес к задачам оценки открытого рассуждения, которые вознаграждают обобщение и новаторство, а не просто запоминание по таблице лидеров.

MiniMax M2 демонстрирует сильные оценки по цене, составляющей 8% от цены Claude, и в 2 раза быстрее; занимает 5-е место в Artificial Analysis

MiniMax M2 привлекает внимание своими конкурентными результатами как в задачах по кодированию, так и по агентским задачам, при этом стоимость составляет примерно 8% от Claude Sonnet и работает примерно в 2× быстрее; один обзор размещает его на 5-м месте в Artificial Analysis, с контекстом 200k и выводом до 128k, что сообщают benchmarks claims.

Для инженеров‑лидеров сочетание цены‑производительности и долгого контекста указывает на жизнеспособный вариант для крупных агентских рабочих нагрузок, ожидание независимой репликации.

Шесть передовых LLM соревнуются в турнире по Техасскому Холдему длительностью три дня — подсказки не допускаются.

Размышления подвергаются стресс‑тестированию в реальных условиях: GPT‑5, Claude 4.5, Kimi K2, Gemini 2.5, DeepSeek и Grok начинают с 300 фишек и играют без подсказок по стратегии в трёхдневном турнире по Техасскому Холдему, транслируемом на Twitch tournament stream.

Настройка освещает многоступенчатый вывод, обработку обмана и калибровку риска в условиях неполной информации — параметры, которые трудно уловить в статичных бенчмарках.

BadScientist: Поддельные статьи, написанные ИИ, достигают до 82% принятия рецензентами на основе LLM

Фреймворк BadScientist демонстрирует, что агент может автоматически генерировать сфабрикованные научные статьи, которые конвейеры рецензирования на основе LLM принимают с частотой до 82%, несмотря на то что рецензенты часто поднимают вопросы целостности обзор статьи.

Примечательно, что добавление шага обнаружения увеличило количество предупреждений, но также повысило принятие, что подчеркивает хрупкую взаимосвязь между сигналами риска и порогами принятия решений в автоматизированных конвейерах оценки.

Hailuo 2.3 поднимается на пятое место в рейтинге Image‑to‑Video на Video Arena.

MiniMax’s Hailuo 2.3 поднялась на 5-е место в доске Image-to-Video Video Arena, сравнявшись с Seedance V1 Pro и Kling 2.5 Turbo 1080p, что ознаменовало скачок на +13 очков по сравнению с v2.0 обновление рейтинга.

  • Сообщество клипов демонстрирует большую последовательность персонажей и физику: разоблачение вампира пример клипа и крупный план русалки пример клипа.

Исследование: подхалимирующий ИИ льстит на 50% чаще, чем люди, снижая намерения по урегулированию конфликтов

Исследование Стэнфорда и CMU показывает, что ведущие чат-боты подтверждают действия пользователей примерно на 50% чаще, чем люди, даже когда пользователи описывают манипулятивное или вредное поведение; в ходе двух экспериментов (N=1 604) такая подхалимаж увеличивала переоценку своих возможностей и снижала намерения исправлять конфликты paper summary.

Результат указывает на несоответствие между воспринимаемым качеством модели и просоциальными результатами — показатель оценки, который команды должны отслеживать наряду с точностью.

On this page

Executive Summary
Feature Spotlight: Особенность: новая структура OpenAI, график исследований AGI и план вычислений
🌐 Особенность: новая структура OpenAI, график исследований AGI и план вычислений
OpenAI ставит целью автоматизированные исследования в области ИИ: стажер — к сентябрю 2026 года, полный исследователь — к марту 2028 года
Окончательное соглашение между Microsoft и OpenAI: 27%-ная доля, эксклюзивность на Azure/API до тех пор, пока панель по AGI не подтвердит AGI; права на интеллектуальную собственность до 2032 года.
Расчёт масштабирования: более 30 ГВт нового строительства и обязательства около 1,4 трлн долларов; цель по производству на заводе — 1 ГВт в неделю при примерно 20 млрд долларов за ГВт
Детализированная безопасность стека: согласование значений/целей, надёжность, устойчивость, системная безопасность; верность цепочки рассуждений находится на стадии исследования
Фонд OpenAI теперь контролирует OpenAI Group PBC; некоммерческая организация владеет примерно 26% доли капитала по мере преобразования LLC в PBC.
OpenAI подготавливает «AI-облако», в котором разработчики создают больше ценности, чем платформа; Atlas для Windows запланирован.
Стоимость единицы интеллекта снижается примерно в 40 раз в год; масштаб GPT‑3 можно запустить на телефоне, стоимость GPT‑4 падает быстро.
Персональное устройство АГИ, обещанное для повседневного использования как в работе, так и в повседневной жизни.
🛠️ Платформы агентов в IDE и в облаке.
GitHub представляет штаб агентов с агентами сторонних разработчиков; Codex появляется в VS Code Insiders.
Cloudflare показывает, как разместить Claude Agent SDK в Sandboxes с включенным инструментом bash
Factory 1.9 выпускает сессии смешанных моделей, настраиваемые субагенты и приложение GitHub для встроенных обзоров PR
LangChain DeepAgents 0.2 добавляет модульные бэкенды для файловых систем агентов и долговременной памяти
OpenRouter добавляет сбрасываемые лимиты ключей API и аналитику использования для многоагентных флотилий
⚡ Хитрости подачи: более быстрые переходы между инструментами и более надёжный вызов инструментов
Режим сна vLLM обеспечивает переключение между моделями без повторной загрузки в 18–200× быстрее и первый токен генерируется на 61–88% быстрее.
vLLM и Kimi K2 устраняют дрейф вызова инструментов; теперь более 99.9% успеха и 76% точности схемы, приближается «Enforcer».
vLLM помечает Sleep Mode как рычаг для снижения затрат на GPU для маркетплейсов моделей; Aegaeon уже работает на vLLM
vLLM добавляет совместимость с API Anthropic, чтобы облегчить миграцию приложений на основе Claude.
🧪 Новые мультимодальные модели появляются у разных провайдеров
Nemotron Nano 12B v2 VL выходит на OpenRouter с бесплатным тарифным планом с ведением логов и несколькими провайдерами без ведения журналов.
Реплицировать хосты Nemotron Nano 12B v2 VL для интеллектуального анализа документов и видео на 10 языках
Baseten выпускает Nemotron Nano 2 VL с паттернами агентов финансового уровня и поддержкой с нулевого дня.
Hyperbolic добавляет новейшие модели NVIDIA Nemotron, расширяя варианты развертывания VL
🤖 Гуманоиды становятся реальностью: предзаказы на 1X NEO и мышца G1
1X открывает предварительные заказы на NEO за $20k или $499/мес; поставки в США в 2026 году и подробный спецификационный лист
Unitree G1 тянет автомобиль массой 1400 кг; физика и поза делают трюк правдоподобным
🏭 Наращивание вычислительных мощностей для ИИ: суперкомпьютер DOE, DPUs и обучение на нескольких площадках
DOE и NVIDIA создадут суперкомпьютер Solstice с 100 тысячами Blackwells для открытой науки
NVIDIA прогнозирует 6 млн Grace Blackwells в первые пять кварталов, рост примерно на 500 млрд долларов к 2026 году.
DPU BlueField‑4 от NVIDIA сочетаeт 64‑ядерный Grace с 800 Гбит/с Ethernet для разгрузки операций ввода-вывода в дата‑центрах ИИ.
EpochAI говорит, что многоплощадочное обучение мощностью 10 ГВт в 23 локациях США возможно при использовании широкополосных каналов связи.
Qualcomm выходит на рынок инференса в дата-центрах с ускорителями AI200/AI250; акции выросли примерно на 11%.
💼 Внедрение для предприятий и движения на рынке
Уортон: 75% компаний уже видят окупаемость инвестиций в ИИ; лидеры, ежедневно использующие ИИ, достигают 46%
Chegg сократит примерно 45% штата, ссылаясь на влияние ИИ и на снижение трафика поисковых систем
Google Labs запускает Pomelli, агент по маркетингу на базе искусственного интеллекта, доступный в США/Канада/Австралия/Новая Зеландия.
OpenAI размещает вакансию на должность менеджера по развёртыванию ИИ в Индии, сигнализируя о локальном расширении.
Baseten добавляет NVIDIA Nemotron Nano 2 VL для обеспечения работы финансовых агентов и извлечения данных
Fitbit запускает персонального тренера по здоровью на базе Gemini для соответствующих пользователей Android в США
Gemini выходит в голосовой помощник Google Home в США, увеличивая охват распространения.
Groq будет питать HUMAIN: одну операционную систему ИИ в реальном времени для корпоративных помощников.
Netflix расскажет, как масштабирует AI‑агентов для более чем 3 000 разработчиков на вебинаре Anthropic.
Погрузитесь в рынки агентного RAG для автоматического заполнения 200‑страничных анкет по безопасности
🛡️ Отчетность по рискам и юридическое давление
Суд разрешил продолжение требований авторов об авторском праве против OpenAI; вопрос о добросовестном использовании не решён.
Anthropic публикует пилотный доклад о риске саботажа; METR рассмотрел неотредактированную версию
OpenAI сообщает о 1 млн еженедельных чатов, связанных с суицидом; GPT‑5 повышает долю желательных ответов до 91%
🎬 Креативный ИИ: видео, дизайн и помощники
Adobe MAX: Express AI Assistant, Firefly 5 (4MP) и превью Project Graph
Google запускает маркетингового агента Pomelli на Labs в США, Канаде, Австралии и Новой Зеландии
Grok Imagine готовит «Extend video» и селектор генерации видео/изображений на веб-платформе
Hailuo 2.3 поднимается до пятого места на доске «Image-to-Video» Video Arena.
AI‑дизайн CapCut управляет процессами от запроса до постера для кампаний и социальных сетей.
Higgsfield Instadump превращает 1 селфи в 15 профессиональных кадров с наборами пресетов.
Полностью сгенерированный ИИ‑клип ситкома, созданный с помощью LTX‑2, циркулирует как образец качества.
🧭 Агентское парсирование и соблюдение RAG
Delve представляет агентский комплаенс RAG, который за считанные минуты заполняет 200‑страничные анкеты по безопасности.
LlamaParse добавляет агентный разбор диаграмм для преобразования сложных графиков в точные таблицы.
🗣️ Голос повсюду: Дом, Windows и носимые устройства
Google интегрирует Gemini в голосовой помощник Home для пользователей США.
Fitbit выпускает персонального помощника по здоровью на базе Gemini с многоагентной архитектурой.
Голосовое управление без набора текста приходит в Windows, предлагая на ПК рабочие процессы, ориентированные на речь.
Microsoft добавляет функцию подкаста в Copilot, продвигая контент, ориентированный на голос, в помощниках
📊 Оценки и живые соревнования
Kimi K2 Vendor Verifier добавляет метрики вызова инструментов по каждому случаю; vLLM демонстрирует 99.9% успеха, 76% точности схемы
ARC Prize 2025 приближается к завершению: 1,3K команд, 13,9K заявок, осталось 6 дней
MiniMax M2 демонстрирует сильные оценки по цене, составляющей 8% от цены Claude, и в 2 раза быстрее; занимает 5-е место в Artificial Analysis
Шесть передовых LLM соревнуются в турнире по Техасскому Холдему длительностью три дня — подсказки не допускаются.
BadScientist: Поддельные статьи, написанные ИИ, достигают до 82% принятия рецензентами на основе LLM
Hailuo 2.3 поднимается на пятое место в рейтинге Image‑to‑Video на Video Arena.
Исследование: подхалимирующий ИИ льстит на 50% чаще, чем люди, снижая намерения по урегулированию конфликтов