Режим ChatGPT Agent открывается на 3 платных тарифа — в Sudoku в 4,5 раза быстрее.

Stay in the loop

Get the Daily AI Primer delivered straight to your inbox. One email per day, unsubscribe anytime.

Executive Summary

OpenAI только включила режим агента (Atlas) внутри ChatGPT для Plus, Pro и Business, превратив продукт из окна чата в помощника с кликом и действием. Это важно, потому что Atlas работает напрямую в браузере — исследование, планирование и выполнение шагов — без связующего кода, который требуют большинство агентов. Ранние тесты противоречивы: одно исследование показывает, что он решает средние судоку примерно в 4,5 раза быстрее человеческой базовой линии, но сталкивается с рефлексивно-тайминговыми играми вроде Chrome T‑Rex Runner и Flappy Bird. Поддержка Windows отсутствует в этой тестовой версии, и развертывание следует за краткой паузой на расширениях Atlas по вопросам безопасности.

Опытные пользователи говорят, что базовые функции — навигация, чтение, простые клики — ощущаются устойчивыми, но Atlas часто застревает при создании или форматировании внутри веб-приложений с плотной структурой DOM. Новая «мышление» View тоже не помогает существенно; автопрокрутка всё время тянет вас к низу, что затрудняет аудит траектории рассуждений в процессе работы. Продвинутые пользователи, сравнивающие его с Comet от Perplexity, утверждают, что «пока нет причин переключаться» — разве Atlas докажет себя в реальных задачах, особенно в создании контента и рабочих процессах редактирования.

Если вы рассматриваете настольных агентов, обратите внимание на параллельную дорожку: Codex CLI от OpenAI на этой неделе добавил экспериментальную песочницу Windows, что намекает на более строгие рамки для операций агентов, даже несмотря на то, что собственная сборка Atlas для Windows пока не доступна в этой превью.

Feature Spotlight

Особенность: Режим агента ChatGPT становится практическим.

Режим агента ChatGPT (Atlas) выходит в предпросмотр для Plus/Pro/Business, позволяя агентам исследовать, планировать и действовать в браузере — ранние оценки показывают преимущества в логических задачах, но есть пробелы в управлении в реальном времени; поступает широкий отклик пользователей.

Сегодня фокус на кросс‑аккаунтах: режим агента OpenAI (Atlas) открывает предварительный просмотр для Plus/Pro/Business. Темы включают реальное использование, отзывы по UX и раннюю оценку веб‑игр; сильные навыки решения судоку, слабый рефлекс. Этот раздел отвечает за все элементы Atlas.

Jump to Особенность: Режим агента ChatGPT становится практическим. topics

📑 Table of Contents

🧭 Особенность: Режим агента ChatGPT становится практическим.

Сегодня фокус на кросс‑аккаунтах: режим агента OpenAI (Atlas) открывает предварительный просмотр для Plus/Pro/Business. Темы включают реальное использование, отзывы по UX и раннюю оценку веб‑игр; сильные навыки решения судоку, слабый рефлекс. Этот раздел отвечает за все элементы Atlas.

Режим агента ChatGPT открывает предварительный просмотр для пользователей Plus, Pro и Business.

OpenAI включила Agent Mode в ChatGPT (Atlas) для платных аккаунтов, позволяя агентам исследовать, планировать и предпринимать действия во время просмотра OpenAI announcement. Релиз следует за extensions pause, который временно отключил расширения браузера Atlas по соображениям безопасности.

Прямые подсказки и раннее тестирование уже циркулируют среди опытных пользователей hands-on try.)

Статья: Atlas отлично справляется со средним Судоку — примерно в 4,5 раза быстрее людей, но испытывает трудности с играми, где важна скорость реакции.

Новоe исследование изучает ChatGPT Atlas как агента веб-игр: он чисто решает средний Судоку примерно в 4,5 раза быстрее гуманной базы, но терпит неудачи на задачах в реальном времени, таких как T‑Rex Runner в Chrome и Flappy Bird из-за требования точного тайминга paper summary. Работа соотносит сильные стороны с логикой на основе правил и слабые стороны с управлением на длинной горизонте и физикой.

  • Сильные стороны: Судоку и другие логические головоломки (быстрое, последовательное выполнение) paper summary
  • Слабые стороны: рефлекторное время реагирования, строгая геометрия и задачи в открытом мире (частые ранние сбои или задержки) paper summary

Paper first page

Ранние обзоры ставят Atlas против Perplexity Comet; отмечено отсутствие поддержки Windows.

Практикующие, тестирующие режим Atlas Agent ChatGPT, сравнивают его с Comet от Perplexity, утверждая, что «нет причин переходить» пока Atlas не окажется лучше — и отмечают, что он ещё недоступен для Windows в этой превью-версии comparative take. Пробные запросы распространяются, чтобы проверить реальные задачи hands-on try.

Автопрокрутка трассировки мышления раздражает пользователей Atlas, которые пытаются прочитать историю рассуждений.

Ранний UX-фидбек говорит, что новый режим «thinking» автоматически прокручивает к нижнему краю с каждым вводом, из-за чего трудно просматривать текущий ход рассуждений во время выполнения UX note. Пользователи просят более удобные средства управления, чтобы приостанавливать или просматривать промежуточные мысли, не борясь с прокруткой.

Продвинутые пользователи говорят, что Atlas тормозит на задачах создания с большим количеством DOM, несмотря на то, что базовый просмотр работает.

Практические отчеты хвалят Atlas за простые клики и навигацию, но отмечают, что он «зависает» при добавлении, форматировании или создании контента внутри сложных веб-приложений (богатая структура DOM) обратная связь продвинутого пользователя. Тестировщики хотят более решительных действий для редактирования и составления, а не только чтения и кликов.


🏗️ ИИ-инфраструктура: кампусы, энергия и финансирование

Новости инфраструктуры доминируют: кампус Stargate OpenAI мощностью свыше 1 ГВт в Мичигане, запуск площадки Anthropic у Amazon, солнечные сделки Meta на мощность 1 ГВт и капитальные расходы, финансируемые за счет долга. За исключением Atlas (раскрывается в разделе Feature).

Amazon запускает ИИ-кампус в Индиане для Anthropic с более чем 500 тыс. Trainium 2, нацелившись на развертывание мощностью 2,2 ГВт.

Сайт Amazon в Нью-Карлайле, Индиана, посвящённый Anthropic, запущен в эксплуатацию, работает на более чем 500 000 чипах Trainium 2 и планируется охватить 30 зданий мощностью 2,2 ГВт по завершении News summary, продолжающая тему Rainier site, который зафиксировал огромное количество чипов и энергопотребление. Проект превратит бывшие кукурузные поля в много-миллиардный центр AI-вычислений примерно за год, укрепляя стремление AWS по вертикальному владению мощностями обучения ИИ для ключевых партнёров.

Заголовок статьи

OpenAI выбирает Мичиган для кампуса Stargate мощностью более 1 ГВт; «самая крупная инвестиция в истории штата»

OpenAI построит дата-центр Stargate мощностью в гигаватт в Салайн Тауншип, строительство запланировано на начало 2026 года, 2 500 рабочих мест в строительстве по профсоюзам, примерно 450 постоянных должностей и использование воды по замкнутому контуру (без забора из Великих озёр) Local coverage. Компания также описала программу Stargate с несколькими площадками в своём сообщении, подчеркивая инфраструктурную развертку ИИ в США OpenAI blog.

Долговая волна финансирует развитие ИИ: капитальные затраты на ИИ теперь составляют около 25% предложения облигаций США инвестиционного уровня; Meta $30 млрд, Oracle $18 млрд, RPLDCI $27 млрд

Данные Bank of America показывают, что заимствования на финансирование дата-центров искусственного интеллекта взлетели в сентябре–октябре, при этом ИИ сейчас составляет примерно 25% рынка облигаций инвестиционного уровня в США; недавние примеры включают Meta на 30 млрд долл., Oracle на 18 млрд и Related Digital на 27 млрд Debt chart.). Meta также готовит ещё одну продажу на 25 млрд долл., поскольку заранее размещает капитальные вложения, ориентированные на ASI Bond sale plan.). Финансирование сосредоточено на самом дешёвом капитале у действующих игроков, способных согласовать долгосрочные контракты с жизненным циклом чипов. Debt issuance chart

Samsung и NVIDIA собираются построить ИИ «мега‑фабрику» с 50 тыс. GPU; cuLitho нацелена на примерно в 20 раз более быструю вычислительную литографию.

Samsung и NVIDIA создадут фабрику на базе ИИ с поддержкой GPU для запуска цифровых двойников фабрики, ускорения разработки чипов и ускорения коррекции оптической близости с cuLitho (сообщается ~20× быстрее), одновременно интегрируя Blackwell/Jetson Thor в робототехнику фабрики WSJ summary. Запуск основных рабочих нагрузок по производству чипов на GPUs вместо CPU кластеров сигнализирует о структурном сдвиге вычислений внутри самого полупроводникового производства.

Samsung дисплей

TSMC очищает фабрику A14 в Тайчжуне на примерно 49 млрд долл. для технологии 1,4 нм; массовое производство запланировано на вторую половину 2028 года

TSMC получила разрешения на строительство фабрики A14 и вспомогательных зданий в Тайчжуне, ставя цель 1,4 нм с примерно 15% скоростью на iso‑power или примерно на 25–30% меньшую потребляемую мощность при iso‑perf по сравнению с 2 нм, риски оцениваются в 2027 году и выпуск во второй половине 2028 года Сводка местных новостей. Узел утверждает, что прирост мощности на ватт критически важен для кривых стоимости ускорителей ИИ, при этом избегание High‑NA EUV снижает риск инструментов.

A14 headline

Модель UBS прогнозирует структуру единиц NVIDIA до 4-го квартала 2026 года с наращиванием GB200 и Rubin CPX на горизонте.

Диаграмма разбивки единиц UBS показывает отгрузки NVIDIA по семействам ускорителей до конца 2026 года, при этом GB200 и далее B300/GB300 набирают долю, пока H100/H200 исчезают UBS chart. Сочетание подразумевает продолжение давления в цепочке поставок в сторону деталей класса Blackwell и предварительный просмотр того, когда на кривой появится следующий ген Rubin CPX.

NVDA unit mix

Google Cloud поднимается на волне ИИ; Alphabet прогнозирует капитальные расходы в размере 91–93 млрд долл. в 2025 году и даёт сигнал о более крупном строительстве в 2026 году.

Подразделение облачных сервисов Alphabet перешло от отстающего к драйверу роста на спросе на ИИ, руководство прогнозирует капитальные расходы на 2025 год в диапазоне 91–93 млрд долларов и предупреждает о еще большем наращивании в 2026 году анализ Reuters. Стратегия Google опирается на TPU, открытые для внешних лабораторий, подписавшие девять из десяти ведущих компаний в области ИИ и закрепляющие размещение будущих нагрузок ИИ.

изображение статьи

RPO и математика амортизации разделяют капитальные вложения в ИИ на два цикла: краткосрочные по контрактам и спекулятивные сборки

Аналитика Financial Times подчеркивает расхождение в качестве контрактов и единичной экономики: у Microsoft RPO на сумму примерно $400 млрд со сроком примерно 2 года конвертируется в денежные средства быстрее, тогда как у других — более длительная, неровная подверженность; растущая амортизация и списания (например, до примерно 16,8% выручки) ужесточает контроль за маржей, по мере того как краткосрочное ИИ-оборудование заполняет дата-центры FT анализ. Результатом становится краткосрочный цикл, удерживаемый бэклогом, наряду с более длинным циклом спекулятивного роста, предполагающего будущий спрос.

Акции Meta падают на 11%, капитальные вложения в ИИ на 2025 год увеличены до 70–72 млрд долларов; инвесторы ставят под сомнение краткосрочную окупаемость инвестиций.

Несмотря на то, что Meta превзошла ожидания по Q3, её акции упали на 11%, после того как компания увеличила capex на 2025 год до $70–$72 млрд ради продвижения суперинтеллекта, при этом для 2026 года намечены ещё более крупные расходы CNBC summary. Реакция подчеркивает чувствительность рынка к открытым планам расходов на ИИ без конкретных сроков монетизации сервисов.

CNBC headline

Чиновники штата Мичиган подробно рассказали о рабочих местах Stargate и мерах по охране окружающей среды для кампуса OpenAI.

Офис губернатора Уитмера представляет проект Stargate как крупнейшее по объему единое вложение штата, приводя в пример 2 500 рабочих в строительстве по профсоюзам, примерно 450 рабочих на месте, замкнутую систему охлаждения и отсутствие водозабора из Великих озёр Local coverage. Привлекательная для выдачи разрешений инфраструктура и средства сообщества, привязанные к проекту, иллюстрируют, как кампусы ИИ договариваются о местном принятии.


🛠️ Инструменты builder: агенты по кодированию и научные помощники

Большой день для инструментов агентов/разработчиков за пределами Atlas: нативный вызов инструментов и утверждения Cline, установщик Claude Code + обновление, углублённые исследования Opera, Kimi CLI с MCP и расследования Vercel Agent. Исключена функция Atlas.

Codex CLI v0.53 добавляет экспериментальную песочницу для файловой системы и сети Windows

OpenAI’s Codex CLI v0.53 представляет крайне экспериментальную Windows‑песочницу для записей в рамках рабочего пространства и управляемого сетевого доступа, с режимом подтверждения по запросу и известным предупреждением для папок с глобальными правами записи sandbox brief, and GitHub discussion. Это выпускается через несколько дней после предыдущих улучшений CLI update которые фокусировались на откате и стабильности.

Claude Code v2.0.31: веб-поиск Vertex, Shift+Tab на Windows и исправления MCP

Обновление версии 2.0.31 обновляет переключение режима в Windows на Shift+Tab, добавляет Web Search на Vertex, по умолчанию учитывает .gitignore VS Code и исправляет конфликты имён субагентов/MCP, ошибки уплотнения и поведение удаления плагина changelog.

Карточка журнала изменений

Мелкие эргономические улучшения, такие как надёжность /compact и исправления дубликатов сводки, нацелены на долгосрочные потоки агентов changelog.

Kimi CLI: технический предварительный просмотр — интерфейс оболочки с выполнением команд, интеграция Zsh и MCP

Moonshot выпустил KIMI CLI (технический предпросмотр), терминал‑родной агент по кодированию, с интерфейсом, похожим на оболочку, прямым выполнением команд, бесшовной интеграцией Zsh, поддержкой MCP и протоколом клиента агента для более широкого инструментария feature brief.

баннер Kimi CLI

Это снижает трение при кодировании с участием агентов и автоматизаций непосредственно из консоли feature brief.

Vercel Agent добавляет автоматизированные «Investigations» для инцидентов; кредит на $100 для новых пользователей

Vercel Agent может теперь автоматически обнаруживать аномалии и проводить расследования на основе ИИ, которые коррелируют телеметрию и предлагают шаги по устранению неисправностей, с целью сократить MTTR для проблем в продукционной среде; новые пользователи получают $100 кредита blog post, и Vercel blog. Это продвигает агентские операции за пределы статических уведомлений к анализу первопричины как встроенный рабочий процесс.

FactoryAI Droid может импортировать агентов Claude напрямую из .claude/agents.

Droid теперь поддерживает «Импорт из Claude (.claude/agents)», что делает агентов Claude портируемыми в рантайме Droid без повторной авторизации feature screenshot.

Меню импорта Claude

Это сокращает время настройки для команд, которые стандартизируются на Claude Skills, во время экспериментов с альтернативными оркестраторами.

LangChain получил компетентность AWS Generative AI; LangSmith теперь доступен на AWS Marketplace

LangChain присоединился к программе AWS Generative AI Competency и разместил LangSmith на AWS Marketplace, что обеспечивает агент‑инженерные рабочие процессы (отслеживание, оценки, развертывания) с согласованием ISV Accelerate для совместных продаж partner update.

AWS partner badge

Это решение упрощает закупку и управление для команд, стандартизирующих Bedrock, SageMaker и сервисы данных AWS.

LlamaIndex предоставляет встроенный поиск MCP, чтобы программные агенты могли напрямую обращаться к его документации.

LlamaIndex добавил нативную конечную точку поиска MCP для своей документации, позволяя MCP‑активированным кодовым агентам напрямую вызывать инструменты поиска (без пользовательского связующего кода), что упрощает создание агентов, которым нужен контекст, точный по API docs update. Это хорошо сочетается с редакторскими агентами, которые планируют, извлекают и цитируют в рамках одного запуска.

Ollama v0.12.8 повышает Qwen3‑VL и стабильность движка; настольная версия добавляет контроль за затратами на рассуждения

Ollama 0.12.8 улучшает производительность Qwen3‑VL (по умолчанию FlashAttention, лучшая обработка прозрачности) и обработку подсказок движка; Windows теперь игнорирует неподдерживаемые iGPU заметки к выпуску,) и выпуск на GitHub.). Настольное приложение также предоставляет пер‑чатовый выбор «уровня рассуждений», чтобы балансировать между скоростью и глубиной пользовательский интерфейс рабочего стола.)

Карточка релиза

Opera выпускает Deep Research Agent в Neon для анализа веб-страниц длительного формата

Opera запустила ODRA (Opera Deep Research Agent) в браузере Opera Neon, объединив сбор источников, суммирование и более глубокий многостраничный анализ в встроенного исследовательского помощника feature brief. Это помещает агентного исследователя прямо в обычный браузер без расширений, полезно для конкурентного/рыночного сканирования и обзоров литературы.

Perplexity запускает агент «Patents» для исследований в области IP, бесплатно в бета-версии для подписчиков.

Perplexity выпустила Patents agent, который структурирует и ищет в IP‑корпорациях как управляемый рабочий процесс исследования, доступный бесплатно в бета‑версии для подписчиков обзор функций. Это целевой помощник для проверки предшествующего уровня техники и ландшафта технологий в рамках знакомого UX‑опыта исследования.


🧪 Модели: «thinking» Qwen и мультимодальный Nemotron на vLLM

Избирательные обновления моделей, релевантные разработчикам: Qwen3 Max Thinking попадает в арены, а Nemotron Nano 2 VL поступает на vLLM. Обновления только во время выполнения (например, движок Ollama) живут в Systems, а не здесь.

Qwen3 Max Thinking появляется в LM Arena, сигнализируя о выпуске

The «мышление» вариант Qwen3 Max surfaced in LMSYS Arena, with community posts indicating rollout is underway and broader evals imminent Arena update, release note, release hint. В контексте Ollama Qwen3‑VL, который локально добавил VL‑линейку, это поднимает рассуждающий (reasoning‑first) уровень Qwen в публичные head‑to‑heads.

Arena model card

Ожидайте быстрых неформальных бенчмарков по математике, кодированию и рабочим процессам агентов по мере накопления точек данных Arena; ранее предупреждение также отмечало сроки «в течение часов» для релиза release tease.

vLLM добавляет NVIDIA Nemotron Nano 2 VL (12B) для анализа видео и документов

vLLM теперь обслуживает NVIDIA Nemotron Nano 2 VL, 12‑миллиардный гибрид Transformer–Mamba VLM с контекстом 128k и эффективной выборкой видео для устранения повторяющихся токенов в длинных видео — нацелено на более быстрые, точные мультимодальные рассуждения по документам с несколькими изображениями и видео пост интеграции, блог vLLM. Разработчики получают готовый к использованию в предприятиях путь к агентам VLM с высокой пропускной способностью, с весами, предлагаемыми в форматах BF16/FP8/FP4‑QAD, и сильные результаты на MMMU, MathVista, AI2D и задачах с большой OCR‑нагрузкой, как указано в релизе.


🧩 Совместимость: рабочие процессы MCP и импорт агентов

MCP‑центричный подход нацелен на связывание инструментов и агентов. Фокус — на межинструментальной совместимости; особенности IDE, зависящие от реализации, размещаются в разделе Tooling.

LlamaIndex добавляет встроенную точку поиска MCP для инструментов агента.

LlamaIndex выпустил нативный endpoint поиска MCP, чтобы рантаймы агентов могли вызывать инструменты поиска на базе LlamaIndex напрямую, при этом документация для строителей доступна по адресу MCP search docs. The move lowers glue-code and standardizes search access across MCP-compatible IDEs and orchestrators, following Replit templates that made MCP server deployment a one‑minute task.

Это должно упростить связывание доступа к данным с код-ассистентами и исследовательскими агентами без bespoke adapters, и помочь прийти к MCP в качестве дефолтной поверхности межоперационного взаимодействия для вызовов инструментов.

Claude Code v2.0.31 выпускает исправления стабильности субагента MCP.

Anthropic’s Claude Code v2.0.31 исправляет крайний случай MCP («Tool names must be unique»), который ломал некоторые конфигурации подагентов, вместе с исправлениями удаления плагинов и уплотнения Changelog details. Еженедельный обзор также выделяет возобновляемые подагенты и нового подагента Plan, который может работать с инструментами MCP Weekly roundup.)

Скриншот журнала изменений

Для проектов с интенсивной совместной работой исправление бага MCP разблокирует стеки агентов с несколькими инструментами и снизит хрупкое поведение при подключении нескольких MCP-серверов в единый план.

FactoryAI Droid теперь может импортировать агентов Claude напрямую

FactoryAI добавила «Import from Claude (.claude/agents)» в Droid, позволяя командам загружать агентов, созданных Claude, непосредственно в сессии Droid для повторного использования и расширения Import menu screenshot. Это снижает трение миграции между экосистемами и поощряет портативность агентов между стеками.

Droid import menu

Практически это делает рабочие процессы, определённые Claude, полноценной частью Droid без повторного создания навыков или инструментов, ускоряя эксперименты между инструментами.

Kimi CLI — технический предпросмотр с поддержкой MCP и Agent Client Protocol

Moonshot выпустила технический предварительный просмотр Kimi CLI, который объединяет оболочкоподобный интерфейс, выполнение команд и интеграцию Zsh с поддержкой MCP сервера и Протокола клиента агента, позиционируя CLI как центр взаимозаменяемого использования инструментов Kimi CLI announcement.)

Kimi CLI graphic

Для разработчиков агентов нативный MCP в рабочем процессе терминала означает более быстрое локальное прототипирование цепочек инструментов, более простое тестирование возможностей сервера и переносимость между средами выполнения агентов, поддерживающих MCP.

CopilotKit + LangGraph: демонстрация предиктивных обновлений состояния с участием человека в процессе синхронизации

CopilotKit продемонстрировал «предиктивные обновления состояния», подключая свой интерфейс в реальном времени к агентам LangGraph таким образом, что правки проходят как структурированные рабочие процессы (переписывания агентами → утверждение человеком → синхронизация в реальном времени), а не как линейные диффы текста Workflow post. Эта схема делает совместное редактирование агентов более естественным, при этом люди сохраняют контроль над окончательными изменениями.

Для инженеров, настраивающих инструменты, это практическое руководство по взаимодействию между оркестратором (LangGraph), состоянием UI и вызовами инструментов агентов — полезно там, где инструменты MCP и не-MCP сервисы сосуществуют.


💼 Корпоративное внедрение и партнёрства

Сигналы коммерциализации: сделка Perplexity с Getty за лицензионные изображения, путь LangChain к компетентности AWS и к Marketplace, и приобретение Weavy компанией Figma для медиа‑пайплайнов на базе ИИ.

Amazon открывает AI-центр в Индиане для Anthropic с более чем 500 тыс. чипов Trainium 2 и планом мощностью 2,2 ГВт

Amazon запустила свой крупнейший центр обработки данных ИИ для Anthropic в Нью-Карлайле, Индиана — работающий более чем 500 000 чипов Trainium 2, масштабируемый до 30 зданий и запланированной нагрузкой 2,2 ГВт news brief,) с последующим обзором initial build, который обозначал цель по 0,5–1,0M Trainium в этом году.

AWS data center article

Посвященный кампус подчеркивает глубокое, долгосрочное согласование между покупателем и поставщиком — между гиперскалером и передовой лабораторией, имеющее материальные последствия для мощности обучения моделей и кривых затрат.

Perplexity заключает многолетнюю лицензию Getty Images на показ фотографий с указанием авторства в ИИ-поиске

Perplexity заключила много‑летний лицензионный договор с Getty Images, чтобы её ответы ИИ могли показывать лицензированные редакционные и креативные фотографии с указанием авторства и ссылками, что является заметным шагом к «правильно атрибутированному согласию». Акции Getty выросли примерно на 45–50% после новости deal coverage.

TechCrunch card

Соглашение формализует права на изображения для ИИ‑поиска и следует за программой распределения доходов издателя Perplexity; вместе они указывают на цепочку поставок платного контента для результатов ИИ.

Figma покупает Weavy и представляет «Figma Weave» для пайплайнов генерации медиа с использованием ИИ

Figma приобрела израильскую компанию Weavy из Тель-Авива и представила бренд «Figma Weave», привнеся канву на основе узлов, которая соединяет несколько моделей ИИ для генерации и редактирования изображений и видео с детальным управлением на уровне слоёв; Weavy на начальном этапе будет работать как отдельное решение, прежде чем появится более глубокая интеграция с Figma deal summary.)

Логотипы Weavy и Figma

Такой шаг позволит Figma занять большую долю AI‑медиа рабочего процесса (генерация подсказок, освещение, ракурсы, композитинг) внутри канвы, ориентированной на дизайнеров.

LangChain получает компетентность AWS в области генеративного ИИ; LangSmith теперь на AWS Marketplace

LangChain присоединился к программе AWS Generative AI Competency и разместил LangSmith на AWS Marketplace, с правом ISV Accelerate и статусом “Deployed on AWS” — давая предприятиям проверенный, удобный для закупок путь к разработке агентов (отслеживание, оценки, развертывания) partner badge post.

AWS партнерский значок

Позиционирование, не зависящее от фреймворка, означает, что команды могут внедрять LangSmith как с LangChain/langgraph, так и без них, подключаясь к Bedrock, SageMaker, S3, Opensearch и др.

Modal и Datalab объединились, чтобы разработчики могли развернуть Marker + Surya OCR на GPU за считанные минуты, с закешированными весами и автомасштабированием, что обеспечивает примерно в 10× выше пропускную способность парсинга; hosted API, поддерживаемый Modal, также доступен для максимальной пропускной способности партнерский пост, и настройка задокументирована в руководстве Modal Modal blog post.

партнерская графика

Это приносит детерминированный, безгаллюцинационного стека документ‑интеллекта в эластичную, готовую к эксплуатации среду.


⚙️ Системы: песочницы и локальные рантаймы

Обновления инженерии сервинга и рантайма: песочница Codex для Windows для более безопасного запуска агентов и улучшения движка Ollama и настольного приложения для практичных локальных рабочих процессов.

Codex CLI v0.53 добавляет экспериментальную песочницу для Windows, чтобы безопаснее запускать агентов.

OpenAI внедрила экспериментальную файловую систему и сетевую песочницу на Windows, которая ограничивает действия агента рабочим пространством с подтверждением по запросу, обеспечивая более жесткие границы для запусков Codex. В продолжение к обновлению v0.52, которое было сосредоточено на стабильности, этот релиз описывает режим записи в рабочую область и флаги, а также ключевой нюанс: записи остаются возможными в каталогах, где у SID Everyone в Windows уже есть разрешение на запись. См. настройки флагов установки и ограничения в документации sandbox flags, и живые документы и призыв к обратной связи через страницу GitHub и обсуждение GitHub docs, testing call.

Ollama v0.12.8 улучшает локальный Qwen3-VL за счет FlashAttention и исправлений движка

Ollama выпустила v0.12.8 с улучшениями производительности Qwen3‑VL (FlashAttention включён по умолчанию), более быстрой обработкой подсказок и исправлениями движка, такими как лучшая обработка прозрачных изображений и игнорирование несовместимых встроенных GPU на Windows. В примечаниях к выпуску также упоминаются исправления приложения, такие как корректная остановка модели перед удалением и исправление переключателей мышления DeepSeek в новом настольном приложении release notes, с полными деталями в журнале изменений GitHub release.\n\n v0.12.8 release banner

MicroVM Northflank помогают масштабировать безопасные производственные песочницы во время интенсивного трафика запуска.

cto.new сообщает о переходе на микроVM Northflank для масштабирования безопасных песочниц агентов через всплеск, ссылаясь на оплату по секундам, provisioning через API и тысячи ежедневных развёртываний контейнеров без потери производительности. Кейсовое исследование выделяет прагматичный путь изолирования рабочих нагрузок и сглаживания пиков спроса на рабочие процессы агентов case study post, с подробностями развёртывания в описании провайдера Northflank blog.

northflank blog header

Ollama desktop добавляет для каждого чата показатель «затраты на рассуждения» и элементы управления выбором модели.

Новый настольный интерфейс Ollama предоставляет селектор «уровень рассуждений» на уровне чата (например, Medium) рядом с выбором модели, позволяя пользователям на лету балансировать задержку и точность, не выходя из разговора. Это практичный регулятор для локальных запусков при переключении между лёгкими и более вдумчивыми режимами, зафиксировано в обновлённом скриншоте панели инструментов desktop UI screenshot.

desktop UI controls


🛡️ Безопасность, злоупотребления и права

Политика и заметки по угрозам и разведке: группы по авторским правам на музыку сходятся во мнении относительно правил регистрации ИИ; отдельный пост демонстрирует автоматическое обнаружение ботнета в продакшене. Технология песочницы живет в Systems.

ASCAP, BMI и SOCAN договорились регистрировать частично созданные ИИ-песни; полностью ИИ-созданные произведения остаются неподходящими для регистрации.

Три крупнейшие PRO Северной Америки теперь будут принимать регистрации музыкальных произведений с существенным человеческим авторством, которое включает элементы, созданные ИИ, тогда как произведения, созданные исключительно ИИ, остаются непригодными. Группы также повторяют, что обучение на музыке, защищённой авторским правом, без разрешения является нарушением, и указывают на продолжающиеся судебные иски против компаний, занимающихся ИИ Policy overview.

  • Политики ориентированы на человеческое авторство как основу прав, при этом создавая путь к кредитованию и выплатам, когда в производство вовлечены инструменты ИИ Policy overview.

Policy alignment graphic

Vercel BotID автоматически блокирует сложную ботнет‑сеть примерно за 5 минут после скачка трафика на 500%.

Vercel сообщает, что его BotID Deep Analysis зафиксировала внезапный рост трафика на 500% от скоординированной бот-сети, выявила ~40–45 поддельных профилей браузеров, вращающихся через прокси-узлы, и автоматически повторно проверила и заблокировала сессии примерно за пять минут — никаких действий со стороны клиента не требуется Отчет об инциденте, Vercel blog.

  • Система зафиксировала отпечатки и поведение, схожие с человеческими, а затем использовала корреляцию между профилями браузера и прокси для классификации атаки перед внедрением блокировок Vercel blog.)

🧠 Рецепты обучения: точность, адаптеры и зацикливание

Практикующие и публикации по обучению и рассуждению: FP16 против BF16 для стабильности RL‑FT, адаптеры с нулевой задержкой и компромиссы LoopLM от ByteDance.

Samsung’s zFLoRA объединяет адаптеры для настройки с нулевой задержкой.

Samsung Research представляет zFLoRA, объединённый низкоранговый адаптер, который сливает веса адаптера во в базовые слои, фактически устраняя дополнительное умножение матриц и трафик памяти, которые делают классический LoRA медленнее (LoRA может добавить до ~2.5× времени заполнения префикса и ~1.6× времени декодирования) paper abstract. Результаты по 18 задачам на моделях 1B/3B/7B демонстрируют точность, сопоставимую с LoRA и близкую к почти полному FT, с задержкой, измеряемой на GPU H100 и NPUs, оставаясь близкой к времени работы базовой модели paper abstract.

paper first page

Инженеры предпочитают FP16 перед BF16 в тонкой настройке с обучением с подкреплением, чтобы снизить расхождение между обучением и инференсом.

Практики утверждают, что 10 бит мантисы FP16 (по сравнению с 7 битами BF16) уменьшают дрейф политики между обучением и инференсом в донастройке RL, улучшая числовое согласование ядер и поглощая шум округления поток практиков.); тот же поток позже исправляет источник графика, сохраняя основное утверждение без изменений, подчеркивая растущий интерес к выбору прецизионности для стабильности исправление графика,) с указанием на другие сигналы о неизбежном переходе на FP16 в производственных циклах обучения комментарий инженера.); см. связанный поток статей, цитируемый в обсуждении, для дополнительного контекста по компромиссам прецизионности ArXiv paper.)

график точности

ByteDance’s LoopLM Ouro заменяет повторение глубиной; небольшие модели выигрывают, экстраполяции за пределами T=4 нет.

Ouro 1.4B/2.6B повторно применяет один и тот же стек трансформеров для T рекуррентных шагов (обучен при T=4) на 7.7T токенов, обучая задачи с несколькими переходами на меньшем количестве примеров и добавляя обучаемый механизм раннего выхода для упрощения входов analysis thread. Компромиссы: 4× FLOPs при выводе T=4, прироста точности нет при продвижении рекуррентности за пределы обученной глубины, и стандартные трансформеры с не связанной глубиной выигрывают в сравнении по вычислительной сложности — хотя LoopLMs выглядят сильнее по параметрам и при ограничениях памяти/KV analysis thread.

Потери CISPO RL исправляют схлопывание цепочек рассуждений CoT, вызванное отсечением, что позволяет строить более длинные цепочки рассуждений.

Авторы рассказывают, как клиппинг PPO вне политики подавлял маловероятные «мыслительные токены» (например, «подождите», «но», «пусть я скажу»), подавляя развитие цепочки рассуждений; CISPO восстанавливает поток градиента, когда преимущества положительны, при этом сохраняя стабильность, что приводит к приросту длины, похожему на он-полиси, без дивергенции оригинная ветка. Унифицированная формулировка, охватывающая REINFORCE и PPO, представлена, с сообщениями о близкой к R1 производительности на Qwen2.5‑32B во внутреннем прогоне и детальными выводами по маскированию и поведению клиппирования математические детали, пост Zhihu.

loss equations


🗂️ Данные агента: RAG‑поисковики и высокопроизводительный парсинг

Новые ресурсы для извлечения и инфраструктура парсинга: семейство Nemotron RAG от NVIDIA, Datalab Marker на Modal GPUs и агент, ориентированный на патенты, от подписчиков Perplexity.

Marker на GPU Modal обеспечивает примерно в десять раз большую пропускную способность парсинга документов.

Modal и Datalab запустили готовую развёртку стека Marker + Surya OCR: кэширование весов, развёртывание на GPU за менее чем пять минут и авто‑масштабирование для обработки всплесков, что даёт примерно в 10× большую пропускную способность для извлечения структурированных документов по сравнению с базовыми на CPU Collab note, и Blog post.) Команды, которым не хочется самостоятельно развёртывать систему, также могут использовать размещённый API Marker от Datalab, который работает на GPU‑бэкэнде Modal для максимальной пропускной способности Hosted API note.

Deployment graphic

NVIDIA публикует коллекцию Nemotron RAG, включающую текстовые данные, мультимодальные данные, разметку и «Omni» извлекатели.

NVIDIA выпустила набор моделей для поиска на Hugging Face, охватывающий текстовые ретриверы, мультимодальные ретриверы, детекторы макета и новые ретриверы «Omni», которые охватывают изображение, текст и аудио — лицензированы для коммерческого использования, что делает их готовыми к внедрению блоками для RAG-систем Model roundup, и Hugging Face collection.). Разновидности «Omni» расширяют модальности для пайплайнов поиска, полезны для корпоративного поиска документов и медиа Omni retrievers.)

Список моделей

OpenRouter запускает каталог эмбеддингов между провайдерами

OpenRouter представил просматриваемый каталог моделей эмбеддингов от разных провайдеров — полезно для поиска, повторной ранжировки и конвейеров для векторных БД, предоставляющий цены, лимиты и быструю фильтрацию в одном месте Release note, и Model directory. Эта подборка упрощает опробование альтернатив без привязки к провайдеру Browse page.

Embeddings banner

Perplexity дебютирует агент «Patents» для исследований в области интеллектуальной собственности (IP)

Perplexity добавила агента, ориентированного на патенты, который упрощает рабочие процессы исследований в области интеллектуальной собственности, при этом продвинутые возможности доступны бесплатно во время бета‑периода для подписчиков Примечание к функции. Этот ход расширяет поиск в стиле RAG в структурированные патентные корпусы для должной проверки и конкурентного анализа.


📚 Исследование: использование компьютера, декодирование, память и рассуждение на основе видео

Свежие статьи за пределами обучающих рецептов: кросс-платформенные агенты по использованию компьютеров Surfer 2, полный контроль над декодированием AutoDeco, геометрическая память в последовательностных моделях и ограничения нулевого шага рассуждений по видео.

Surfer 2 объединяет веб-, настольные и мобильные агенты, используемые на компьютере, опережая предыдущие системы.

Новая статья представляет Surfer 2, одностадийную архитектуру агента, которая обобщает использование компьютеров в сети, на рабочем столе и на мобильных устройствах, при этом превосходя ранние системы по точности и выполнению задач аннотация к статье.

Аннотация к статье

После песочничного использования Windows 365 в рамках Copilot boost, этот результат предлагает базу для научной базы по кросс‑платформенной привязке действий и обучению политик интерфейса пользователя с более сильной обобщацией, чем у ранее существовавших агентов для одной среды.

AutoDeco позволяет LLM обучаться собственной политике декодирования, выходя за пределы настроек, заданных вручную.

«Конец ручной декодировки» предлагает AutoDeco — архитектуру, в которой модель учится контролировать собственную стратегию декодирования — выбирая режимы выборки и ограничения сквозь весь процесс — вместо опоры на фиксированные эвристики (например, температура, пороги ядра) скриншот статьи.

[изображение:https://pbs.twimg.com/media/G4muDB1XMAADbbq.png|Заголовок статьи и аннотация]

Подход нацелен на снижение расхождения между обучением и выводом и хрупкой настройки на уровне подсказок за счёт интеграции вариантов декодирования в саму обученную политику; детали включают контроллер, который адаптирует параметры декодирования в зависимости от контекста и циклы обратной связи по целям.

Трансформеры и Mamba запоминают как геометрию, решая запросы на пути с 50 тыс. узлов за один шаг

Исследование показывает, что глубокие последовательностные модели (Transformers, Mamba) склонны формировать геометрические памяти: узлы в графе знаний кодируются таким образом, что многошаговые пути становятся почти однопошаговыми проверками расстояния, достигая до 100% точности на незнакомых путях в графах примерно из 50 тысяч узлов первых страницах статьи.)

[изображение:https://pbs.twimg.com/media/G4oT2f-a4AAGbpF.jpg|Первая страница статьи]

Работа демонстрирует конкуренцию между ассоциативными (lookup) и геометрическими представлениями, причём базовая модель Node2Vec обучает ещё более чистую геометрию, связанную с лапласианом графа — последствия включают более быстрое многопошаговое рассуждение и более надёжное извлечение без явной цепочки размышлений.

Видео-генераторы не являются нулево‑шотными рассуждателями: MME‑CoF баллы меньше 2/4 и не справляются на длинных цепочках

MME‑CoF бенчмарк тестирует модели преобразования текста в видео (например, класс Veo‑3) по 12 областям рассуждений и устанавливает, что они в среднем ниже 2/4, справляясь с короткими локальными шагами, но терпят неудачу в долгосрочной логике, строгой геометрии и причинных ограничениях benchmark paper.

Benchmark first page

Оценщики отмечают плавные клипы, которые тем не менее нарушают правила (неточности счёта, ошибки синхронизации, пропуски в загромождении), подчёркивая разрыв между визуальной достоверностью и надёжным процедурным рассуждением в условиях zero‑shot.


📊 Оценки и отслеживание возможностей

Измерительные данные вне Atlas Feature: исправлены дельты баллов GPT‑5 и квартальный обзор, показывающий, что GPT‑5 (высокий) снова занимает лидирующую позицию. Здесь повторов запусков других моделей нет.

EpochAI устраняет ошибку оценки GPT-5; «высокий» теперь опережает «средний», ничья по ECI.

EpochAI исправила ошибку в проверках Inspect, из-за которой вызовы GPT‑5 с настройкой рассуждений на «high» тайно сводились к «medium». Обновлённые прогоны показывают, что GPT‑5 (high) немного опережает GPT‑5 (medium) по нескольким бенчмаркам, в то время как оба теперь сравнимы по Epoch Capabilities Index. Смотрите графики бенчмарков и доверительные интервалы в обновлении corrected scores. РŹ источником проблемы была устаревшая версия Inspect, которая игнорировала параметр «reasoning effort» для моделей OpenAI, если имя начиналось не с «o» (например, o3); обновление Inspect устранило это bug cause.

benchmarks chart

  • Примечательные дельты: OTIS Mock AIME 2024–2025 (~92% против ~87%), GPQA Diamond (~85% против ~83%), FrontierMath T4 (~13% против ~9%) corrected scores.

Ежеквартальное состояние ИИ: GPT‑5 (высокий) лидирует; США и Китай доминируют в выпуске моделей

Последний квартальный обзор Artificial Analysis показывает, что GPT‑5 (high) вновь занимает первую позицию в их индексе интеллекта, при этом крупные технологические компании продвигаются по различным модальностям, а меньшие конкуренты специализируются. В докладе также подчеркивается доминирование США и Китая в выпуске новых моделей, при этом относительно немногие участники появляются из других стран ключевые моменты отчета, сайт доклада.)

[изображение:https://pbs.twimg.com/media/G4mnrT9acAAWK6Y.jpg|графика доклада]

  • Распространение по модальностям: действующие участники развивают проекты в тексте, видении, аудио и агентских системах; конкуренты сосредотачиваются на нишевых сильных сторонах примечания к отчету.)

🎃 Креативный ИИ: хэллоуинские эффекты, музыка и рецепты

Большой объем творческих материалов: клипы персонажа Sora, фильтры ужаса Minimax/Kling, инструменты ElevenLabs Music и Halloween‑руководства на основе Veo от Gemini. Этот раздел собирает новости медиа, не связанные с разработкой.

Higgsfield выпускает 1080p Halloween horror pack с Minimax + Kling, бесплатными генераторами и промо на кредиты.

Higgsfield запустил сезонный набор из 13 трансформаций Minimax и 4 «кошмара» Kling (оборотень, дьявол, переход ворона и другие) с выводом 1080p и ограниченными по времени бесплатными генерациями и розыгрышами кредитов внутри приложения обзор функций, заметка о бесплатных генерациях. Единственный целевой лендинг показывает однокликовые “хэллоуинские предустановки” и глобальную доступность поток промо, с деталями и примерами на сайте Хэллоуинские предустановки.

«Monster Manor» Соры и инструменты персонажей питают хэллоуинские короткометражки от создателей

OpenAI выделил хэллоуинский сет «Monster Manor», действие которого происходит в Sora, и призвал к сезонным творениям, в то время как создатели демонстрировали многоминутные короткометражки, используя новую функцию Characters в приложении Sora Monster Manor, creator short, characters note. Это следует за credit packs, где OpenAI заинтриговал Characters, выходящие в веб, и платные Cameos; теперь опыт использования приложения подталкивает стабильные посты в духе «Soraween» Soraween post.

ElevenLabs Music добавляет разделение стемов и инпейтинг, запускает 24‑часовое радио на Хэллоуин и промо на 50%.

ElevenLabs выпустила разделение стемов музыки и инструменты in‑painting для точного контроля ремиксов, наряду с однодневной станцией Хэллоуина «Radio Eleven» и двухнедельной скидкой 50% на планы Music feature rundown. Радио внутри приложения будет работать 24 часа с ужасающими ремиксами и спектральными вокалами radio announcement.

Halloween radio UI

Gemini делится руководством по созданию ко Дню Хэллоуина: монстры Veo 3.1, идеи костюмов, «анимировать кошмары» и приглашения

Команда Gemini опубликовала компактную инструкцию по сезонному контенту: генерируйте жутких существ с Veo 3.1, придумывайте образы костюмов, создавайте полные макеты костюмов, анимацируйте сцены кошмаров и автоматически проектируйте приглашения на вечеринки — все внутри приложения Gemini и Studio how-to thread, Veo creature, costume ideas, animate nightmares, costume builder, party invites. Обзор страницы продукта содержит детали по генерации и редактированию изображений (также известные как “Nano Banana”) советы и инструкции по запросам Gemini image guide.

ComfyUI проводит прямую трансляцию Wan 2.2 Animate с советами по управлению и качеству

ComfyUI провёл хэллоуинскую прямую трансляцию на Wan 2.2 Animate, охватывая практические настройки для управления движением и качества вывода, где ведущие разборно объясняли конвейер обработки и делились рецептами для последовательных результатов event announcement. Сообщение‑сопровождение содержит ссылку на сессию и примечания по времени и ведущим для просмотра по запросу event replay. Wan 2.2 баннер события

Генерация изображений ChatGPT демонстрирует годовые приросты по запросу на набор костюмов на Хэллоуин.

«Повторный промпт» («те сумки, в которых хранят дешёвые костюмы, но которые делают сами костюмы по-настоящему странными») привёл к более острым и остроумным концепциям упаковки — вроде «Sesame Loaf» («Сезамовая буханка»), «Beige Carpet Stain» («Бежевое пятно на ковре») и «Possessed CAPTCHA» («Одержимый CAPTCHA») — что подчеркивает улучшение визуального остроумия и точности компоновки за последний год image examples.

Funny costume images

On this page

Executive Summary
🧭 Особенность: Режим агента ChatGPT становится практическим.
Режим агента ChatGPT открывает предварительный просмотр для пользователей Plus, Pro и Business.
Статья: Atlas отлично справляется со средним Судоку — примерно в 4,5 раза быстрее людей, но испытывает трудности с играми, где важна скорость реакции.
Ранние обзоры ставят Atlas против Perplexity Comet; отмечено отсутствие поддержки Windows.
Автопрокрутка трассировки мышления раздражает пользователей Atlas, которые пытаются прочитать историю рассуждений.
Продвинутые пользователи говорят, что Atlas тормозит на задачах создания с большим количеством DOM, несмотря на то, что базовый просмотр работает.
🏗️ ИИ-инфраструктура: кампусы, энергия и финансирование
Amazon запускает ИИ-кампус в Индиане для Anthropic с более чем 500 тыс. Trainium 2, нацелившись на развертывание мощностью 2,2 ГВт.
OpenAI выбирает Мичиган для кампуса Stargate мощностью более 1 ГВт; «самая крупная инвестиция в истории штата»
Долговая волна финансирует развитие ИИ: капитальные затраты на ИИ теперь составляют около 25% предложения облигаций США инвестиционного уровня; Meta $30 млрд, Oracle $18 млрд, RPLDCI $27 млрд
Samsung и NVIDIA собираются построить ИИ «мега‑фабрику» с 50 тыс. GPU; cuLitho нацелена на примерно в 20 раз более быструю вычислительную литографию.
TSMC очищает фабрику A14 в Тайчжуне на примерно 49 млрд долл. для технологии 1,4 нм; массовое производство запланировано на вторую половину 2028 года
Модель UBS прогнозирует структуру единиц NVIDIA до 4-го квартала 2026 года с наращиванием GB200 и Rubin CPX на горизонте.
Google Cloud поднимается на волне ИИ; Alphabet прогнозирует капитальные расходы в размере 91–93 млрд долл. в 2025 году и даёт сигнал о более крупном строительстве в 2026 году.
RPO и математика амортизации разделяют капитальные вложения в ИИ на два цикла: краткосрочные по контрактам и спекулятивные сборки
Акции Meta падают на 11%, капитальные вложения в ИИ на 2025 год увеличены до 70–72 млрд долларов; инвесторы ставят под сомнение краткосрочную окупаемость инвестиций.
Чиновники штата Мичиган подробно рассказали о рабочих местах Stargate и мерах по охране окружающей среды для кампуса OpenAI.
🛠️ Инструменты builder: агенты по кодированию и научные помощники
Codex CLI v0.53 добавляет экспериментальную песочницу для файловой системы и сети Windows
Claude Code v2.0.31: веб-поиск Vertex, Shift+Tab на Windows и исправления MCP
Kimi CLI: технический предварительный просмотр — интерфейс оболочки с выполнением команд, интеграция Zsh и MCP
Vercel Agent добавляет автоматизированные «Investigations» для инцидентов; кредит на $100 для новых пользователей
FactoryAI Droid может импортировать агентов Claude напрямую из .claude/agents.
LangChain получил компетентность AWS Generative AI; LangSmith теперь доступен на AWS Marketplace
LlamaIndex предоставляет встроенный поиск MCP, чтобы программные агенты могли напрямую обращаться к его документации.
Ollama v0.12.8 повышает Qwen3‑VL и стабильность движка; настольная версия добавляет контроль за затратами на рассуждения
Opera выпускает Deep Research Agent в Neon для анализа веб-страниц длительного формата
Perplexity запускает агент «Patents» для исследований в области IP, бесплатно в бета-версии для подписчиков.
🧪 Модели: «thinking» Qwen и мультимодальный Nemotron на vLLM
Qwen3 Max Thinking появляется в LM Arena, сигнализируя о выпуске
vLLM добавляет NVIDIA Nemotron Nano 2 VL (12B) для анализа видео и документов
🧩 Совместимость: рабочие процессы MCP и импорт агентов
LlamaIndex добавляет встроенную точку поиска MCP для инструментов агента.
Claude Code v2.0.31 выпускает исправления стабильности субагента MCP.
FactoryAI Droid теперь может импортировать агентов Claude напрямую
Kimi CLI — технический предпросмотр с поддержкой MCP и Agent Client Protocol
CopilotKit + LangGraph: демонстрация предиктивных обновлений состояния с участием человека в процессе синхронизации
💼 Корпоративное внедрение и партнёрства
Amazon открывает AI-центр в Индиане для Anthropic с более чем 500 тыс. чипов Trainium 2 и планом мощностью 2,2 ГВт
Perplexity заключает многолетнюю лицензию Getty Images на показ фотографий с указанием авторства в ИИ-поиске
Figma покупает Weavy и представляет «Figma Weave» для пайплайнов генерации медиа с использованием ИИ
LangChain получает компетентность AWS в области генеративного ИИ; LangSmith теперь на AWS Marketplace
Modal становится партнером Datalab для масштабирования конвейеров OCR Marker, обеспечивая примерно в 10 раз большую пропускную способность на GPU.
⚙️ Системы: песочницы и локальные рантаймы
Codex CLI v0.53 добавляет экспериментальную песочницу для Windows, чтобы безопаснее запускать агентов.
Ollama v0.12.8 улучшает локальный Qwen3-VL за счет FlashAttention и исправлений движка
MicroVM Northflank помогают масштабировать безопасные производственные песочницы во время интенсивного трафика запуска.
Ollama desktop добавляет для каждого чата показатель «затраты на рассуждения» и элементы управления выбором модели.
🛡️ Безопасность, злоупотребления и права
ASCAP, BMI и SOCAN договорились регистрировать частично созданные ИИ-песни; полностью ИИ-созданные произведения остаются неподходящими для регистрации.
Vercel BotID автоматически блокирует сложную ботнет‑сеть примерно за 5 минут после скачка трафика на 500%.
🧠 Рецепты обучения: точность, адаптеры и зацикливание
Samsung’s zFLoRA объединяет адаптеры для настройки с нулевой задержкой.
Инженеры предпочитают FP16 перед BF16 в тонкой настройке с обучением с подкреплением, чтобы снизить расхождение между обучением и инференсом.
ByteDance’s LoopLM Ouro заменяет повторение глубиной; небольшие модели выигрывают, экстраполяции за пределами T=4 нет.
Потери CISPO RL исправляют схлопывание цепочек рассуждений CoT, вызванное отсечением, что позволяет строить более длинные цепочки рассуждений.
🗂️ Данные агента: RAG‑поисковики и высокопроизводительный парсинг
Marker на GPU Modal обеспечивает примерно в десять раз большую пропускную способность парсинга документов.
NVIDIA публикует коллекцию Nemotron RAG, включающую текстовые данные, мультимодальные данные, разметку и «Omni» извлекатели.
OpenRouter запускает каталог эмбеддингов между провайдерами
Perplexity дебютирует агент «Patents» для исследований в области интеллектуальной собственности (IP)
📚 Исследование: использование компьютера, декодирование, память и рассуждение на основе видео
Surfer 2 объединяет веб-, настольные и мобильные агенты, используемые на компьютере, опережая предыдущие системы.
AutoDeco позволяет LLM обучаться собственной политике декодирования, выходя за пределы настроек, заданных вручную.
Трансформеры и Mamba запоминают как геометрию, решая запросы на пути с 50 тыс. узлов за один шаг
Видео-генераторы не являются нулево‑шотными рассуждателями: MME‑CoF баллы меньше 2/4 и не справляются на длинных цепочках
📊 Оценки и отслеживание возможностей
EpochAI устраняет ошибку оценки GPT-5; «высокий» теперь опережает «средний», ничья по ECI.
Ежеквартальное состояние ИИ: GPT‑5 (высокий) лидирует; США и Китай доминируют в выпуске моделей
🎃 Креативный ИИ: хэллоуинские эффекты, музыка и рецепты
Higgsfield выпускает 1080p Halloween horror pack с Minimax + Kling, бесплатными генераторами и промо на кредиты.
«Monster Manor» Соры и инструменты персонажей питают хэллоуинские короткометражки от создателей
ElevenLabs Music добавляет разделение стемов и инпейтинг, запускает 24‑часовое радио на Хэллоуин и промо на 50%.
Gemini делится руководством по созданию ко Дню Хэллоуина: монстры Veo 3.1, идеи костюмов, «анимировать кошмары» и приглашения
ComfyUI проводит прямую трансляцию Wan 2.2 Animate с советами по управлению и качеству
Генерация изображений ChatGPT демонстрирует годовые приросты по запросу на набор костюмов на Хэллоуин.