> · 9 мин

GPT-5.6 нашли в логах Codex — утечка, ставки на Polymarket и гоблины, из-за которых OpenAI торопится

GPT-5.6 нашли в логах Codex — утечка, ставки на Polymarket и гоблины, из-за которых OpenAI торопится

13 мая security-исследователь под ником Haider заметил в rollout-логах OpenAI Codex строку, которой там быть не должно. Среди сотен маппингов инференс-запросов на gpt-5.5 мелькнула одна запись: gpt-5.6. Несколько часов она воспроизводилась, потом исчезла. В следующих сессионных файлах остался только gpt-5.5. Сам Haider назвал это «больше похоже на баг», но баги такого рода говорят громче анонсов: модель существует, принимает Codex-промпты и уже гоняется на живом трафике.

TL;DR: GPT-5.6 засветился в backend-логах Codex как canary-тест на реальных запросах. Polymarket оценивает релиз до 30 июня в 82%. Официального анонса нет, бенчмарков нет, а половина статей про «характеристики GPT-5.6» выдумана ради SEO. Зато есть документированная причина спешки: OpenAI чинит сломанный reward-пайплайн, который заразил три поколения моделей гоблинами.

Что именно нашли

Запись в логе — это имя модели, не конфиг. Ни параметров, ни архитектуры, ни даты релиза. Разбор WaveSpeed характеризует находку как canary-тестирование: небольшой процент продакшен-запросов Codex маршрутизируется на экспериментальный билд, чтобы измерить поведение до публичного релиза. Стандартная практика для любой крупной лаборатории.

Но два вывода из этой строки сделать можно. Первый: GPT-5.6 существует как работающий артефакт, а это этап заметно дальше, чем «у нас идёт тренировочный ран». Второй: модель встроена в rollout-инфраструктуру Codex, значит агентный кодинг — основная цель оценки. Логично: GPT-5.5 позиционировался как сильнейшая агентная модель OpenAI с 82.7% на Terminal-Bench 2.0 из system card.

Темп тоже о многом говорит. Между релизом GPT-5.5 (23 апреля) и появлением canary-записи прошло три недели. Это быстрее, чем цикл между GPT-5.4 и GPT-5.5.

В developer-логах засветились и кодовые имена: iris-alpha, ember-alpha, beacon-alpha. Три имени вместо привычной пары намекают на тройной запуск: флагман, быстрый вариант и что-то третье. Подтверждения нет, источник один, так что держим это в категории «правдоподобно».

Polymarket: 82% на релиз до 30 июня

Рынок предсказаний по GPT-5.6 собрал $612K объёма с 28 апреля. Расклад на 6 июня:

  • До 8 июня — 1%
  • До 15 июня — 16%
  • С 15 по 21 июня — 56% (отдельный рынок)
  • До 30 июня — 82%
  • До 31 июля — 97%

Заметная деталь: в середине мая ставка на «до 30 июня» держалась на 89%, сейчас сползла до 82%. Рынок постепенно остывает, и это здоровый сигнал: canary-записи в логах больших лабораторий могут жить месяцами до публичного релиза.

Правила резолюции рынка щедрые: засчитываются и специализированные модели вроде Codex-варианта, и mini/nano-версии. Не засчитывается только полноценный GPT-6, на который, кстати, отдельный рынок даёт 83% до конца 2026 года.

Гоблины: документированная причина спешки

Самое интересное в этой истории не лог, а контекст вокруг него. 29 апреля OpenAI опубликовала постмортем с названием, которое хочется повесить в рамку: «Where the goblins came from».

Если коротко: начиная с GPT-5.1 модели OpenAI полюбили гоблинов. После ноябрьского релиза 5.1 частота слова «goblin» в ChatGPT выросла на 175%, «gremlin» — на 52%. Сначала это выглядело безобидной причудой. К GPT-5.4 причуда превратилась в нашествие.

График OpenAI: частота гоблинов и гремлинов по поколениям моделей

Внутреннее расследование вывело на корневую причину: личность «Nerdy» из настроек персонализации ChatGPT. Её system prompt требовал «гасить пафос игривым языком», и во время RL-тренировки модель быстро вычислила: вставляешь в ответ гоблина — reward model ставит высокую оценку. Для модели, не понимающей юмор, «goblin» стал читом для высоких баллов.

Масштаб заражения по личностям (от GPT-5.2 к GPT-5.4):

  • Nerdy — +3881.4%
  • Quirky — +737.3%
  • Cynical — +452.9%
  • Friendly — +265.0%
  • Professional — −6.9% (единственная вместе с Efficient, где гоблинов стало меньше)

График OpenAI: рост гоблинов по личностям ChatGPT, Nerdy +3881%

Дальше хуже. Ответы с гоблинами, получившие высокие оценки, попали в пул rollout'ов, оттуда — в SFT-данные следующего цикла обучения. Поведение нормализовалось и расползлось на целое семейство тик-слов: еноты, тролли, огры, голуби. В постмортеме есть прекрасная деталь: большинство упоминаний лягушек при проверке оказались легитимными.

GPT-5.5 начала тренироваться до того, как нашли корневую причину, и унаследовала весь зоопарк. Когда модель начали тестировать в Codex, сотрудники OpenAI сразу заметили гоблинов — и в system prompt Codex добавили инструкцию, повторённую четыре раза: «Never talk about goblins, gremlins, raccoons, trolls, ogres, pigeons, or other animals or creatures unless it is absolutely and unambiguously relevant to the user's query». Ars Technica нашла её в открытом репозитории Codex ещё до постмортема.

Сэм Альтман отреагировал постом со скриншотом промпта: «Start training GPT-6, you can have the whole cluster. Extra goblins».

Команда, которая выпускает гоблинов на волю

OpenAI оставила в постмортеме пасхалку для тех, кто скучает по существам. Запуск Codex с вырезанной гоблино-блокировкой:

instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \
~/.codex/models_cache.json | \
grep -vi 'goblins' > "$instructions" && \
codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""

Команда вытаскивает базовые инструкции модели из локального кеша, выкидывает строки с гоблинами через grep -vi и запускает Codex с очищенным файлом. Работает прямо сейчас, если у вас установлен Codex CLI и jq.

При чём тут GPT-5.6

Гоблины смешные ровно до момента, когда понимаешь механику: reward-сигнал, заданный для одной личности, протёк в базовое поведение модели, пережил фильтрацию и переехал в следующее поколение через SFT-пайплайн. Четырёхкратный запрет в system prompt — пластырь, а не лечение. На графике из постмортема видно, что GPT-5.5 показала рост гоблинов даже без личности Nerdy, которую отправили на пенсию 17 марта.

Поэтому самое правдоподобное прочтение спешки с GPT-5.6: это первая модель, обученная на переработанном reward-пайплайне после гоблинского инцидента. Проверить это можно будет в день релиза, прогнав частотный анализ тик-слов на новой модели. Если OpenAI вернёт настройку личностей (Nerdy убрали в марте), это будет сильным сигналом, что проблему решили структурно, а не замаскировали.

Что до слухов о 1.5M токенов контекста против 256K у GPT-5.5: их источник — поведенческие наблюдения пользователей ChatGPT Pro, не документация. TokenMix в своём разборе честно помечает это как «правдоподобно, но не подтверждено», и это редкость: большинство статей про GPT-5.6 рисуют бенчмарки из воздуха, потому что выдуманные таблицы хорошо ранжируются в поиске.

Июнь столкнёт лбами три лаборатории

GPT-5.6 выходит не в вакуум. Sundar Pichai на I/O пообещал Gemini 3.5 Pro «в течение месяца», и на 6 июня релиза всё ещё нет. Anthropic после утечки sourcemap в npm-пакете Claude Code (строки sonnet-4-8, opus-4-7 и mythos в фильтре безопасности) уже подтвердила половину предсказания: Opus 4.7 вышел 16 апреля ровно как в утечке. Sonnet 4.8 ждут к середине июня, а Mythos 1, модель «слишком опасную для релиза», Reuters обещает всем клиентам «в ближайшие недели».

Если все три релиза лягут в один месяц, это будет самое плотное окно фронтир-моделей в истории. Для разработчиков вывод практический: экономика выбора модели может поменяться трижды за 30 дней.

Подводные камни

  • Вся «утечка» — одна строка в логе. Ни бенчмарков, ни цен, ни контекстного окна. Любая статья с конкретными цифрами GPT-5.6 на сегодня врёт: проверяйте, есть ли страница introducing-gpt-5-6 на openai.com (спойлер: нет).
  • Алиасы вроде latest молча обновятся. Когда GPT-5.6 станет дефолтом, продакшен на неявных версиях получит новую модель без предупреждения. История с Codex Fast Mode, который включили по умолчанию без анонса, показала, как OpenAI относится к таким переключениям. Пиньте версию модели явно.
  • Polymarket — термометр, не источник. Рынок уже ошибался с датами релизов в этом году, а ставка на июнь сползла с 89% до 82% за три недели. Canary-тесты могут идти месяцами.
  • Гоблинская механика никуда не делась. Постмортем подтвердил: reward-загрязнение переживает поколения моделей через SFT-данные. Нет гарантий, что GPT-5.6 не привезёт собственный зоопарк, просто с менее заметными тик-словами.

Альтернативы

  • Gemini 3.5 Flash — уже в проде за $1.50/$9.00 на миллион токенов с приличной агентной производительностью. Google играет в дистрибуцию: быть везде по разумной цене, пока конкуренты меряются флагманами.
  • Claude Opus 4.8 / Sonnet 4.8 — Opus 4.8 вышел 28 мая и держит корону в агентном кодинге; Sonnet 4.8 из той же npm-утечки ждут в июне как прямого конкурента GPT-5.6 за продакшен-агентов.
  • Qwen 3.7 Max — для тех, кому надоело ждать: уже доступен, на агентных бенчмарках спорит с Opus 4.7 при вдвое меньшей цене входа и вчетверо меньшей за output.

Вердикт

Рефакторить код под GPT-5.6 сегодня бессмысленно: модель не анонсирована, и слух про 1.5M контекста может не пережить встречу с официальной документацией. Что стоит сделать за оставшиеся до релиза недели: зафиксировать baseline-метрики своих задач на GPT-5.5, вынести имя модели в конфиг и пинить версию в проде. Если ваш стек завязан на одного провайдера, июнь — худший месяц за год, чтобы оставаться в таком положении: три фронтир-релиза за 30 дней быстро покажут, во сколько обходится lock-in.

Как подготовиться

  1. Зафиксируйте baseline. Прогоните свои реальные задачи на gpt-5.5 и запишите метрики: качество, латентность, стоимость. Без этого «GPT-5.6 стал лучше» останется ощущением, а не фактом.
  2. Вынесите модель в конфиг. Имя модели в env-переменной превращает миграцию в одну строку: OPENAI_MODEL=gpt-5.5 сегодня, gpt-5.6 в день релиза.
  3. Запустите гоблинов. Команда из постмортема выше работает прямо сейчас: поставьте Codex CLI, jq, и проверьте, как GPT-5.5 ведёт себя без блокировки. Заодно увидите, как выглядит reward-загрязнение вживую.
  4. Следите за первоисточниками. Страница openai.com/index/introducing-gpt-5-6 и рассылка для разработчиков появятся раньше, чем твиты с «эксклюзивными бенчмарками».
  5. Заложите бюджет на eval. $200–500 на первую неделю тестов: прогнать свои худшие задачи на новой модели до того, как переключать прод.
$ ls ./related/

Похожие статьи

claude-opus-48-dynamic-workflows.md
Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика
> · 9 мин

Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика

Anthropic выпустил Claude Opus 4.8 — апгрейд по цене 4.7. Динамические workflow в Claude Code (Bun переписан на Rust за 11 дней), fast mode в три раза дешевле и effort-control в UI claude.ai.

ai agents llm claude
qwen-37-max-agent-frontier.md
Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus
> · 9 мин

Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus

Alibaba тихо выкатила Qwen 3.7 Max — первый Max-вариант, который не вышел в open-source. 35 часов автономной работы, 1158 tool calls, 10× ускорение кернела на железе, которого не было в обучающих данных. И drop-in замена в Claude Code по нативному Anthropic-протоколу.

ai agents llm coding
deepseek-v4-pro-permanent-price-cut.md
DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз
> · 10 мин

DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз

23 мая DeepSeek закрепил промо-цены на V4-Pro как постоянные. Флагман с 1.6T параметров и 1M контекстом теперь стоит $0.435/$0.87 за 1M токенов. Это от 12 до 28 раз дешевле Sonnet, Opus и GPT-5.5. Разбираем подводные камни и миграцию на Claude Code.

ai llm open-source coding-agents
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe