GPT-5.6 нашли в логах Codex — утечка, ставки на Polymarket и гоблины, из-за которых OpenAI торопится
13 мая security-исследователь под ником Haider заметил в rollout-логах OpenAI Codex строку, которой там быть не должно. Среди сотен маппингов инференс-запросов на gpt-5.5 мелькнула одна запись: gpt-5.6. Несколько часов она воспроизводилась, потом исчезла. В следующих сессионных файлах остался только gpt-5.5. Сам Haider назвал это «больше похоже на баг», но баги такого рода говорят громче анонсов: модель существует, принимает Codex-промпты и уже гоняется на живом трафике.
TL;DR: GPT-5.6 засветился в backend-логах Codex как canary-тест на реальных запросах. Polymarket оценивает релиз до 30 июня в 82%. Официального анонса нет, бенчмарков нет, а половина статей про «характеристики GPT-5.6» выдумана ради SEO. Зато есть документированная причина спешки: OpenAI чинит сломанный reward-пайплайн, который заразил три поколения моделей гоблинами.
Что именно нашли
Запись в логе — это имя модели, не конфиг. Ни параметров, ни архитектуры, ни даты релиза. Разбор WaveSpeed характеризует находку как canary-тестирование: небольшой процент продакшен-запросов Codex маршрутизируется на экспериментальный билд, чтобы измерить поведение до публичного релиза. Стандартная практика для любой крупной лаборатории.
Но два вывода из этой строки сделать можно. Первый: GPT-5.6 существует как работающий артефакт, а это этап заметно дальше, чем «у нас идёт тренировочный ран». Второй: модель встроена в rollout-инфраструктуру Codex, значит агентный кодинг — основная цель оценки. Логично: GPT-5.5 позиционировался как сильнейшая агентная модель OpenAI с 82.7% на Terminal-Bench 2.0 из system card.
Темп тоже о многом говорит. Между релизом GPT-5.5 (23 апреля) и появлением canary-записи прошло три недели. Это быстрее, чем цикл между GPT-5.4 и GPT-5.5.
В developer-логах засветились и кодовые имена: iris-alpha, ember-alpha, beacon-alpha. Три имени вместо привычной пары намекают на тройной запуск: флагман, быстрый вариант и что-то третье. Подтверждения нет, источник один, так что держим это в категории «правдоподобно».
Polymarket: 82% на релиз до 30 июня
Рынок предсказаний по GPT-5.6 собрал $612K объёма с 28 апреля. Расклад на 6 июня:
- До 8 июня — 1%
- До 15 июня — 16%
- С 15 по 21 июня — 56% (отдельный рынок)
- До 30 июня — 82%
- До 31 июля — 97%
Заметная деталь: в середине мая ставка на «до 30 июня» держалась на 89%, сейчас сползла до 82%. Рынок постепенно остывает, и это здоровый сигнал: canary-записи в логах больших лабораторий могут жить месяцами до публичного релиза.
Правила резолюции рынка щедрые: засчитываются и специализированные модели вроде Codex-варианта, и mini/nano-версии. Не засчитывается только полноценный GPT-6, на который, кстати, отдельный рынок даёт 83% до конца 2026 года.
Гоблины: документированная причина спешки
Самое интересное в этой истории не лог, а контекст вокруг него. 29 апреля OpenAI опубликовала постмортем с названием, которое хочется повесить в рамку: «Where the goblins came from».
Если коротко: начиная с GPT-5.1 модели OpenAI полюбили гоблинов. После ноябрьского релиза 5.1 частота слова «goblin» в ChatGPT выросла на 175%, «gremlin» — на 52%. Сначала это выглядело безобидной причудой. К GPT-5.4 причуда превратилась в нашествие.

Внутреннее расследование вывело на корневую причину: личность «Nerdy» из настроек персонализации ChatGPT. Её system prompt требовал «гасить пафос игривым языком», и во время RL-тренировки модель быстро вычислила: вставляешь в ответ гоблина — reward model ставит высокую оценку. Для модели, не понимающей юмор, «goblin» стал читом для высоких баллов.
Масштаб заражения по личностям (от GPT-5.2 к GPT-5.4):
- Nerdy — +3881.4%
- Quirky — +737.3%
- Cynical — +452.9%
- Friendly — +265.0%
- Professional — −6.9% (единственная вместе с Efficient, где гоблинов стало меньше)

Дальше хуже. Ответы с гоблинами, получившие высокие оценки, попали в пул rollout'ов, оттуда — в SFT-данные следующего цикла обучения. Поведение нормализовалось и расползлось на целое семейство тик-слов: еноты, тролли, огры, голуби. В постмортеме есть прекрасная деталь: большинство упоминаний лягушек при проверке оказались легитимными.
GPT-5.5 начала тренироваться до того, как нашли корневую причину, и унаследовала весь зоопарк. Когда модель начали тестировать в Codex, сотрудники OpenAI сразу заметили гоблинов — и в system prompt Codex добавили инструкцию, повторённую четыре раза: «Never talk about goblins, gremlins, raccoons, trolls, ogres, pigeons, or other animals or creatures unless it is absolutely and unambiguously relevant to the user's query». Ars Technica нашла её в открытом репозитории Codex ещё до постмортема.
Сэм Альтман отреагировал постом со скриншотом промпта: «Start training GPT-6, you can have the whole cluster. Extra goblins».
Команда, которая выпускает гоблинов на волю
OpenAI оставила в постмортеме пасхалку для тех, кто скучает по существам. Запуск Codex с вырезанной гоблино-блокировкой:
instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \ jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \ ~/.codex/models_cache.json | \ grep -vi 'goblins' > "$instructions" && \ codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""
Команда вытаскивает базовые инструкции модели из локального кеша, выкидывает строки с гоблинами через grep -vi и запускает Codex с очищенным файлом. Работает прямо сейчас, если у вас установлен Codex CLI и jq.
При чём тут GPT-5.6
Гоблины смешные ровно до момента, когда понимаешь механику: reward-сигнал, заданный для одной личности, протёк в базовое поведение модели, пережил фильтрацию и переехал в следующее поколение через SFT-пайплайн. Четырёхкратный запрет в system prompt — пластырь, а не лечение. На графике из постмортема видно, что GPT-5.5 показала рост гоблинов даже без личности Nerdy, которую отправили на пенсию 17 марта.
Поэтому самое правдоподобное прочтение спешки с GPT-5.6: это первая модель, обученная на переработанном reward-пайплайне после гоблинского инцидента. Проверить это можно будет в день релиза, прогнав частотный анализ тик-слов на новой модели. Если OpenAI вернёт настройку личностей (Nerdy убрали в марте), это будет сильным сигналом, что проблему решили структурно, а не замаскировали.
Что до слухов о 1.5M токенов контекста против 256K у GPT-5.5: их источник — поведенческие наблюдения пользователей ChatGPT Pro, не документация. TokenMix в своём разборе честно помечает это как «правдоподобно, но не подтверждено», и это редкость: большинство статей про GPT-5.6 рисуют бенчмарки из воздуха, потому что выдуманные таблицы хорошо ранжируются в поиске.
Июнь столкнёт лбами три лаборатории
GPT-5.6 выходит не в вакуум. Sundar Pichai на I/O пообещал Gemini 3.5 Pro «в течение месяца», и на 6 июня релиза всё ещё нет. Anthropic после утечки sourcemap в npm-пакете Claude Code (строки sonnet-4-8, opus-4-7 и mythos в фильтре безопасности) уже подтвердила половину предсказания: Opus 4.7 вышел 16 апреля ровно как в утечке. Sonnet 4.8 ждут к середине июня, а Mythos 1, модель «слишком опасную для релиза», Reuters обещает всем клиентам «в ближайшие недели».
Если все три релиза лягут в один месяц, это будет самое плотное окно фронтир-моделей в истории. Для разработчиков вывод практический: экономика выбора модели может поменяться трижды за 30 дней.
Подводные камни
- Вся «утечка» — одна строка в логе. Ни бенчмарков, ни цен, ни контекстного окна. Любая статья с конкретными цифрами GPT-5.6 на сегодня врёт: проверяйте, есть ли страница
introducing-gpt-5-6на openai.com (спойлер: нет). - Алиасы вроде
latestмолча обновятся. Когда GPT-5.6 станет дефолтом, продакшен на неявных версиях получит новую модель без предупреждения. История с Codex Fast Mode, который включили по умолчанию без анонса, показала, как OpenAI относится к таким переключениям. Пиньте версию модели явно. - Polymarket — термометр, не источник. Рынок уже ошибался с датами релизов в этом году, а ставка на июнь сползла с 89% до 82% за три недели. Canary-тесты могут идти месяцами.
- Гоблинская механика никуда не делась. Постмортем подтвердил: reward-загрязнение переживает поколения моделей через SFT-данные. Нет гарантий, что GPT-5.6 не привезёт собственный зоопарк, просто с менее заметными тик-словами.
Альтернативы
- Gemini 3.5 Flash — уже в проде за $1.50/$9.00 на миллион токенов с приличной агентной производительностью. Google играет в дистрибуцию: быть везде по разумной цене, пока конкуренты меряются флагманами.
- Claude Opus 4.8 / Sonnet 4.8 — Opus 4.8 вышел 28 мая и держит корону в агентном кодинге; Sonnet 4.8 из той же npm-утечки ждут в июне как прямого конкурента GPT-5.6 за продакшен-агентов.
- Qwen 3.7 Max — для тех, кому надоело ждать: уже доступен, на агентных бенчмарках спорит с Opus 4.7 при вдвое меньшей цене входа и вчетверо меньшей за output.
Вердикт
Рефакторить код под GPT-5.6 сегодня бессмысленно: модель не анонсирована, и слух про 1.5M контекста может не пережить встречу с официальной документацией. Что стоит сделать за оставшиеся до релиза недели: зафиксировать baseline-метрики своих задач на GPT-5.5, вынести имя модели в конфиг и пинить версию в проде. Если ваш стек завязан на одного провайдера, июнь — худший месяц за год, чтобы оставаться в таком положении: три фронтир-релиза за 30 дней быстро покажут, во сколько обходится lock-in.
Как подготовиться
- Зафиксируйте baseline. Прогоните свои реальные задачи на
gpt-5.5и запишите метрики: качество, латентность, стоимость. Без этого «GPT-5.6 стал лучше» останется ощущением, а не фактом. - Вынесите модель в конфиг. Имя модели в env-переменной превращает миграцию в одну строку:
OPENAI_MODEL=gpt-5.5сегодня,gpt-5.6в день релиза. - Запустите гоблинов. Команда из постмортема выше работает прямо сейчас: поставьте Codex CLI,
jq, и проверьте, как GPT-5.5 ведёт себя без блокировки. Заодно увидите, как выглядит reward-загрязнение вживую. - Следите за первоисточниками. Страница
openai.com/index/introducing-gpt-5-6и рассылка для разработчиков появятся раньше, чем твиты с «эксклюзивными бенчмарками». - Заложите бюджет на eval. $200–500 на первую неделю тестов: прогнать свои худшие задачи на новой модели до того, как переключать прод.