> diffnotes · 17 Apr 2026 · 8 мин

Апрель превратил AI-рынок в барахолку: GLM-5.1 под MIT бьёт GPT-5.4, Claude Mythos под 50-компанейским замком, GPT-6 так и не вышел

ai llm claude open-source qwen gemma glm gpt-6 llama

За первые две недели апреля 2026 в AI выпали 8+ моделей. Это были не обновления, а полноценные релизы флагманов. Но история не про "у кого бенчмарки выше". История про то, что интеллектуальный потолок замер около 57 в Artificial Analysis Index, а всё движение ушло в сторону: кто теперь получает доступ, а кто нет.

TL;DR: 7 апреля Anthropic показала Claude Mythos и сразу закрыла его за 50 компаниями. В тот же день Zhipu AI выложила GLM-5.1 под MIT: 744B MoE, которая на SWE-Bench Pro обгоняет GPT-5.4 и Claude Opus 4.6. Gemma 4 помещается в телефон. GPT-6 "Spud" должен был стартовать 14 апреля, но на 17 апреля официального анонса нет. Open source догнал. Где-то даже обогнал.

Два пресс-релиза, один разлом

7 апреля, два анонса в 12 часов друг от друга.

Anthropic подтвердила существование Claude Mythos (самой мощной модели в истории компании) и сказала: публичного доступа не будет. 50 организаций получают гейтовый доступ через Project Glasswing. Задача партнёров: защитно прогонять Mythos по своей инфраструктуре, искать уязвимости до того, как модель попадёт в чужие руки. Список участников: AWS, Apple, Microsoft, Google, NVIDIA, Cisco, CrowdStrike, JPMorgan, Linux Foundation. Прайс превью: $25 за миллион input-токенов, $125 за output. Ни публичного API, ни даты general availability.

В тот же день Zhipu AI релизит GLM-5.1 под MIT. 744 миллиарда параметров total, 40 миллиардов активных per forward pass, окно 200K. На SWE-Bench Pro (реальный senior-уровень software engineering) по заявлению Zhipu модель обгоняет и GPT-5.4, и Claude Opus 4.6. Стоимость: электричество твоего GPU-кластера. Либо $1/$3.2 за миллион через API.

Получается философский разлом. Самый сильный coding-модель, которую сегодня можно запустить, лежит не за API-пейволлом, а на GitHub. До независимых замеров от Artificial Analysis или LMSYS говорить об этом как о непреложном факте рано, но сигнал игнорировать сложно.

Остальное поле (что реально полезно)

Gemma 4 от Google, 1 апреля, Apache 2.0, четыре варианта. 27B dense и 26B-A4B MoE под облако. Но интересны эти два:

Gemma 4 E4B с 4 миллиардами параметров, мультимодальный (текст + картинки + звук), работает на consumer GPU
Gemma 4 E2B (2B) тянется на смартфоне и Raspberry Pi, 256K context

Это уже не research-проект, а продуктовый компонент. Если строишь что-то с локальным инференсом без round-trip до облака, Gemma 4 E2B сейчас сильнейший вариант под открытой лицензией.

Qwen 3.6-Plus от Alibaba (2 апреля) с окном 1M, заточен под агентские coding-workflows: frontend, repository-level engineering, терминальные агенты, GUI-контроль. Цена $0.28 за миллион токенов. Это цена, при которой ты запускаешь длиннохвостого агента и не думаешь про счёт.

Llama 4 Scout имеет окно в 10 миллионов токенов, рекорд месяца. Llama 4 Maverick идёт с 400B параметров, 1M context, натив-мультимодальный. MoE в обоих. Но лицензия Meta работает по контролируемому соглашению, а не как полноценный open source в духе MIT или Apache.

Bonsai 8B от PrismML (1 апреля), 1-битная квантизация, в 14 раз меньше полной модели, GGUF. Бежит на ноутбуке без GPU. Край того, что значит "локальный AI".

GPT-6 "Spud" — релиз, которого не было

Вот тут сюжет интереснее всего. 7 апреля появился анонимный "инсайдерский" пост: GPT-6 под внутренним кодовым "Spud" стартует 14 апреля, super-app объединит ChatGPT, Codex и браузер Atlas в одно приложение. 2M context, +40% к GPT-5.4, галлюцинации ниже 0.1%, цена остаётся на $2.50/$12 per M. Сотрудники OpenAI в X закидывали криптичные намёки ("next week will be about more than cooking"). Fazm.ai и несколько блогов приняли это за confirmed и написали обзоры.

Сегодня 17 апреля. GPT-6 не вышел. Официального анонса от OpenAI нет. В TokenMix Research от 13 апреля прямо сказано: источник апрельского слуха не имеет верифицируемого track record, а safety-evaluation за три недели от окончания pretraining это необычно быстро. Polymarket даёт 78% до 30 апреля, >95% до 30 июня.

Что действительно подтверждено: pretraining закончился 24 марта, обучалось в Stargate Abilene на 100K+ H100 GPU, Сэм Альтман сказал "a few weeks". Всё остальное (+40%, 2M context, super-app, $2.50/$12) это слух одного источника. Если ты планируешь миграцию под эти цифры, подожди model card. Бенчмарк-гэп в 40% между поколениями исторически экстраординарен. У GPT-4 → GPT-5 было ~10-20%.

Пока слух болтается, Anthropic тихо релизнула Claude Opus 4.7 16 апреля (подробнее в нашем вчерашнем посте). По раннему обзору Jonathan Chavez Opus 4.7 выигрывает 12 из 14 бенчмарков у 4.6 при том же прайсе $5/$25. Это пока единственная реально подтверждённая фронтир-новость за последние 72 часа.

Подводные камни

GLM-5.1 beats GPT-5.4 по заявлению Zhipu, на одном бенчмарке. SWE-Bench Pro имитирует реалистичные задачи, но независимых оценок от Artificial Analysis или LMSYS ещё не появилось. До третьих замеров цифра остаётся вендорской. Если строишь production-coding агента на GLM-5.1, прогоняй свою evaluation set, а не доверяй лидерборду.

Self-hosting 744B MoE в реальности дорогой. 40B активных параметров per token требуют минимум 8×H100 для нормальной латентности. "Бесплатно" только по лицензии, не по железу. Если у тебя нет GPU-кластера, всё равно платишь OpenRouter, Together или Fireworks, и цена выходит $1-3/М. Это дешевле Opus 4.7, но не ноль.

Claude Mythos есть, но тебя там нет. Если ты не входишь в 50 компаний Glasswing (а ты не входишь), то Mythos для тебя не существует. Прайс $25/$125 per M это не предложение, а заявление. Anthropic сказала, что модель станет доступна шире "когда станет эффективнее", срока не дала. До тех пор ориентир это Opus 4.7.

GPT-6-слухи обманули не один блог. CometAPI, fazm.ai, несколько YouTube-каналов выпустили "обзоры GPT-6" на основе анонимного поста. Если встретишь статью с точными цифрами 40% и 2M context, проверь, есть ли ссылка на openai.com/news. Если нет, это перепев того же одного источника.

Gemma 4 лицензия формально Apache 2.0, но фактически у Google более сложная Gemma License. В апрельской таблице от Till Freitag видно, что Google использует собственную Gemma License, а не чистый Apache. Для коммерческого применения прочитай условия: там запреты на "вредные применения" с собственным определением Google.

Альтернативы

Остаться на GPT-5.4 или Claude Opus 4.7. Стабильно работает, есть SLA. Потеря в том, что не получишь возможного преимущества в цене или производительности. Но ничего не ломается.

Маршрутизация через OpenRouter или LiteLLM. Вместо выбора одной модели получаешь абстракцию, которая позволяет менять backend. Сегодня GLM-5.1, завтра Opus 4.7, послезавтра GPT-6. Стоимость: дополнительная зависимость и возможные различия в tool-calling API между моделями.

Self-hosting open-weights через vLLM или llama.cpp. Получаешь суверенитет над данными плюс амортизацию железа на длинной дистанции. Цена входа: GPU-кластер и DevOps-время.

Вердикт

Если у тебя coding-агент в production и бюджет трещит, попробуй GLM-5.1 через OpenRouter, прогоняй свои реальные задачи. На SWE-Bench Pro она бьёт frontier-модели, но твоя задача это не SWE-Bench. Если совпадёт, экономия получится минимум в 3-5 раз.

Если строишь mobile-приложение с локальным AI, Gemma 4 E2B это лучшее, что вышло под открытой лицензией. Это уже продукт, а не research.

Если у тебя длиннохвостые агенты, которые бегают часами, Qwen 3.6-Plus за $0.28/M ломает калькулятор стоимости. Single-shot дороже, но run 10-часового агента выходит дешевле на порядок.

GPT-6 ждать не стоит: официального релиза нет, цифры из слуха непроверяемые. Когда появится model card, тогда и считай. Claude Mythos забудь до осени.

Как попробовать

GLM-5.1 через OpenRouter по адресу openrouter.ai/z-ai/glm-5.1, подключается к OpenAI-совместимому клиенту за 5 минут. Прогони свой реальный coding-prompt и сравни с твоей текущей моделью. Не смотри на лидерборд, смотри на свои задачи.
Gemma 4 локально через Ollama: ollama pull gemma4:e4b, работает на M-чипах и потребительских GPU. Если есть телефон, попробуй Gemma 4 E2B через MLC или Transformers.js.
Qwen 3.6-Plus для агента подключается через Alibaba Cloud API (требует верификации). Если не хочешь регистрироваться в Alibaba, оно же есть на OpenRouter. Запусти один долгий многошаговый сценарий, посмотри на total cost.
Не верь "GPT-6 launched" заголовкам до ссылки на openai.com/news. Подпишись на OpenAI DevDay newsletter, там первыми появляются model cards.
Если пилишь migration-план, читай whatllm.org как взвешенный обзор, а не fazm.ai или CometAPI (они принимают слухи за факты).

Апрель 2026 не поднял потолок, он перераспределил пол. Раньше "open source на 6 месяцев отстаёт" было мантрой. Теперь на конкретных задачах open source впереди. Для разработчика это хорошо: выбора стало больше, цена за интеллект ниже. Плохо только то, что выбирать приходится чаще.