diffnotes.tech — тех-блог о программировании, AI и DevOps
OpenAI вкатил GPT-5 в голос — три Realtime-модели одним релизом, и Translate за 3 цента в минуту
7 мая OpenAI без шумной презентации выкатил в Realtime API сразу три модели: GPT-Realtime-2 с GPT-5-уровнем reasoning, GPT-Realtime-Translate за $0.034/мин и стримящий GPT-Realtime-Whisper за $0.017/мин. Разбираем что это значит для voice-агентов, синхронного перевода и почему кэш ввода за $0.40 переворачивает экономику длинных сессий.
Code with Claude 2026 — Sonnet 4.8 так и не показали. Зато Claude теперь спит, лимиты Code удвоились, а Маск дал Anthropic 220 тысяч H100
Anthropic собрал Code with Claude в Сан-Франциско и вместо ожидаемой Sonnet 4.8 показал dreaming для агентов, удвоил лимиты Claude Code и взял в аренду весь Colossus 1 у SpaceX. Что можно потрогать сегодня и почему форма на dreaming откроется не для всех.
GPT-5.5 Instant — OpenAI тихо подменил мозг ChatGPT для сотен миллионов и пустил его в твой Gmail
OpenAI вчера тихо заменил default-модель ChatGPT на GPT-5.5 Instant. По внутренним бенчмаркам -52.5% галлюцинаций в медицине, праве и финансах, доступ к Gmail для персонализации и API-алиас chat-latest. Разбираем грабли: внутренние бенчмарки без сравнений, регрессии Instant и retire 5.3 через три месяца.
Через несколько часов Anthropic покажет Sonnet 4.8 на Code with Claude. Из утечки в их же npm-пакете уже известны все цифры
Сегодня вечером Anthropic покажет Sonnet 4.8 на Code with Claude в Сан-Франциско. Спецификации новой модели, кодовое имя Cardinal и загадочный Jupiter уже известны, потому что 31 марта инженер Anthropic забыл добавить одну строку в .npmignore и слил 512 000 строк своего кода. Разбираем, что услышим через 9 часов.
Unity AI вышел из подвала — Muse похоронен, в редактор пустили Claude и Gemini, MCP-сервер бесплатно жгёт чужие токены
4 мая Unity открыл публичную бету Unity AI: три режима, AI Gateway без жажды кредитов и MCP-сервер для Claude Code и Cursor. Muse тихо похоронен, ставка на сторонние модели. Разбираем, что внутри, сколько стоит и почему разработчики уже ругаются на сгенерированный код.
Qwen3.6-27B — 27 миллиардов параметров обыграли 397 миллиардов на кодинге. И всё это влезает в одну GPU
27B dense-модель Alibaba под Apache 2.0 берёт 77.2% на SWE-bench Verified (уровень Claude Opus 4.5) и обходит собственного 397B MoE-предшественника. Влезает в RTX 4090 в Q4, мультимодальная, 262K контекста нативно (до 1M через YaRN). На OpenRouter $0.32 / $3.20 за миллион токенов.
Anthropic Mythos за 7 дней: NSA сканит Microsoft, Белый дом блокирует 70 компаний, Anthropic ловит утечку
За неделю Mythos из инженерной curiosity превратился в политическую гранату. NSA втихую сканит Microsoft на уязвимости, Белый дом блокирует расширение доступа, Anthropic расследует «несанкционированный доступ», а AISLE показала, что bug-finding воспроизводится на открытых моделях за $0.11 за M токенов.
NVIDIA Nemotron 3 Nano Omni: 30B-модель, которая видит, слышит и читает за один проход. И обходит Qwen3-Omni на каждом бенчмарке
NVIDIA выкатила открытую multimodal модель Nemotron 3 Nano Omni: 30B параметров, 3B активных, понимает video/audio/image/text одной моделью. 9x throughput vs другие omni-модели, 25 ГБ RAM в 4-бит. Бьёт Qwen3-Omni на каждом бенчмарке.
GNAP: оркестрируй рой AI-агентов через git-репо. 4 JSON-файла, ноль серверов
Farol Labs предлагает координировать AI-агентов через 4 JSON-файла в git-репо. Без серверов, без баз. Любой агент с git push автоматически в команде. Разбираем GNAP — RFC-черновик git-native оркестрации.
$ cat /dev/blog/updates
> Свежие заметки о программировании,
> DevOps и AI — прямо в мессенджер