diffnotes.tech — тех-блог о программировании, AI и DevOps
Grok 4.3 — 53 балла на Intelligence Index, $1.25 за миллион токенов и регрессия в агентах. xAI выкатил модель, пока Маск судится с Altman'ом
xAI выкатил Grok 4.3 — reasoning-модель за $1.25/$2.50 за миллион токенов, на 40-60% дешевле Grok 4.20. Always-on reasoning, миллион токенов контекста и клонирование голоса за минуту. Но в агентских задачах модель «впадает в спячку», в ProofBench выбивает 11%, а отключить размышления нельзя — платишь за reasoning даже на «привет».
Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал
Вчера, 30 апреля, на OpenRouter появилась новая stealth-модель Owl Alpha. 1M контекст, бесплатно, заточена под агентные задачи. Никто не знает, кто её сделал. Разбираем спецификации, спекуляции о происхождении (OpenAI? Alibaba? Xiaomi?), как её запустить из Claude Code и подводные камни.
Tencent Hy3 preview: 295B open-source, бывший OpenAI у руля, и вчера #1 на OpenRouter
Tencent открыла Hy3 preview — 295B MoE с 256K контекста и тремя режимами reasoning. Вчера модель вырвалась на #1 OpenRouter, опередив GPT-5.5 и Claude Opus 4.7. Бесплатна на OpenRouter две недели. Разбираем что внутри, как пробовать через OpenAI SDK и где подводные камни с лицензией.
Plasmate — браузерный движок на Rust, который режет токены AI-агентов на 94%
Plasmate компилирует HTML в Semantic Object Model — структурированный JSON для LLM. 4-5 мс на страницу, 94% экономии токенов, подключение к Claude Code за одну строку. Apache-2.0, проект одного человека.
Symphony — OpenAI выложила оркестратор, который превращает Linear в очередь для AI-агентов
OpenAI тихо выложила Symphony — open-source оркестратор на Elixir, который мониторит твою Linear-доску и сам берёт тикеты в работу через Codex. 17.1K звёзд за два месяца, +500% к мёржам PR (по данным OpenAI). Разбираем архитектуру, подводные камни и альтернативы.
Happy Horse 1.0 — Алибаба переманила архитектора Kling AI и сделала #1 видео-модель. Вчера запустили на fal, обещанный open source отменили
Анонимная видео-модель Happy Horse 1.0 за неделю стелс-теста на Artificial Analysis Video Arena заняла #1, обогнав ByteDance Seedance 2.0 на 100 Elo. Вчера, 27 апреля, fal запустил её как официальное API за $0.14-0.28 в секунду. Под капотом команда Чжан Ди, бывшего архитектора Kling AI. Обещанный open source команда тихо отменила.
DeepSeek V4 — миллион токенов за $3.48, open-weights под MIT и работа без Nvidia
DeepSeek V4 Pro и Flash: 1.6 триллиона параметров, миллион токенов контекста, MIT-лицензия, $3.48 за миллион выходных токенов и нативная поддержка Huawei Ascend. Open-weights flagship, который стоит в 21 раз дешевле Opus 4.7.
Oh My codeX — параллельные агенты для Codex CLI, tmux worktrees и HUD, который показывает, что делает каждый бот
OMX — это oh-my-zsh для OpenAI Codex CLI. За 2 минуты npm-установки получаешь 33 агента, 36 скиллов, команды, которые гоняют по три Codex-сессии в параллельных git worktrees, и HUD, который показывает, чем они заняты прямо сейчас.
Spud утёк за сутки до релиза: GPT-5.5 засветили в пикере Codex, а Simon Willison собрал «backdoor-API»
22 апреля в Codex у Pro-юзеров внезапно появился пикер с gpt-5.5, oai-2.1, arcanine и glacier-alpha. Через сутки OpenAI выкатила GPT-5.5 официально. Simon Willison параллельно собрал инструмент, который крадёт авторизацию Codex CLI и стучится в API, которого пока нет. Разбираем, что утекло, что умеет Spud, и почему API «задерживается ради безопасности».
$ cat /dev/blog/updates
> Свежие заметки о программировании,
> DevOps и AI — прямо в мессенджер