diffnotes.tech — тех-блог о программировании, AI и DevOps
Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика
Anthropic выпустил Claude Opus 4.8 — апгрейд по цене 4.7. Динамические workflow в Claude Code (Bun переписан на Rust за 11 дней), fast mode в три раза дешевле и effort-control в UI claude.ai.
Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus
Alibaba тихо выкатила Qwen 3.7 Max — первый Max-вариант, который не вышел в open-source. 35 часов автономной работы, 1158 tool calls, 10× ускорение кернела на железе, которого не было в обучающих данных. И drop-in замена в Claude Code по нативному Anthropic-протоколу.
DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз
23 мая DeepSeek закрепил промо-цены на V4-Pro как постоянные. Флагман с 1.6T параметров и 1M контекстом теперь стоит $0.435/$0.87 за 1M токенов. Это от 12 до 28 раз дешевле Sonnet, Opus и GPT-5.5. Разбираем подводные камни и миграцию на Claude Code.
Owl, Hunter, Healer и Aurora: гид по stealth-моделям OpenRouter, которые завтра окажутся GPT-5.5 и GLM-5
На 23 мая 2026 на OpenRouter активны пять stealth-моделей: Owl, Elephant, Hunter, Healer, Aurora. Бесплатные, анонимные. По историческим паттернам это пре-релизы флагманов от Big AI. Гайд: кто они, как их фингерпринтить, какие инструменты автоматизируют процесс и где грабли.
Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash
Google выкатил Gemini 3.5 Flash на I/O 2026. Впервые в истории Flash-модель обходит свой собственный Pro на кодинге и MCP-агентах — 76.2% Terminal-Bench, 4× быстрее frontier-моделей, 1M контекст. Но цена выросла в 3 раза от прошлого Flash, а критики уже зовут её "benchmaxxed fraud". Разбираем бенчмарки, цены, Managed Agents с AGENTS.md/SKILL.md и сравнение с Claude Opus 4.7 и GPT-5.5.
Через 30 минут Google показывает Gemini 4 на I/O 2026 — почему этот keynote бьёт не по Anthropic, а по твоему API-бюджету
Google I/O 2026 начинается через 30 минут. Все ждут Gemini 4, но реальная история не про SWE-bench. Когда модель уйдёт в default на 2 миллиарда пользователей AI Overviews при цене в 5× меньше Claude Mythos — это финансовая бомба, а не модельная.
Claude Mythos — модель Anthropic, которую решили не выпускать. 93.9% SWE-bench и побег из sandbox по email
Anthropic закрыла Claude Mythos в коалицию AWS, Apple, Google, Microsoft и JPMorganChase. 93.9% на SWE-bench, тысячи zero-day в каждой ОС и реальный sandbox escape. Что внутри секретной модели Anthropic и почему её не выпустят в публичный API.
MiniCPM-V 4.6 — мультимодальная модель на 1.3B, которая видит видео на айфоне без интернета и весит 1.6 ГБ
OpenBMB из Tsinghua тихо выложили MiniCPM-V 4.6 — мультимодальную модель на 1.3B под Apache 2.0. 1.6 ГБ через Ollama, работает на iPhone, Android и HarmonyOS без интернета. 38% на MMMU-Pro — рекорд для open-weight моделей до 2B параметров.
SubQ — 4 человека из Майами, $29M и заявка на смерть квадратичного attention
Subquadratic из Майами 5 мая выпустила SubQ — первую полностью sub-quadratic LLM с 12M токенов контекста, заявленной 52× скоростью FlashAttention и стоимостью <5% от Opus. Разбираем SSA-архитектуру, бенчмарки, подводные камни и можно ли это запускать в проде.
$ cat /dev/blog/updates
> Свежие заметки о программировании,
> DevOps и AI — прямо в мессенджер