agents — diffnotes.tech

minimax-m3-review.md

> 07 Jun 2026 · 8 мин

MiniMax M3 — первая открытая модель с фронтир-кодингом, 1M контекста и зрением. А бенчмарки ей гоняли через Claude Code

MiniMax M3: первая open-weight модель с фронтир-кодингом, 1M контекста и мультимодальностью. 59% SWE-Bench Pro, цены втрое ниже Gemini Flash и веса, которых до сих пор нет. Разбор с подводными камнями.

ai agents llm open-source

claude-opus-48-dynamic-workflows.md

> 28 May 2026 · 9 мин

Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика

Anthropic выпустил Claude Opus 4.8 — апгрейд по цене 4.7. Динамические workflow в Claude Code (Bun переписан на Rust за 11 дней), fast mode в три раза дешевле и effort-control в UI claude.ai.

ai agents llm claude

qwen-37-max-agent-frontier.md

> 25 May 2026 · 9 мин

Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus

Alibaba тихо выкатила Qwen 3.7 Max — первый Max-вариант, который не вышел в open-source. 35 часов автономной работы, 1158 tool calls, 10× ускорение кернела на железе, которого не было в обучающих данных. И drop-in замена в Claude Code по нативному Anthropic-протоколу.

ai agents llm coding

gemini-35-flash-launch.md

> 20 May 2026 · 10 мин

Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash

Google выкатил Gemini 3.5 Flash на I/O 2026. Впервые в истории Flash-модель обходит свой собственный Pro на кодинге и MCP-агентах — 76.2% Terminal-Bench, 4× быстрее frontier-моделей, 1M контекст. Но цена выросла в 3 раза от прошлого Flash, а критики уже зовут её "benchmaxxed fraud". Разбираем бенчмарки, цены, Managed Agents с AGENTS.md/SKILL.md и сравнение с Claude Opus 4.7 и GPT-5.5.

ai agents llm gemini

google-io-2026-leaks-spark-omni-gemini-35.md

> 17 May 2026 · 10 мин

Google слил три модели за 4 дня до I/O — Spark Agent с твоими паролями, Omni вместо Veo, Gemini 3.5 не дотянет до Mythos

До Google I/O 2026 двое суток. За 4 дня в код Gemini утекли видеомодель Omni, всегда-онлайн агент Spark, который сохраняет логины и пароли, и флагман Gemini 3.5 Pro под кодовым именем Cappuccino. Инсайдер Alex Heath из Sources говорит: до Anthropic Mythos флагман не дотянет.

ai agents gemini google

nemotron-3-nano-omni.md

> 03 May 2026 · 8 мин

NVIDIA Nemotron 3 Nano Omni: 30B-модель, которая видит, слышит и читает за один проход. И обходит Qwen3-Omni на каждом бенчмарке

NVIDIA выкатила открытую multimodal модель Nemotron 3 Nano Omni: 30B параметров, 3B активных, понимает video/audio/image/text одной моделью. 9x throughput vs другие omni-модели, 25 ГБ RAM в 4-бит. Бьёт Qwen3-Omni на каждом бенчмарке.

ai agents llm open-source

gnap-git-native-agent-protocol-v2.md

> 03 May 2026 · 6 мин

GNAP: оркестрируй рой AI-агентов через git-репо. 4 JSON-файла, ноль серверов

Farol Labs предлагает координировать AI-агентов через 4 JSON-файла в git-репо. Без серверов, без баз. Любой агент с git push автоматически в команде. Разбираем GNAP — RFC-черновик git-native оркестрации.

ai agents open-source git

owl-alpha-stealth-openrouter.md

> 01 May 2026 · 8 мин

Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал

Вчера, 30 апреля, на OpenRouter появилась новая stealth-модель Owl Alpha. 1M контекст, бесплатно, заточена под агентные задачи. Никто не знает, кто её сделал. Разбираем спецификации, спекуляции о происхождении (OpenAI? Alibaba? Xiaomi?), как её запустить из Claude Code и подводные камни.

ai agents llm openrouter

tencent-hy3-preview-openrouter.md

> 30 Apr 2026 · 8 мин

Tencent Hy3 preview: 295B open-source, бывший OpenAI у руля, и вчера #1 на OpenRouter

Tencent открыла Hy3 preview — 295B MoE с 256K контекста и тремя режимами reasoning. Вчера модель вырвалась на #1 OpenRouter, опередив GPT-5.5 и Claude Opus 4.7. Бесплатна на OpenRouter две недели. Разбираем что внутри, как пробовать через OpenAI SDK и где подводные камни с лицензией.

ai agents llm open-source

deepseek-v4-release.md

> 27 Apr 2026 · 9 мин

DeepSeek V4 — миллион токенов за $3.48, open-weights под MIT и работа без Nvidia

DeepSeek V4 Pro и Flash: 1.6 триллиона параметров, миллион токенов контекста, MIT-лицензия, $3.48 за миллион выходных токенов и нативная поддержка Huawei Ascend. Open-weights flagship, который стоит в 21 раз дешевле Opus 4.7.

ai agents llm open-source

# agents

MiniMax M3 — первая открытая модель с фронтир-кодингом, 1M контекста и зрением. А бенчмарки ей гоняли через Claude Code

Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика

Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus

Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash

Google слил три модели за 4 дня до I/O — Spark Agent с твоими паролями, Omni вместо Veo, Gemini 3.5 не дотянет до Mythos

NVIDIA Nemotron 3 Nano Omni: 30B-модель, которая видит, слышит и читает за один проход. И обходит Qwen3-Omni на каждом бенчмарке

GNAP: оркестрируй рой AI-агентов через git-репо. 4 JSON-файла, ноль серверов

Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал

Tencent Hy3 preview: 295B open-source, бывший OpenAI у руля, и вчера #1 на OpenRouter

DeepSeek V4 — миллион токенов за $3.48, open-weights под MIT и работа без Nvidia