diffnotes.tech — тех-блог о программировании, AI и DevOps

Все ai claude-code agents productivity tips open-source llm developer-tools anthropic mcp coding cursor claude openai workflow automation tools codex cli testing gemini google api comparison ide skills tokens coding-tools voice ai-tools plugins qwen tdd security gpt coding-agent playwright pricing codex-cli multi-agent context-window python openclaw ai-coding ios swift xcode computer-use gpt-5.4 code-review browser-automation game-development ai-agents coding-agents memory context-engineering vibe-coding coding-assistant benchmarks moe benchmark research devtools deep-research terminal qa php laravel assistant git worktrees docker parallel-development oauth websocket context-management mobile ralph-loop autonomous-coding github copilot perplexity multi-model orchestration image-generation remotion video shorts instagram tiktok permissions future code-intelligence knowledge-graph future-of-programming opinion hooks xctest commands local-ai liquid-ai privacy fast-mode copilot-cli macos linux windows machine-learning cron scheduled-tasks effort settings unity godot unreal-engine search-api tavily exa agent-teams opus-4.6 xai grok expo cowork remote-control plugin google-colab responsive-design frontend telegram discord channels web-scraping chatgpt astral superapp kimi licensing documentation prompts figma design web-development demo gamedev gemini-cli cybersecurity multimodal speech browser scraping leak self-improvement ultraplan debugging gemma function-calling free-tools china tts elevenlabs infrastructure configuration skill microsoft dotnet models
$ ls -lt posts/ --filter=llm
claude-opus-47-sonnet-48-leak.md
Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах
> · 10 мин

Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах

Двойная утечка кода Anthropic раскрыла Opus 4.7, Sonnet 4.8 и новый тир Capybara выше Opus. Одновременно директор AI в AMD доказала деградацию Opus 4.6 данными из 6852 сессий: reasoning упал на 67%, расходы выросли в 122 раза. Разбираем что произошло, зачем нерфить модель и как починить.

ai llm claude anthropic
caveman-claude-skill.md
Caveman Claude — Claude Code skill, который говорит как неандерталец и экономит 75% output-токенов
> · 9 мин

Caveman Claude — Claude Code skill, который говорит как неандерталец и экономит 75% output-токенов

Мем с Reddit про «научил Claude говорить как пещерный человек» за неделю стал Claude Code skill с 13 тысячами звёзд. Считаем, сколько реально экономит (спойлер: не 75%), как ставить и кому не подходит.

ai llm anthropic open-source
glm-51-open-source-swe-bench.md
GLM-5.1 — open-source модель из Китая обошла Claude Opus и GPT-5.4 на SWE-Bench Pro, кодит 8 часов без остановки и стоит в 5 раз дешевле
> · 8 мин

GLM-5.1 — open-source модель из Китая обошла Claude Opus и GPT-5.4 на SWE-Bench Pro, кодит 8 часов без остановки и стоит в 5 раз дешевле

Z.ai выпустила GLM-5.1 под MIT-лицензией: 58.4% на SWE-Bench Pro (выше Claude Opus 4.6 и GPT-5.4), 600+ итераций оптимизации без плато. API в 5-8 раз дешевле конкурентов, подключается к Claude Code за 5 минут.

ai agents llm coding
gemma-4-open-agentic-model.md
Gemma 4 — Apache 2.0, function calling из коробки и 89% AIME. Google выложил open-weight модель, которая делает cloud API необязательным
> · 7 мин

Gemma 4 — Apache 2.0, function calling из коробки и 89% AIME. Google выложил open-weight модель, которая делает cloud API необязательным

Google DeepMind выпустил Gemma 4 — четыре open-weight модели от 2B до 31B под Apache 2.0 с native function calling и мультимодальностью. Flagship 31B занял #3 на Arena AI, обходит Qwen 3.5 по математике и кодингу, а E2B работает на телефоне.

ai agents llm google
qwen35-omni-multimodal-voice.md
Qwen3.5-Omni — 113 языков, голосовые клоны и аудио-видео в одном контуре. Alibaba наступает на пятки Gemini
> · 7 мин

Qwen3.5-Omni — 113 языков, голосовые клоны и аудио-видео в одном контуре. Alibaba наступает на пятки Gemini

Alibaba выкатила Qwen3.5-Omni — мультимодальную модель с текстом, картинками, аудио и видео в одном контуре. Три версии (Plus/Flash/Light), 256K контекста, 113 языков распознавания речи и voice cloning. Разбираем, что это даёт разработчику.

ai llm open-source qwen
claude-mythos-leak.md
Claude Mythos — утечка раскрыла модель Anthropic, которая настолько сильна в кибербезе, что её боятся выпускать
> · 7 мин

Claude Mythos — утечка раскрыла модель Anthropic, которая настолько сильна в кибербезе, что её боятся выпускать

Anthropic случайно раскрыла Claude Mythos — новый тир модели выше Opus с прорывными возможностями в кодинге и кибербезопасности. Акции CrowdStrike и Palo Alto рухнули на 7%.

ai llm coding claude
claude-5-release-q2-2026-preview.md
Claude 5 — 90%+ SWE-bench, 500K контекст и дата «28 апреля», которую Amodei не отрицает. Разбираем всё, что известно
> · 7 мин

Claude 5 — 90%+ SWE-bench, 500K контекст и дата «28 апреля», которую Amodei не отрицает. Разбираем всё, что известно

Dario Amodei подтвердил Claude 5 в Q2 2026, слил дату 28 апреля и обещал 90%+ SWE-bench. Разбираем, чего ждать разработчикам — и почему скептики не верят.

ai llm coding claude
cursor-composer-2-own-coding-model.md
Cursor Composer 2 — собственная модель, которая бьёт Claude Opus 4.6 за десятую часть цены. Но пользователи уже просят вернуть старую версию
> · 8 мин

Cursor Composer 2 — собственная модель, которая бьёт Claude Opus 4.6 за десятую часть цены. Но пользователи уже просят вернуть старую версию

Cursor выпустил Composer 2 — первую in-house модель для кодинга, обученную исключительно на коде. Бьёт Claude Opus 4.6 на двух бенчмарках из трёх и стоит в 10-30 раз дешевле. Но архитектуру не раскрывают, а часть разработчиков откатывается на 1.5.

ai cursor ide agents
gpt-54-mini-nano-release.md
GPT-5.4 mini и nano — mini кодит почти как флагман, nano описывает 76 000 фотографий за $52, а цены выросли втрое
> · 7 мин

GPT-5.4 mini и nano — mini кодит почти как флагман, nano описывает 76 000 фотографий за $52, а цены выросли втрое

OpenAI выпустила GPT-5.4 mini и nano — маленькие модели, которые на бенчмарках догоняют флагман. Mini набирает 54.4% на SWE-Bench Pro, nano стоит $0.20 за миллион токенов. Но цены выросли в 3-4 раза по сравнению с предшественниками.

ai llm coding api
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe