diffnotes.tech — тех-блог о программировании, AI и DevOps

Все ai claude-code agents productivity tips open-source llm developer-tools anthropic mcp coding cursor claude openai workflow automation tools codex cli testing gemini google api comparison ide skills tokens coding-tools voice ai-tools plugins qwen tdd security gpt coding-agent playwright pricing codex-cli multi-agent context-window python openclaw ai-coding ios swift xcode computer-use gpt-5.4 code-review browser-automation game-development ai-agents coding-agents memory context-engineering vibe-coding coding-assistant benchmarks moe benchmark research devtools deep-research terminal qa php laravel assistant git worktrees docker parallel-development oauth websocket context-management mobile ralph-loop autonomous-coding github copilot perplexity multi-model orchestration image-generation remotion video shorts instagram tiktok permissions future code-intelligence knowledge-graph future-of-programming opinion hooks xctest commands local-ai liquid-ai privacy fast-mode copilot-cli macos linux windows machine-learning cron scheduled-tasks effort settings unity godot unreal-engine search-api tavily exa agent-teams opus-4.6 xai grok expo cowork remote-control plugin google-colab responsive-design frontend telegram discord channels web-scraping chatgpt astral superapp kimi licensing documentation prompts figma design web-development demo gamedev gemini-cli cybersecurity multimodal speech browser scraping leak self-improvement ultraplan debugging gemma function-calling free-tools china tts elevenlabs infrastructure configuration skill microsoft dotnet models
$ ls -lt posts/ --filter=ai --page=12
opencode-terminal-agent.md
OpenCode — 108 тысяч звёзд и ноль привязки к вендору
> · 6 мин

OpenCode — 108 тысяч звёзд и ноль привязки к вендору

Open source терминальный AI-агент с 108K звёздами на GitHub. Работает с Claude, OpenAI, Gemini и локальными моделями — без подписок и vendor lock-in. Бросает вызов Claude Code на его территории.

ai open-source developer-tools coding-agent
ai-web-research-comparison.md
Кто лучше гуглит: Claude Opus 4.6, GPT-5.3 Codex или Gemini 3.1 Pro
> · 5 мин

Кто лучше гуглит: Claude Opus 4.6, GPT-5.3 Codex или Gemini 3.1 Pro

Три топовые модели февраля 2026 — и вопрос, который мучает всех: кто из них лучше ищет информацию в интернете? Разбираем бенчмарки, продукты Deep Research и реальные сценарии.

ai llm gemini claude
skillsbench-agent-skills.md
SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов
> · 5 мин

SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов

SkillsBench — бенчмарк из 84 задач в 11 доменах. Skills поднимают pass rate на 16.2%, но самогенерация не работает. Haiku со скиллами бьёт Opus без них.

ai agents llm benchmark
claude-code-security.md
Claude Code Security — AI-охотник за багами, обвалившим акции CrowdStrike на 8%
> · 5 мин

Claude Code Security — AI-охотник за багами, обвалившим акции CrowdStrike на 8%

Anthropic запустил Claude Code Security — инструмент, который сканирует код как живой security-исследователь. 500+ zero-day в open-source, обвал акций ИБ-компаний и новый стандарт в безопасности кода.

ai claude anthropic open-source
superpowers-claude-code-skills.md
Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной
> · 5 мин

Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной

Superpowers — open-source фреймворк из 15+ скиллов для Claude Code: TDD, планирование, дебаг, параллельные субагенты. 56K звёзд на GitHub.

ai agents open-source claude-code
opus-codex-gemini-coding-workflow.md
Opus vs Codex vs Gemini — три AI-модели, один workflow, ноль хаоса
> · 6 мин

Opus vs Codex vs Gemini — три AI-модели, один workflow, ноль хаоса

Claude Opus 4.6 и GPT-5.3 Codex вышли в один день и оказались не конкурентами, а напарниками. Разбираю, как строить workflow из трёх моделей — с Gemini 3.1 Pro в комплекте.

ai agents llm gemini
gemini-31-pro-benchmarks.md
Gemini 3.1 Pro — Google выходит в лидеры по 13 из 16 бенчмарков
> · 4 мин

Gemini 3.1 Pro — Google выходит в лидеры по 13 из 16 бенчмарков

Google выпустил Gemini 3.1 Pro — модель, которая обошла Claude Opus 4.6 и GPT-5.2 по большинству бенчмарков. ARC-AGI-2 вдвое выше предшественника, LiveCodeBench на уровне топ-программистов мира.

ai llm gemini google
cursor-25-marketplace-composer-agents.md
Cursor 2.5 — маркетплейс плагинов, собственный LLM и агенты, которые кодят двое суток без перерыва
> · 6 мин

Cursor 2.5 — маркетплейс плагинов, собственный LLM и агенты, которые кодят двое суток без перерыва

Cursor выпустил версию 2.5 с маркетплейсом плагинов (Figma, Stripe, AWS), собственной моделью Composer 1.5 с RL×20 и long-running агентами, которые автономно работают до 52 часов.

ai cursor ide coding-assistant
qwen-35-visual-agents-moe.md
Qwen 3.5 — 397 миллиардов параметров, 17 активных, и визуальный агент, который сам кликает кнопки
> · 5 мин

Qwen 3.5 — 397 миллиардов параметров, 17 активных, и визуальный агент, который сам кликает кнопки

Qwen 3.5: 397B параметров, 17B активных, визуальные агенты, 201 язык, Apache 2.0. В 12 раз дешевле Claude Opus. Обзор, бенчмарки, как запустить.

ai agents llm open-source
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe