diffnotes.tech — тех-блог о программировании, AI и DevOps

Все ai claude-code llm agents open-source productivity tips anthropic developer-tools mcp coding claude tools cursor openai gemini google api codex automation workflow ai-agents cli testing qwen ai-tools ide skills security comparison tokens voice models plugins coding-tools ai-coding cybersecurity multimodal openrouter tdd gpt coding-agent playwright pricing orchestration codex-cli multi-agent context-window coding-agents memory python stealth-models alibaba google-io-2026 moe git openclaw ralph-loop autonomous-coding ios swift xcode computer-use gpt-5.4 code-review browser-automation unity game-development xai grok context-engineering vibe-coding web-scraping chatgpt browser leak gemma hunter-alpha ai-models deepseek video-generation owl-alpha coding-assistant benchmarks benchmark research devtools deep-research terminal qa php laravel assistant worktrees docker parallel-development oauth websocket context-management mobile github copilot perplexity multi-model image-generation remotion video shorts instagram tiktok permissions future code-intelligence knowledge-graph future-of-programming opinion hooks xctest commands local-ai liquid-ai privacy fast-mode copilot-cli macos linux windows machine-learning cron scheduled-tasks effort settings godot unreal-engine search-api tavily exa agent-teams opus-4.6 expo cowork remote-control plugin google-colab responsive-design frontend telegram discord channels astral superapp kimi licensing documentation prompts figma design web-development demo gamedev gemini-cli speech scraping self-improvement ultraplan debugging function-calling free-tools china tts elevenlabs infrastructure configuration skill microsoft dotnet cost-optimization nous-research glm gpt-6 llama healer-alpha elephant-alpha gpt-5-5 tmux stealth-launch fal elixir linear rust tencent voice-cloning reasoning protocol nvidia nemotron mythos policy dense-model game-dev open-beta sonnet gpt-55 spacex managed-agents realtime subq subquadratic long-context transformers finance edge-ai vision ollama rag vector-search notion typescript workers malware chrome leaks veo lmarena fingerprinting api-pricing onboarding opus-4-8
$ ls -lt posts/ --page=18
best-claude-code-plugins.md
12 лучших плагинов для Claude Code — устанавливаем из официального магазина и работаем быстрее
> · 7 мин

12 лучших плагинов для Claude Code — устанавливаем из официального магазина и работаем быстрее

Разбираем лучшие плагины для Claude Code из официального магазина Anthropic — от кодревью и браузерной автоматизации до автономных сессий длиной в часы. Что установить, зачем и как.

ai plugins claude-code developer-tools
ai-testing-replace-qa.md
AI вместо тестировщика: Claude Code, Playwright MCP и инструменты, которые ломают ваш софт за вас
> · 6 мин

AI вместо тестировщика: Claude Code, Playwright MCP и инструменты, которые ломают ваш софт за вас

Как Claude Code с Playwright MCP заменяет ручной QA — браузерное тестирование, PHP/Laravel с Pest, автоматический QA на PR и готовые AI-платформы.

ai claude-code testing qa
opencode-terminal-agent.md
OpenCode — 108 тысяч звёзд и ноль привязки к вендору
> · 6 мин

OpenCode — 108 тысяч звёзд и ноль привязки к вендору

Open source терминальный AI-агент с 108K звёздами на GitHub. Работает с Claude, OpenAI, Gemini и локальными моделями — без подписок и vendor lock-in. Бросает вызов Claude Code на его территории.

ai open-source developer-tools coding-agent
ai-web-research-comparison.md
Кто лучше гуглит: Claude Opus 4.6, GPT-5.3 Codex или Gemini 3.1 Pro
> · 5 мин

Кто лучше гуглит: Claude Opus 4.6, GPT-5.3 Codex или Gemini 3.1 Pro

Три топовые модели февраля 2026 — и вопрос, который мучает всех: кто из них лучше ищет информацию в интернете? Разбираем бенчмарки, продукты Deep Research и реальные сценарии.

ai llm gemini claude
skillsbench-agent-skills.md
SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов
> · 5 мин

SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов

SkillsBench — бенчмарк из 84 задач в 11 доменах. Skills поднимают pass rate на 16.2%, но самогенерация не работает. Haiku со скиллами бьёт Opus без них.

ai agents llm benchmark
claude-code-security.md
Claude Code Security — AI-охотник за багами, обвалившим акции CrowdStrike на 8%
> · 5 мин

Claude Code Security — AI-охотник за багами, обвалившим акции CrowdStrike на 8%

Anthropic запустил Claude Code Security — инструмент, который сканирует код как живой security-исследователь. 500+ zero-day в open-source, обвал акций ИБ-компаний и новый стандарт в безопасности кода.

ai claude anthropic open-source
superpowers-claude-code-skills.md
Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной
> · 5 мин

Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной

Superpowers — open-source фреймворк из 15+ скиллов для Claude Code: TDD, планирование, дебаг, параллельные субагенты. 56K звёзд на GitHub.

ai agents open-source claude-code
opus-codex-gemini-coding-workflow.md
Opus vs Codex vs Gemini — три AI-модели, один workflow, ноль хаоса
> · 6 мин

Opus vs Codex vs Gemini — три AI-модели, один workflow, ноль хаоса

Claude Opus 4.6 и GPT-5.3 Codex вышли в один день и оказались не конкурентами, а напарниками. Разбираю, как строить workflow из трёх моделей — с Gemini 3.1 Pro в комплекте.

ai agents llm gemini
gemini-31-pro-benchmarks.md
Gemini 3.1 Pro — Google выходит в лидеры по 13 из 16 бенчмарков
> · 4 мин

Gemini 3.1 Pro — Google выходит в лидеры по 13 из 16 бенчмарков

Google выпустил Gemini 3.1 Pro — модель, которая обошла Claude Opus 4.6 и GPT-5.2 по большинству бенчмарков. ARC-AGI-2 вдвое выше предшественника, LiveCodeBench на уровне топ-программистов мира.

ai llm gemini google
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe