diffnotes.tech — тех-блог о программировании, AI и DevOps

Все ai claude-code llm agents open-source productivity tips anthropic developer-tools mcp coding claude tools cursor openai gemini google api codex automation workflow ai-agents cli testing qwen ai-tools ide skills security comparison tokens voice models plugins coding-tools ai-coding cybersecurity multimodal openrouter tdd gpt coding-agent playwright pricing orchestration codex-cli multi-agent context-window coding-agents memory python stealth-models alibaba google-io-2026 moe git openclaw ralph-loop autonomous-coding ios swift xcode computer-use gpt-5.4 code-review browser-automation unity game-development xai grok context-engineering vibe-coding web-scraping chatgpt browser leak gemma hunter-alpha ai-models deepseek video-generation owl-alpha coding-assistant benchmarks benchmark research devtools deep-research terminal qa php laravel assistant worktrees docker parallel-development oauth websocket context-management mobile github copilot perplexity multi-model image-generation remotion video shorts instagram tiktok permissions future code-intelligence knowledge-graph future-of-programming opinion hooks xctest commands local-ai liquid-ai privacy fast-mode copilot-cli macos linux windows machine-learning cron scheduled-tasks effort settings godot unreal-engine search-api tavily exa agent-teams opus-4.6 expo cowork remote-control plugin google-colab responsive-design frontend telegram discord channels astral superapp kimi licensing documentation prompts figma design web-development demo gamedev gemini-cli speech scraping self-improvement ultraplan debugging function-calling free-tools china tts elevenlabs infrastructure configuration skill microsoft dotnet cost-optimization nous-research glm gpt-6 llama healer-alpha elephant-alpha gpt-5-5 tmux stealth-launch fal elixir linear rust tencent voice-cloning reasoning protocol nvidia nemotron mythos policy dense-model game-dev open-beta sonnet gpt-55 spacex managed-agents realtime subq subquadratic long-context transformers finance edge-ai vision ollama rag vector-search notion typescript workers malware chrome leaks veo lmarena fingerprinting api-pricing onboarding opus-4-8
$ ls -lt posts/ --filter=open-source
deepseek-v4-pro-permanent-price-cut.md
DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз
> · 10 мин

DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз

23 мая DeepSeek закрепил промо-цены на V4-Pro как постоянные. Флагман с 1.6T параметров и 1M контекстом теперь стоит $0.435/$0.87 за 1M токенов. Это от 12 до 28 раз дешевле Sonnet, Opus и GPT-5.5. Разбираем подводные камни и миграцию на Claude Code.

ai llm open-source coding-agents
claude-context-mcp-codebase-search.md
claude-context — Claude Code наконец видит весь твой монорепо. 25× меньше токенов и 10K звёзд за два месяца
> · 7 мин

claude-context — Claude Code наконец видит весь твой монорепо. 25× меньше токенов и 10K звёзд за два месяца

Open-source MCP-сервер, который индексирует репозиторий в векторную БД и даёт Claude Code гибридный поиск BM25 + dense vector. 25× меньше токенов, чем дефолтный grep, на больших монорепо. Работает с Cursor, Codex CLI, Gemini CLI и любым MCP-клиентом.

open-source claude-code developer-tools mcp
minicpm-v-46-edge-multimodal.md
MiniCPM-V 4.6 — мультимодальная модель на 1.3B, которая видит видео на айфоне без интернета и весит 1.6 ГБ
> · 7 мин

MiniCPM-V 4.6 — мультимодальная модель на 1.3B, которая видит видео на айфоне без интернета и весит 1.6 ГБ

OpenBMB из Tsinghua тихо выложили MiniCPM-V 4.6 — мультимодальную модель на 1.3B под Apache 2.0. 1.6 ГБ через Ollama, работает на iPhone, Android и HarmonyOS без интернета. 38% на MMMU-Pro — рекорд для open-weight моделей до 2B параметров.

ai llm open-source multimodal
claude-financial-services-agents.md
Anthropic дропнул 10 готовых Claude-агентов под инвестбанки в open-source. FactSet упал на 8%, а в hooks.json половины плагинов лежит баг
> · 9 мин

Anthropic дропнул 10 готовых Claude-агентов под инвестбанки в open-source. FactSet упал на 8%, а в hooks.json половины плагинов лежит баг

Anthropic выложил на GitHub репо с десятью готовыми агент-шаблонами для финансов: pitch builder, KYC screener, GL reconciler. Apache 2.0, ставится в Claude Code одной командой. FactSet потерял 8% капитализации за день. Но 4 плагина из 5 не грузятся из-за сломанного hooks.json, в issues уже толпа PR-ов с фиксами.

claude anthropic open-source claude-code
qwen-36-27b-dense-coding.md
Qwen3.6-27B — 27 миллиардов параметров обыграли 397 миллиардов на кодинге. И всё это влезает в одну GPU
> · 8 мин

Qwen3.6-27B — 27 миллиардов параметров обыграли 397 миллиардов на кодинге. И всё это влезает в одну GPU

27B dense-модель Alibaba под Apache 2.0 берёт 77.2% на SWE-bench Verified (уровень Claude Opus 4.5) и обходит собственного 397B MoE-предшественника. Влезает в RTX 4090 в Q4, мультимодальная, 262K контекста нативно (до 1M через YaRN). На OpenRouter $0.32 / $3.20 за миллион токенов.

ai llm coding open-source
nemotron-3-nano-omni.md
NVIDIA Nemotron 3 Nano Omni: 30B-модель, которая видит, слышит и читает за один проход. И обходит Qwen3-Omni на каждом бенчмарке
> · 8 мин

NVIDIA Nemotron 3 Nano Omni: 30B-модель, которая видит, слышит и читает за один проход. И обходит Qwen3-Omni на каждом бенчмарке

NVIDIA выкатила открытую multimodal модель Nemotron 3 Nano Omni: 30B параметров, 3B активных, понимает video/audio/image/text одной моделью. 9x throughput vs другие omni-модели, 25 ГБ RAM в 4-бит. Бьёт Qwen3-Omni на каждом бенчмарке.

ai agents llm open-source
gnap-git-native-agent-protocol-v2.md
GNAP: оркестрируй рой AI-агентов через git-репо. 4 JSON-файла, ноль серверов
> · 6 мин

GNAP: оркестрируй рой AI-агентов через git-репо. 4 JSON-файла, ноль серверов

Farol Labs предлагает координировать AI-агентов через 4 JSON-файла в git-репо. Без серверов, без баз. Любой агент с git push автоматически в команде. Разбираем GNAP — RFC-черновик git-native оркестрации.

ai agents open-source git
tencent-hy3-preview-openrouter.md
Tencent Hy3 preview: 295B open-source, бывший OpenAI у руля, и вчера #1 на OpenRouter
> · 8 мин

Tencent Hy3 preview: 295B open-source, бывший OpenAI у руля, и вчера #1 на OpenRouter

Tencent открыла Hy3 preview — 295B MoE с 256K контекста и тремя режимами reasoning. Вчера модель вырвалась на #1 OpenRouter, опередив GPT-5.5 и Claude Opus 4.7. Бесплатна на OpenRouter две недели. Разбираем что внутри, как пробовать через OpenAI SDK и где подводные камни с лицензией.

ai agents llm open-source
plasmate-browser-agents-som.md
Plasmate — браузерный движок на Rust, который режет токены AI-агентов на 94%
> · 6 мин

Plasmate — браузерный движок на Rust, который режет токены AI-агентов на 94%

Plasmate компилирует HTML в Semantic Object Model — структурированный JSON для LLM. 4-5 мс на страницу, 94% экономии токенов, подключение к Claude Code за одну строку. Apache-2.0, проект одного человека.

ai open-source claude-code mcp
subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe