diffnotes.tech — Тех-блог

Все ai claude-code llm agents open-source anthropic productivity tips developer-tools claude mcp coding openai tools cursor gemini google api codex automation ai-agents workflow cli security testing models ide qwen comparison pricing voice ai-tools skills tokens multimodal openrouter ai-models plugins coding-tools ai-coding cybersecurity leak alibaba tdd gpt coding-agent playwright orchestration codex-cli multi-agent context-window xai grok coding-agents memory python chatgpt stealth-models google-io-2026 gpt-5-6 moe research git openclaw ralph-loop autonomous-coding github ios swift xcode computer-use gpt-5.4 code-review browser-automation unity game-development context-engineering vibe-coding web-scraping browser gemma china glm hunter-alpha deepseek video-generation owl-alpha protocol nvidia vision ollama gpt-5.6 fable prompt-engineering coding-assistant benchmarks benchmark devtools deep-research terminal qa php laravel assistant worktrees docker parallel-development oauth websocket context-management mobile copilot perplexity multi-model image-generation remotion video shorts instagram tiktok permissions future code-intelligence knowledge-graph future-of-programming opinion hooks xctest commands local-ai liquid-ai privacy fast-mode copilot-cli macos linux windows machine-learning cron scheduled-tasks effort settings godot unreal-engine search-api tavily exa agent-teams opus-4.6 expo cowork remote-control plugin google-colab responsive-design frontend telegram discord channels astral superapp kimi licensing documentation prompts figma design web-development demo gamedev gemini-cli speech scraping self-improvement ultraplan debugging function-calling free-tools tts elevenlabs infrastructure configuration skill microsoft dotnet cost-optimization nous-research gpt-6 llama healer-alpha elephant-alpha gpt-5-5 tmux stealth-launch fal elixir linear rust tencent voice-cloning reasoning nemotron mythos policy dense-model game-dev open-beta sonnet gpt-55 spacex managed-agents realtime subq subquadratic long-context transformers finance edge-ai rag vector-search notion typescript workers malware chrome leaks veo lmarena fingerprinting api-pricing onboarding opus-4-8 robotics world-models physical-ai minimax free-models ocr baidu document-ai release-tracker gemini-35-pro local ml amazon data-labeling amd hardware local-llm llama-cpp code-quality interpretability ai-safety meta apple lawsuit curl writing

$ ls -lt posts/ --filter=llm

ai-writing-tell-negative-parallelism.md

> 14 Jul 2026 · 6 мин

«Это не просто фича — это философия»: главный тик AI-текстов, который никто не может объяснить. The Atlantic посчитал, Fortune 500 спалилась

The Atlantic разобрал негативный параллелизм — конструкцию «это не X, а Y», на которой сходятся модели всех лабораторий. Механизм никто не может объяснить, а Barron's насчитал 4-кратный рост паттерна в отчётах Fortune 500. Как вычистить тик из своих текстов и доков.

ai llm prompt-engineering writing

gemini-35-pro-cappuccino-leak.md

> 14 Jul 2026 · 6 мин

Gemini 3.5 Pro перенесли в третий раз. Зато утечка «Cappuccino» показала, что Google готовит: 2M контекста и Deep Thinking

Запуск Gemini 3.5 Pro сдвинулся на конец июля — уже третий перенос. Утечки описывают модель под кодовым именем Cappuccino: 2M-токенный контекст, режим Deep Thinking и сильный фронтенд-кодинг. Разбираем, что известно и чему из этого верить.

ai llm gemini google

muse-spark-11-meta-api.md

> 12 Jul 2026 · 7 мин

Meta впервые в истории продаёт свою модель. Muse Spark 1.1 стоит четверть цены конкурентов — а на HN уже поймали её бенчмарки на читерстве

Meta запустила Meta Model API — первый платный доступ к собственной модели. Muse Spark 1.1: $1.25/$4.25 за миллион, 1M контекста, победы в агентных бенчмарках и скандал с Terminal-Bench на Hacker News. $20 кредитов на старт, но только для США.

ai agents llm api

grok-45-cursor-spacexai.md

> 11 Jul 2026 · 6 мин

Grok 4.5 — Маск и Cursor обучили модель на чужих сессиях кодинга. Класс Opus за $2/$6, но с задержкой 14 секунд

xAI и Cursor выпустили совместно обученную модель Grok 4.5: $2/$6 за миллион токенов, 500K контекста и обучение на триллионах токенов реальных сессий Cursor. Разбираем цены, независимые бенчмарки и главный подвох — задержку первого токена в 14 секунд.

ai cursor llm xai

gpt-56-public-launch.md

> 09 Jul 2026 · 6 мин

GPT-5.6 выходит для всех: Terra отдаёт уровень GPT-5.5 за полцены, а за запись кеша OpenAI теперь берёт деньги

GPT-5.6 открывается для всех: Sol за цену GPT-5.5, Terra вдвое дешевле при том же уровне, Luna за $1. Плюс платная запись кеша и релиз, дату которого согласовали с правительством США.

llm api openai pricing

ai-coding-models-guide-july-2026.md

> 08 Jul 2026 · 5 мин

На чём кодить в июле 2026: расклад моделей по цене и задаче, когда флагманы дорожают каждую неделю

Sonnet 5 стал дефолтом с хитрым токенизатором, Fable 5 ушёл в кредиты по $10/$50, GPT-5.6 в превью, а локальные модели дышат в спину облачным. Практический расклад: какую модель выбрать под задачу и бюджет, без маркетинга.

ai llm coding claude

fable-5-leaves-subscriptions-gpt-56.md

> 08 Jul 2026 · 6 мин

Fable 5 должен был выпасть из подписок 7 июля. В последний момент Anthropic продлила до 12-го — прямо под ожидаемый GPT-5.6

7 июля Claude Fable 5 должен был уйти из подписок Pro/Max/Team в usage credits по $10/$50 — но в этот день Anthropic продлила доступ до 12 июля. Что меняется, куда роутить задачи и причём тут ожидаемый GPT-5.6.

ai llm claude anthropic

laguna-xs-21-local-coding-model.md

> 07 Jul 2026 · 6 мин

Laguna XS 2.1 — агентный кодер на 33B, который влезает в MacBook и не отправляет твой код никуда

Poolside выложила Laguna XS 2.1 — open-weight MoE на 33B (3B активных), которая крутится на Mac с 36 ГБ RAM. 70.9% на SWE-bench Verified, контекст 256K, установка одной командой в Ollama. Полностью локальный агентный кодер за спиной которого западная лаба.

ai llm coding open-source

claude-sonnet-5-tokenizer-price.md

> 06 Jul 2026 · 6 мин

Claude Sonnet 5 — почти Opus 4.8 за 40% цены. Но новый токенизатор съест вашу скидку

Anthropic выпустила Claude Sonnet 5 и с 1 июля сделала его дефолтом для всех. На высоких effort-уровнях он догоняет Opus 4.8 за 40% цены — но новый токенизатор считает тот же текст в 1.35× больше токенов, а с 1 сентября прайс вырастет на 50%.

ai agents llm claude

subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe

diffnotes.tech — тех-блог о программировании, AI и DevOps