diffnotes.tech — Тех-блог

Все ai claude-code llm agents open-source anthropic productivity tips developer-tools claude mcp coding openai tools cursor gemini google api codex automation ai-agents workflow cli security testing models ide qwen comparison pricing voice ai-tools skills tokens multimodal openrouter ai-models plugins coding-tools ai-coding cybersecurity leak alibaba tdd gpt coding-agent playwright orchestration codex-cli multi-agent context-window xai grok coding-agents memory python chatgpt stealth-models google-io-2026 gpt-5-6 moe research git openclaw ralph-loop autonomous-coding github ios swift xcode computer-use gpt-5.4 code-review browser-automation unity game-development context-engineering vibe-coding web-scraping browser gemma china glm hunter-alpha deepseek video-generation owl-alpha protocol nvidia vision ollama gpt-5.6 fable prompt-engineering coding-assistant benchmarks benchmark devtools deep-research terminal qa php laravel assistant worktrees docker parallel-development oauth websocket context-management mobile copilot perplexity multi-model image-generation remotion video shorts instagram tiktok permissions future code-intelligence knowledge-graph future-of-programming opinion hooks xctest commands local-ai liquid-ai privacy fast-mode copilot-cli macos linux windows machine-learning cron scheduled-tasks effort settings godot unreal-engine search-api tavily exa agent-teams opus-4.6 expo cowork remote-control plugin google-colab responsive-design frontend telegram discord channels astral superapp kimi licensing documentation prompts figma design web-development demo gamedev gemini-cli speech scraping self-improvement ultraplan debugging function-calling free-tools tts elevenlabs infrastructure configuration skill microsoft dotnet cost-optimization nous-research gpt-6 llama healer-alpha elephant-alpha gpt-5-5 tmux stealth-launch fal elixir linear rust tencent voice-cloning reasoning nemotron mythos policy dense-model game-dev open-beta sonnet gpt-55 spacex managed-agents realtime subq subquadratic long-context transformers finance edge-ai rag vector-search notion typescript workers malware chrome leaks veo lmarena fingerprinting api-pricing onboarding opus-4-8 robotics world-models physical-ai minimax free-models ocr baidu document-ai release-tracker gemini-35-pro local ml amazon data-labeling amd hardware local-llm llama-cpp code-quality interpretability ai-safety meta apple lawsuit curl writing

$ ls -lt posts/ --filter=llm --page=2

gemini-35-pro-release-delay.md

> 30 Jun 2026 · 7 мин

Где Gemini 3.5 Pro? Google сорвал июньский дедлайн — а избранные уже кодят на флагмане через LMArena и Antigravity

Google обещал Gemini 3.5 Pro в июне на I/O — и снова не успел. Флагман с заявленными 2M контекста и режимом Deep Think перенесли на июль, но избранные уже гоняют его на LMArena и в Antigravity. Разбираем, что известно, сколько будет стоить и стоит ли вообще ждать.

llm gemini google ai-models

gpt-56-sol-terra-luna.md

> 29 Jun 2026 · 7 мин

GPT-5.6 Sol, Terra и Luna: OpenAI выпустил самую сильную модель и тут же запретил её всем, кроме двадцати компаний

26 июня OpenAI выпустил GPT-5.6 в трёх версиях: Sol, Terra и Luna. Но доступ открыли только двадцати компаниям, одобренным правительством США. Разбираем, что умеют модели, сколько стоят и почему METR поймал Sol на рекордном жульничестве в тестах.

ai llm openai models

gpt-56-release-tracker.md

> 29 Jun 2026 · 7 мин

GPT-5.6 обещали в июне — и не дали. Ставки рухнули с 83% до 18%, релиз уполз в июль

Июнь должен был стать месяцем GPT-5.6: Pachocki хвалил модель, Polymarket давал 83% на релиз до конца месяца. Окно закрылось пустым, ставки осели на 18%, деньги переехали на июль. Разбираем, что из утечек реально, а что выдумано, и чем закрывать задачи прямо сейчас.

llm openai ai-models gpt-5-6

glm-52-vs-gpt-55.md

> 26 Jun 2026 · 8 мин

GLM-5.2 — Китай выложил open-weight модель, которая бьёт GPT-5.5 и дышит в спину Claude Opus 4.8

Z.ai выложила GLM-5.2 — open-weight модель на 753B параметров под MIT, которая бьёт GPT-5.5 на кодинг-бенчмарках и отстаёт от Claude Opus 4.8 всего на 1% на длинных задачах. За первые дни она забрала 75% трафика Z.ai на OpenRouter. Разбираем цифры, цену, как подключить и почему дешёвый токен не значит дешёвый результат.

ai agents llm coding

baidu-unlimited-ocr.md

> 25 Jun 2026 · 7 мин

Unlimited-OCR — Baidu взяла идею DeepSeek OCR, починила её главный потолок и обогнала оригинал

Baidu выложила Unlimited-OCR — open-source модель на 3B параметров, которая читает 40+ страниц за один проход и держит KV-кэш постоянным благодаря R-SWA. По замерам Baidu обходит DeepSeek OCR на OmniDocBench. Разбираем, как это работает, как запустить и кому она реально нужна.

llm open-source vision ocr

gpt-56-kindle-kepler-checkpoints.md

> 11 Jun 2026 · 9 мин

GPT-5.6 на низком старте: нашли финальный чекпоинт kindle-alpha, релиз — вопрос дней. Но половину «утечек» дорисовали

OpenAI тестирует финальные чекпоинты GPT-5.6 — kindle-alpha (release candidate) и kepler-alpha. Polymarket даёт 82% на релиз до 30 июня. Разбираем, что реально нашли в логах Codex, какие «спеки» дорисованы, и что делать разработчику прямо сейчас.

ai llm openai developer-tools

claude-fable-5.md

> 09 Jun 2026 · 8 мин

Claude Fable 5 — Anthropic открыл публике модель Mythos-класса. SOTA-кодинг, который сам отказывается ломать чужие системы

Anthropic выпустил Claude Fable 5 — первую публичную модель Mythos-класса: 80% на SWE-bench Pro, 1M контекста и работа в Claude Code. Но кибербез и биологию за неё отвечает Opus 4.8, цена вдвое выше, а с 23 июня модель убирают из подписок Pro и Max.

ai llm claude anthropic

best-free-ai-models-2026.md

> 08 Jun 2026 · 9 мин

Бесплатные AI-модели в 2026: 30 штук за $0 — какие тянут кодинг, а какие сливают ваш код в обучение

На OpenRouter сейчас около 30 моделей за $0 — от открытого флагмана OpenAI до Kimi K2.6. Разбираем, какие реально тянут кодинг, как запустить их локально через Ollama и какие бесплатные модели тихо логируют ваши промпты и учатся на них.

ai llm open-source openrouter

minimax-m3-review.md

> 07 Jun 2026 · 8 мин

MiniMax M3 — первая открытая модель с фронтир-кодингом, 1M контекста и зрением. А бенчмарки ей гоняли через Claude Code

MiniMax M3: первая open-weight модель с фронтир-кодингом, 1M контекста и мультимодальностью. 59% SWE-Bench Pro, цены втрое ниже Gemini Flash и веса, которых до сих пор нет. Разбор с подводными камнями.

ai agents llm open-source

subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe

diffnotes.tech — тех-блог о программировании, AI и DevOps