$ grep -r "llm" ./posts/

# llm

Большие языковые модели — бенчмарки, архитектуры, контекстные окна, fine-tuning и практическое применение LLM в разработке.

gpt-56-kindle-kepler-checkpoints.md
GPT-5.6 на низком старте: нашли финальный чекпоинт kindle-alpha, релиз — вопрос дней. Но половину «утечек» дорисовали
> · 9 мин

GPT-5.6 на низком старте: нашли финальный чекпоинт kindle-alpha, релиз — вопрос дней. Но половину «утечек» дорисовали

OpenAI тестирует финальные чекпоинты GPT-5.6 — kindle-alpha (release candidate) и kepler-alpha. Polymarket даёт 82% на релиз до 30 июня. Разбираем, что реально нашли в логах Codex, какие «спеки» дорисованы, и что делать разработчику прямо сейчас.

ai llm openai developer-tools
claude-fable-5.md
Claude Fable 5 — Anthropic открыл публике модель Mythos-класса. SOTA-кодинг, который сам отказывается ломать чужие системы
> · 8 мин

Claude Fable 5 — Anthropic открыл публике модель Mythos-класса. SOTA-кодинг, который сам отказывается ломать чужие системы

Anthropic выпустил Claude Fable 5 — первую публичную модель Mythos-класса: 80% на SWE-bench Pro, 1M контекста и работа в Claude Code. Но кибербез и биологию за неё отвечает Opus 4.8, цена вдвое выше, а с 23 июня модель убирают из подписок Pro и Max.

ai llm claude anthropic
best-free-ai-models-2026.md
> · 9 мин

Бесплатные AI-модели в 2026: 30 штук за $0 — какие тянут кодинг, а какие сливают ваш код в обучение

На OpenRouter сейчас около 30 моделей за $0 — от открытого флагмана OpenAI до Kimi K2.6. Разбираем, какие реально тянут кодинг, как запустить их локально через Ollama и какие бесплатные модели тихо логируют ваши промпты и учатся на них.

ai llm open-source openrouter
minimax-m3-review.md
MiniMax M3 — первая открытая модель с фронтир-кодингом, 1M контекста и зрением. А бенчмарки ей гоняли через Claude Code
> · 8 мин

MiniMax M3 — первая открытая модель с фронтир-кодингом, 1M контекста и зрением. А бенчмарки ей гоняли через Claude Code

MiniMax M3: первая open-weight модель с фронтир-кодингом, 1M контекста и мультимодальностью. 59% SWE-Bench Pro, цены втрое ниже Gemini Flash и веса, которых до сих пор нет. Разбор с подводными камнями.

ai agents llm open-source
gpt-56-leak-goblins.md
GPT-5.6 нашли в логах Codex — утечка, ставки на Polymarket и гоблины, из-за которых OpenAI торопится
> · 9 мин

GPT-5.6 нашли в логах Codex — утечка, ставки на Polymarket и гоблины, из-за которых OpenAI торопится

Security-исследователь нашёл gpt-5.6 в rollout-логах Codex, Polymarket даёт 82% на релиз до 30 июня. Разбираем, что реально известно о новой модели OpenAI, при чём тут гоблины с приростом +3881% и почему июнь столкнёт лбами сразу три лаборатории.

llm openai leak ai-models
claude-opus-48-dynamic-workflows.md
Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика
> · 9 мин

Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика

Anthropic выпустил Claude Opus 4.8 — апгрейд по цене 4.7. Динамические workflow в Claude Code (Bun переписан на Rust за 11 дней), fast mode в три раза дешевле и effort-control в UI claude.ai.

ai agents llm claude
qwen-37-max-agent-frontier.md
Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus
> · 9 мин

Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus

Alibaba тихо выкатила Qwen 3.7 Max — первый Max-вариант, который не вышел в open-source. 35 часов автономной работы, 1158 tool calls, 10× ускорение кернела на железе, которого не было в обучающих данных. И drop-in замена в Claude Code по нативному Anthropic-протоколу.

ai agents llm coding
deepseek-v4-pro-permanent-price-cut.md
DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз
> · 10 мин

DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз

23 мая DeepSeek закрепил промо-цены на V4-Pro как постоянные. Флагман с 1.6T параметров и 1M контекстом теперь стоит $0.435/$0.87 за 1M токенов. Это от 12 до 28 раз дешевле Sonnet, Opus и GPT-5.5. Разбираем подводные камни и миграцию на Claude Code.

ai llm open-source coding-agents
stealth-ai-fingerprinting-guide.md
Owl, Hunter, Healer и Aurora: гид по stealth-моделям OpenRouter, которые завтра окажутся GPT-5.5 и GLM-5
> · 10 мин

Owl, Hunter, Healer и Aurora: гид по stealth-моделям OpenRouter, которые завтра окажутся GPT-5.5 и GLM-5

На 23 мая 2026 на OpenRouter активны пять stealth-моделей: Owl, Elephant, Hunter, Healer, Aurora. Бесплатные, анонимные. По историческим паттернам это пре-релизы флагманов от Big AI. Гайд: кто они, как их фингерпринтить, какие инструменты автоматизируют процесс и где грабли.

ai llm tools openrouter
gemini-35-flash-launch.md
Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash
> · 10 мин

Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash

Google выкатил Gemini 3.5 Flash на I/O 2026. Впервые в истории Flash-модель обходит свой собственный Pro на кодинге и MCP-агентах — 76.2% Terminal-Bench, 4× быстрее frontier-моделей, 1M контекст. Но цена выросла в 3 раза от прошлого Flash, а критики уже зовут её "benchmaxxed fraud". Разбираем бенчмарки, цены, Managed Agents с AGENTS.md/SKILL.md и сравнение с Claude Opus 4.7 и GPT-5.5.

ai agents llm gemini