# llm
Большие языковые модели — бенчмарки, архитектуры, контекстные окна, fine-tuning и практическое применение LLM в разработке.
GPT-5.6 на низком старте: нашли финальный чекпоинт kindle-alpha, релиз — вопрос дней. Но половину «утечек» дорисовали
OpenAI тестирует финальные чекпоинты GPT-5.6 — kindle-alpha (release candidate) и kepler-alpha. Polymarket даёт 82% на релиз до 30 июня. Разбираем, что реально нашли в логах Codex, какие «спеки» дорисованы, и что делать разработчику прямо сейчас.
Claude Fable 5 — Anthropic открыл публике модель Mythos-класса. SOTA-кодинг, который сам отказывается ломать чужие системы
Anthropic выпустил Claude Fable 5 — первую публичную модель Mythos-класса: 80% на SWE-bench Pro, 1M контекста и работа в Claude Code. Но кибербез и биологию за неё отвечает Opus 4.8, цена вдвое выше, а с 23 июня модель убирают из подписок Pro и Max.
Бесплатные AI-модели в 2026: 30 штук за $0 — какие тянут кодинг, а какие сливают ваш код в обучение
На OpenRouter сейчас около 30 моделей за $0 — от открытого флагмана OpenAI до Kimi K2.6. Разбираем, какие реально тянут кодинг, как запустить их локально через Ollama и какие бесплатные модели тихо логируют ваши промпты и учатся на них.
MiniMax M3 — первая открытая модель с фронтир-кодингом, 1M контекста и зрением. А бенчмарки ей гоняли через Claude Code
MiniMax M3: первая open-weight модель с фронтир-кодингом, 1M контекста и мультимодальностью. 59% SWE-Bench Pro, цены втрое ниже Gemini Flash и веса, которых до сих пор нет. Разбор с подводными камнями.
GPT-5.6 нашли в логах Codex — утечка, ставки на Polymarket и гоблины, из-за которых OpenAI торопится
Security-исследователь нашёл gpt-5.6 в rollout-логах Codex, Polymarket даёт 82% на релиз до 30 июня. Разбираем, что реально известно о новой модели OpenAI, при чём тут гоблины с приростом +3881% и почему июнь столкнёт лбами сразу три лаборатории.
Claude Opus 4.8 — Anthropic переписал Bun на Rust за 11 дней. И ещё четыре фичи, которые меняют день разработчика
Anthropic выпустил Claude Opus 4.8 — апгрейд по цене 4.7. Динамические workflow в Claude Code (Bun переписан на Rust за 11 дней), fast mode в три раза дешевле и effort-control в UI claude.ai.
Qwen 3.7 Max — модель, которая 35 часов сама оптимизировала GPU-кернел на неизвестном железе. И стоит в 4 раза дешевле Opus
Alibaba тихо выкатила Qwen 3.7 Max — первый Max-вариант, который не вышел в open-source. 35 часов автономной работы, 1158 tool calls, 10× ускорение кернела на железе, которого не было в обучающих данных. И drop-in замена в Claude Code по нативному Anthropic-протоколу.
DeepSeek сделал скидку 75% постоянной: V4-Pro теперь $0.87 за миллион output, и Opus стал дороже в 28 раз
23 мая DeepSeek закрепил промо-цены на V4-Pro как постоянные. Флагман с 1.6T параметров и 1M контекстом теперь стоит $0.435/$0.87 за 1M токенов. Это от 12 до 28 раз дешевле Sonnet, Opus и GPT-5.5. Разбираем подводные камни и миграцию на Claude Code.
Owl, Hunter, Healer и Aurora: гид по stealth-моделям OpenRouter, которые завтра окажутся GPT-5.5 и GLM-5
На 23 мая 2026 на OpenRouter активны пять stealth-моделей: Owl, Elephant, Hunter, Healer, Aurora. Бесплатные, анонимные. По историческим паттернам это пре-релизы флагманов от Big AI. Гайд: кто они, как их фингерпринтить, какие инструменты автоматизируют процесс и где грабли.
Gemini 3.5 Flash — Flash, который впервые бьёт собственный Pro. И стоит в 3 раза дороже прошлой Flash
Google выкатил Gemini 3.5 Flash на I/O 2026. Впервые в истории Flash-модель обходит свой собственный Pro на кодинге и MCP-агентах — 76.2% Terminal-Bench, 4× быстрее frontier-моделей, 1M контекст. Но цена выросла в 3 раза от прошлого Flash, а критики уже зовут её "benchmaxxed fraud". Разбираем бенчмарки, цены, Managed Agents с AGENTS.md/SKILL.md и сравнение с Claude Opus 4.7 и GPT-5.5.