$ grep -r "llm" ./posts/

# llm

Большие языковые модели — бенчмарки, архитектуры, контекстные окна, fine-tuning и практическое применение LLM в разработке.

grok-43-release-pricing.md
Grok 4.3 — 53 балла на Intelligence Index, $1.25 за миллион токенов и регрессия в агентах. xAI выкатил модель, пока Маск судится с Altman'ом
> · 9 мин

Grok 4.3 — 53 балла на Intelligence Index, $1.25 за миллион токенов и регрессия в агентах. xAI выкатил модель, пока Маск судится с Altman'ом

xAI выкатил Grok 4.3 — reasoning-модель за $1.25/$2.50 за миллион токенов, на 40-60% дешевле Grok 4.20. Always-on reasoning, миллион токенов контекста и клонирование голоса за минуту. Но в агентских задачах модель «впадает в спячку», в ProofBench выбивает 11%, а отключить размышления нельзя — платишь за reasoning даже на «привет».

llm xai grok ai-models
owl-alpha-stealth-openrouter.md
Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал
> · 8 мин

Owl Alpha — новая stealth-модель на OpenRouter. 1M контекста, $0 за токены, и никто не знает, кто её сделал

Вчера, 30 апреля, на OpenRouter появилась новая stealth-модель Owl Alpha. 1M контекст, бесплатно, заточена под агентные задачи. Никто не знает, кто её сделал. Разбираем спецификации, спекуляции о происхождении (OpenAI? Alibaba? Xiaomi?), как её запустить из Claude Code и подводные камни.

ai agents llm openrouter
tencent-hy3-preview-openrouter.md
Tencent Hy3 preview: 295B open-source, бывший OpenAI у руля, и вчера #1 на OpenRouter
> · 8 мин

Tencent Hy3 preview: 295B open-source, бывший OpenAI у руля, и вчера #1 на OpenRouter

Tencent открыла Hy3 preview — 295B MoE с 256K контекста и тремя режимами reasoning. Вчера модель вырвалась на #1 OpenRouter, опередив GPT-5.5 и Claude Opus 4.7. Бесплатна на OpenRouter две недели. Разбираем что внутри, как пробовать через OpenAI SDK и где подводные камни с лицензией.

ai agents llm open-source
deepseek-v4-release.md
DeepSeek V4 — миллион токенов за $3.48, open-weights под MIT и работа без Nvidia
> · 9 мин

DeepSeek V4 — миллион токенов за $3.48, open-weights под MIT и работа без Nvidia

DeepSeek V4 Pro и Flash: 1.6 триллиона параметров, миллион токенов контекста, MIT-лицензия, $3.48 за миллион выходных токенов и нативная поддержка Huawei Ascend. Open-weights flagship, который стоит в 21 раз дешевле Opus 4.7.

ai agents llm open-source
gpt-55-spud-codex-leak.md
Spud утёк за сутки до релиза: GPT-5.5 засветили в пикере Codex, а Simon Willison собрал «backdoor-API»
> · 7 мин

Spud утёк за сутки до релиза: GPT-5.5 засветили в пикере Codex, а Simon Willison собрал «backdoor-API»

22 апреля в Codex у Pro-юзеров внезапно появился пикер с gpt-5.5, oai-2.1, arcanine и glacier-alpha. Через сутки OpenAI выкатила GPT-5.5 официально. Simon Willison параллельно собрал инструмент, который крадёт авторизацию Codex CLI и стучится в API, которого пока нет. Разбираем, что утекло, что умеет Spud, и почему API «задерживается ради безопасности».

llm openai codex ai-agents
claude-mythos-anthropic-stealth-model.md
Claude Mythos — модель, которую Anthropic прячет от тебя. И правильно делает
> · 9 мин

Claude Mythos — модель, которую Anthropic прячет от тебя. И правильно делает

Две недели назад Anthropic случайно спалил существование своей самой мощной модели. Claude Mythos Preview нашла тысячи 0-day в OpenBSD, FFmpeg и ядре Linux. Публично не будет. Зачем это знать разработчику.

ai llm claude anthropic
april-2026-llm-flood.md
Апрель превратил AI-рынок в барахолку: GLM-5.1 под MIT бьёт GPT-5.4, Claude Mythos под 50-компанейским замком, GPT-6 так и не вышел
> · 8 мин

Апрель превратил AI-рынок в барахолку: GLM-5.1 под MIT бьёт GPT-5.4, Claude Mythos под 50-компанейским замком, GPT-6 так и не вышел

8+ моделей за две недели: GLM-5.1 под MIT бьёт GPT-5.4 на SWE-Bench Pro, Claude Mythos закрыт за 50 компаниями, Gemma 4 тянется на телефоне, а GPT-6 Spud должен был выйти 14 апреля, но на 17 апреля анонса нет. Что реально можно использовать сегодня и какие слухи игнорировать.

ai llm claude open-source
claude-opus-4-7-release.md
Claude Opus 4.7 — 1:1 пиксельные координаты, task budgets и тихо убитые thinking budgets
> · 9 мин

Claude Opus 4.7 — 1:1 пиксельные координаты, task budgets и тихо убитые thinking budgets

Anthropic выкатил Opus 4.7: SWE-bench Pro 64.3%, visual acuity скакнул с 54.5% до 98.5%, картинки до 3.75 Мп с 1:1 координатами, новый xhigh effort, task budgets в бете. И пачка breaking changes, которые сломают ваш продакшен, если не прочитать migration guide.

agents llm claude anthropic
hermes-agent-self-improving.md
Hermes Agent — self-improving AI-агент от Nous Research, который собрал +32K звёзд за неделю
> · 6 мин

Hermes Agent — self-improving AI-агент от Nous Research, который собрал +32K звёзд за неделю

Hermes Agent от Nous Research — опенсорсный self-improving агент, который сам пишет себе Skills, улучшает их через DSPy+GEPA и живёт в Telegram, Discord, Slack и на VPS за $5. Разбираю v0.9, архитектуру и подводные камни.

ai agents llm open-source
claude-opus-47-sonnet-48-leak.md
Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах
> · 10 мин

Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах

Двойная утечка кода Anthropic раскрыла Opus 4.7, Sonnet 4.8 и новый тир Capybara выше Opus. Одновременно директор AI в AMD доказала деградацию Opus 4.6 данными из 6852 сессий: reasoning упал на 67%, расходы выросли в 122 раза. Разбираем что произошло, зачем нерфить модель и как починить.

ai llm claude anthropic