$ grep -r "llm" ./posts/

# llm

Большие языковые модели — бенчмарки, архитектуры, контекстные окна, fine-tuning и практическое применение LLM в разработке.

deepseek-v4-release.md
DeepSeek V4 — миллион токенов за $3.48, open-weights под MIT и работа без Nvidia
> · 9 мин

DeepSeek V4 — миллион токенов за $3.48, open-weights под MIT и работа без Nvidia

DeepSeek V4 Pro и Flash: 1.6 триллиона параметров, миллион токенов контекста, MIT-лицензия, $3.48 за миллион выходных токенов и нативная поддержка Huawei Ascend. Open-weights flagship, который стоит в 21 раз дешевле Opus 4.7.

ai agents llm open-source
gpt-55-spud-codex-leak.md
Spud утёк за сутки до релиза: GPT-5.5 засветили в пикере Codex, а Simon Willison собрал «backdoor-API»
> · 7 мин

Spud утёк за сутки до релиза: GPT-5.5 засветили в пикере Codex, а Simon Willison собрал «backdoor-API»

22 апреля в Codex у Pro-юзеров внезапно появился пикер с gpt-5.5, oai-2.1, arcanine и glacier-alpha. Через сутки OpenAI выкатила GPT-5.5 официально. Simon Willison параллельно собрал инструмент, который крадёт авторизацию Codex CLI и стучится в API, которого пока нет. Разбираем, что утекло, что умеет Spud, и почему API «задерживается ради безопасности».

llm openai codex ai-agents
claude-mythos-anthropic-stealth-model.md
Claude Mythos — модель, которую Anthropic прячет от тебя. И правильно делает
> · 9 мин

Claude Mythos — модель, которую Anthropic прячет от тебя. И правильно делает

Две недели назад Anthropic случайно спалил существование своей самой мощной модели. Claude Mythos Preview нашла тысячи 0-day в OpenBSD, FFmpeg и ядре Linux. Публично не будет. Зачем это знать разработчику.

ai llm claude anthropic
april-2026-llm-flood.md
Апрель превратил AI-рынок в барахолку: GLM-5.1 под MIT бьёт GPT-5.4, Claude Mythos под 50-компанейским замком, GPT-6 так и не вышел
> · 8 мин

Апрель превратил AI-рынок в барахолку: GLM-5.1 под MIT бьёт GPT-5.4, Claude Mythos под 50-компанейским замком, GPT-6 так и не вышел

8+ моделей за две недели: GLM-5.1 под MIT бьёт GPT-5.4 на SWE-Bench Pro, Claude Mythos закрыт за 50 компаниями, Gemma 4 тянется на телефоне, а GPT-6 Spud должен был выйти 14 апреля, но на 17 апреля анонса нет. Что реально можно использовать сегодня и какие слухи игнорировать.

ai llm claude open-source
claude-opus-4-7-release.md
Claude Opus 4.7 — 1:1 пиксельные координаты, task budgets и тихо убитые thinking budgets
> · 9 мин

Claude Opus 4.7 — 1:1 пиксельные координаты, task budgets и тихо убитые thinking budgets

Anthropic выкатил Opus 4.7: SWE-bench Pro 64.3%, visual acuity скакнул с 54.5% до 98.5%, картинки до 3.75 Мп с 1:1 координатами, новый xhigh effort, task budgets в бете. И пачка breaking changes, которые сломают ваш продакшен, если не прочитать migration guide.

agents llm claude anthropic
hermes-agent-self-improving.md
Hermes Agent — self-improving AI-агент от Nous Research, который собрал +32K звёзд за неделю
> · 6 мин

Hermes Agent — self-improving AI-агент от Nous Research, который собрал +32K звёзд за неделю

Hermes Agent от Nous Research — опенсорсный self-improving агент, который сам пишет себе Skills, улучшает их через DSPy+GEPA и живёт в Telegram, Discord, Slack и на VPS за $5. Разбираю v0.9, архитектуру и подводные камни.

ai agents llm open-source
claude-opus-47-sonnet-48-leak.md
Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах
> · 10 мин

Claude Opus 4.7 и Sonnet 4.8 нашли в утечке кода Anthropic. Тем временем Opus 4.6 деградирует на глазах

Двойная утечка кода Anthropic раскрыла Opus 4.7, Sonnet 4.8 и новый тир Capybara выше Opus. Одновременно директор AI в AMD доказала деградацию Opus 4.6 данными из 6852 сессий: reasoning упал на 67%, расходы выросли в 122 раза. Разбираем что произошло, зачем нерфить модель и как починить.

ai llm claude anthropic
caveman-claude-skill.md
Caveman Claude — Claude Code skill, который говорит как неандерталец и экономит 75% output-токенов
> · 9 мин

Caveman Claude — Claude Code skill, который говорит как неандерталец и экономит 75% output-токенов

Мем с Reddit про «научил Claude говорить как пещерный человек» за неделю стал Claude Code skill с 13 тысячами звёзд. Считаем, сколько реально экономит (спойлер: не 75%), как ставить и кому не подходит.

ai llm anthropic open-source
glm-51-open-source-swe-bench.md
GLM-5.1 — open-source модель из Китая обошла Claude Opus и GPT-5.4 на SWE-Bench Pro, кодит 8 часов без остановки и стоит в 5 раз дешевле
> · 8 мин

GLM-5.1 — open-source модель из Китая обошла Claude Opus и GPT-5.4 на SWE-Bench Pro, кодит 8 часов без остановки и стоит в 5 раз дешевле

Z.ai выпустила GLM-5.1 под MIT-лицензией: 58.4% на SWE-Bench Pro (выше Claude Opus 4.6 и GPT-5.4), 600+ итераций оптимизации без плато. API в 5-8 раз дешевле конкурентов, подключается к Claude Code за 5 минут.

ai agents llm coding
gemma-4-open-agentic-model.md
Gemma 4 — Apache 2.0, function calling из коробки и 89% AIME. Google выложил open-weight модель, которая делает cloud API необязательным
> · 7 мин

Gemma 4 — Apache 2.0, function calling из коробки и 89% AIME. Google выложил open-weight модель, которая делает cloud API необязательным

Google DeepMind выпустил Gemma 4 — четыре open-weight модели от 2B до 31B под Apache 2.0 с native function calling и мультимодальностью. Flagship 31B занял #3 на Arena AI, обходит Qwen 3.5 по математике и кодингу, а E2B работает на телефоне.

ai agents llm google