$ grep -r "llm" ./posts/

# llm

Большие языковые модели — бенчмарки, архитектуры, контекстные окна, fine-tuning и практическое применение LLM в разработке.

qwen35-omni-multimodal-voice.md
Qwen3.5-Omni — 113 языков, голосовые клоны и аудио-видео в одном контуре. Alibaba наступает на пятки Gemini
> · 7 мин

Qwen3.5-Omni — 113 языков, голосовые клоны и аудио-видео в одном контуре. Alibaba наступает на пятки Gemini

Alibaba выкатила Qwen3.5-Omni — мультимодальную модель с текстом, картинками, аудио и видео в одном контуре. Три версии (Plus/Flash/Light), 256K контекста, 113 языков распознавания речи и voice cloning. Разбираем, что это даёт разработчику.

ai llm open-source qwen
claude-mythos-leak.md
Claude Mythos — утечка раскрыла модель Anthropic, которая настолько сильна в кибербезе, что её боятся выпускать
> · 7 мин

Claude Mythos — утечка раскрыла модель Anthropic, которая настолько сильна в кибербезе, что её боятся выпускать

Anthropic случайно раскрыла Claude Mythos — новый тир модели выше Opus с прорывными возможностями в кодинге и кибербезопасности. Акции CrowdStrike и Palo Alto рухнули на 7%.

ai llm coding claude
claude-5-release-q2-2026-preview.md
Claude 5 — 90%+ SWE-bench, 500K контекст и дата «28 апреля», которую Amodei не отрицает. Разбираем всё, что известно
> · 7 мин

Claude 5 — 90%+ SWE-bench, 500K контекст и дата «28 апреля», которую Amodei не отрицает. Разбираем всё, что известно

Dario Amodei подтвердил Claude 5 в Q2 2026, слил дату 28 апреля и обещал 90%+ SWE-bench. Разбираем, чего ждать разработчикам — и почему скептики не верят.

ai llm coding claude
cursor-composer-2-own-coding-model.md
Cursor Composer 2 — собственная модель, которая бьёт Claude Opus 4.6 за десятую часть цены. Но пользователи уже просят вернуть старую версию
> · 8 мин

Cursor Composer 2 — собственная модель, которая бьёт Claude Opus 4.6 за десятую часть цены. Но пользователи уже просят вернуть старую версию

Cursor выпустил Composer 2 — первую in-house модель для кодинга, обученную исключительно на коде. Бьёт Claude Opus 4.6 на двух бенчмарках из трёх и стоит в 10-30 раз дешевле. Но архитектуру не раскрывают, а часть разработчиков откатывается на 1.5.

ai cursor ide agents
gpt-54-mini-nano-release.md
GPT-5.4 mini и nano — mini кодит почти как флагман, nano описывает 76 000 фотографий за $52, а цены выросли втрое
> · 7 мин

GPT-5.4 mini и nano — mini кодит почти как флагман, nano описывает 76 000 фотографий за $52, а цены выросли втрое

OpenAI выпустила GPT-5.4 mini и nano — маленькие модели, которые на бенчмарках догоняют флагман. Mini набирает 54.4% на SWE-Bench Pro, nano стоит $0.20 за миллион токенов. Но цены выросли в 3-4 раза по сравнению с предшественниками.

ai llm coding api
context-window-race-beyond-1m.md
1 миллион токенов — и что дальше? Гонка контекстных окон уже не про размер, а про то, что с ним делать
> · 9 мин

1 миллион токенов — и что дальше? Гонка контекстных окон уже не про размер, а про то, что с ним делать

Claude Opus 4.6 получил 1M контекст без наценки, Meta заявляет 10M, Magic.dev — 100M. Но реальная битва уже не за размер окна, а за context engineering — умение набить контекст правильными токенами вместо мусора.

ai agents llm claude-code
hindsight-agent-memory-system.md
Hindsight — open-source память для AI-агентов, которая учится как человеческий мозг, а не как тупой поиск по векторам
> · 8 мин

Hindsight — open-source память для AI-агентов, которая учится как человеческий мозг, а не как тупой поиск по векторам

Hindsight — open-source система памяти для AI-агентов от Vectorize.io. Три операции (Retain, Recall, Reflect), четыре стратегии поиска, SOTA на LongMemEval — и всё это через Docker за 60 секунд.

ai agents llm open-source
claude-code-opus-1m-context-default.md
Claude Code v2.1.75 — Opus 4.6 получил 1M контекст по умолчанию, и за это не берут ни цента сверху
> · 7 мин

Claude Code v2.1.75 — Opus 4.6 получил 1M контекст по умолчанию, и за это не берут ни цента сверху

Opus 4.6 и Sonnet 4.6 получили 1M контекст как стандарт — без beta-заголовков, без доплат, без конфигурации. Разбираем, что изменилось в Claude Code v2.1.75 и кому это реально пригодится.

ai llm anthropic claude-code
autoresearch-karpathy-overnight-ml.md
Autoresearch — Karpathy выложил фреймворк, где AI-агент ночью гоняет 100 ML-экспериментов на одной GPU
> · 7 мин

Autoresearch — Karpathy выложил фреймворк, где AI-агент ночью гоняет 100 ML-экспериментов на одной GPU

Andrej Karpathy упаковал autoresearch — фреймворк, где AI-агент сам модифицирует код обучения LLM, запускает 5-минутные тренировки и за ночь прогоняет ~100 экспериментов. 4.2K звёзд за два дня.

ai agents llm open-source
gpt-54-computer-use-agent.md
GPT-5.4 — миллион токенов, computer use быстрее человека и плагины для Excel, которые превращают ChatGPT в офисного работника
> · 8 мин

GPT-5.4 — миллион токенов, computer use быстрее человека и плагины для Excel, которые превращают ChatGPT в офисного работника

GPT-5.4 — первая mainline-модель OpenAI с нативным computer use и контекстом на 1M токенов. На OSWorld обогнала людей, на задачах инвестбанковского аналитика в Excel набирает 87.3%. Разбираем, что это значит для разработчиков.

ai agents llm openai