$ grep -r "agents" ./posts/

# agents

autoresearch-karpathy-overnight-ml.md
Autoresearch — Karpathy выложил фреймворк, где AI-агент ночью гоняет 100 ML-экспериментов на одной GPU
> · 7 мин

Autoresearch — Karpathy выложил фреймворк, где AI-агент ночью гоняет 100 ML-экспериментов на одной GPU

Andrej Karpathy упаковал autoresearch — фреймворк, где AI-агент сам модифицирует код обучения LLM, запускает 5-минутные тренировки и за ночь прогоняет ~100 экспериментов. 4.2K звёзд за два дня.

ai agents llm open-source
localcowork-offline-ai-agent.md
LocalCowork — 302 нейрона червя, 75 инструментов и AI-агент, который работает без интернета на твоём ноутбуке
> · 10 мин

LocalCowork — 302 нейрона червя, 75 инструментов и AI-агент, который работает без интернета на твоём ноутбуке

Liquid AI выпустили LocalCowork — десктопный AI-агент с MCP, работающий полностью офлайн. Архитектура вдохновлена мозгом червя C. elegans, 385мс на tool call, 14.5 ГБ RAM. Разбираем, когда это реально полезно.

ai agents open-source mcp
gpt-54-computer-use-agent.md
GPT-5.4 — миллион токенов, computer use быстрее человека и плагины для Excel, которые превращают ChatGPT в офисного работника
> · 8 мин

GPT-5.4 — миллион токенов, computer use быстрее человека и плагины для Excel, которые превращают ChatGPT в офисного работника

GPT-5.4 — первая mainline-модель OpenAI с нативным computer use и контекстом на 1M токенов. На OSWorld обогнала людей, на задачах инвестбанковского аналитика в Excel набирает 87.3%. Разбираем, что это значит для разработчиков.

ai agents llm openai
claude-code-2163-auto-memory-batch-simplify.md
Claude Code v2.1.63 — авто-память, HTTP hooks, и два агента, которые ревьюят и мигрируют код за тебя
> · 9 мин

Claude Code v2.1.63 — авто-память, HTTP hooks, и два агента, которые ревьюят и мигрируют код за тебя

Claude Code v2.1.63: авто-память через MEMORY.md, HTTP hooks для внешних сервисов, /simplify — три агента ревьюят код параллельно, /batch — миграции всей кодовой базы через worktrees, и 10+ исправлений утечек памяти.

ai agents anthropic claude-code
claude-code-future-autonomous-coding.md
От 30 секунд до 14 часов — и это не предел. Как Claude Code и новые модели переписывают правила кодинга
> · 8 мин

От 30 секунд до 14 часов — и это не предел. Как Claude Code и новые модели переписывают правила кодинга

4% коммитов на GitHub уже пишет Claude Code. К концу 2026 будет 20%. METR показывает: AI удваивает горизонт задач каждые 4-7 месяцев. Что это значит для разработчиков и что принесёт Claude 5.

ai agents coding anthropic
perplexity-computer-digital-worker.md
Perplexity Computer — 19 моделей, один цифровой работник и $200 в месяц за оркестр, который кодит за тебя
> · 6 мин

Perplexity Computer — 19 моделей, один цифровой работник и $200 в месяц за оркестр, который кодит за тебя

Perplexity запустил Computer — облачного AI-агента, который оркестрирует 19 моделей от Anthropic, Google, OpenAI и xAI. Claude Opus 4.6 дирижирует, субагенты работают параллельно часами. Стоит ли $200 в месяц?

ai agents productivity perplexity
openai-websocket-responses-api.md
OpenAI WebSocket mode — Responses API переезжает на постоянное соединение, и агенты ускоряются на 40%
> · 5 мин

OpenAI WebSocket mode — Responses API переезжает на постоянное соединение, и агенты ускоряются на 40%

OpenAI добавил WebSocket mode в Responses API — постоянное соединение, инкрементальные запросы и до 40% ускорения для агентских цепочек с десятками tool-вызовов.

agents llm api openai
openclaw-personal-ai-assistant.md
OpenClaw — open-source AI-ассистент с 216K звёздами, который живёт в твоих мессенджерах и делает за тебя всё
> · 6 мин

OpenClaw — open-source AI-ассистент с 216K звёздами, который живёт в твоих мессенджерах и делает за тебя всё

OpenClaw — open-source персональный AI-ассистент, который работает локально, подключается к WhatsApp, Telegram, Slack и ещё десятку мессенджеров, и реально выполняет задачи: от разбора почты до деплоя проектов. 216 тысяч звёзд на GitHub и создатель, которого забрал себе OpenAI.

ai agents open-source assistant
skillsbench-agent-skills.md
SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов
> · 5 мин

SkillsBench — первый бенчмарк, где тестируют не модели, а скиллы для AI-агентов

SkillsBench — бенчмарк из 84 задач в 11 доменах. Skills поднимают pass rate на 16.2%, но самогенерация не работает. Haiku со скиллами бьёт Opus без них.

ai agents llm benchmark
superpowers-claude-code-skills.md
Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной
> · 5 мин

Superpowers — фреймворк, который превращает Claude Code в синьора с дисциплиной

Superpowers — open-source фреймворк из 15+ скиллов для Claude Code: TDD, планирование, дебаг, параллельные субагенты. 56K звёзд на GitHub.

ai agents open-source claude-code