> · 6 мин

Claude Code v2.1.72 — max effort наконец в /model, /plan с аргументом и 12× экономия на кеше

Claude Code v2.1.72 — max effort наконец в /model, /plan с аргументом и 12× экономия на кеше

Claude Code v2.1.72 — max effort наконец в /model, /plan с аргументом и 12× экономия на кеше

Anthropic выкатили v2.1.72, и главное — max effort, который раньше тихо перезаписывался на high при открытии /model, наконец появился в UI. Теперь в /model четыре уровня с иконками, и самый жирный — ◉ Max effort — доступен для Opus 4.6 прямо из интерфейса.

TL;DR: v2.1.72 добавляет max effort в /model (четыре круга: ○ ◐ ● ◉), новую команду /effort auto для сброса, /plan с описанием задачи, и фикс prompt cache, который снижает расход токенов до 12×. Max effort — это Opus 4.6 без ограничений на токены, но квота тает пропорционально.

Что случилось с effort

Напомню контекст. В v2.1.68 Anthropic переключили Opus 4.6 с high на medium effort по умолчанию. Рутинные задачи стали быстрее, но 500+ человек на GitHub сообщили о деградации — Claude видел инструкции, но не следовал им, задачи требовали 7+ лишних итераций. Anthropic вернули ключевое слово ultrathink для переключения на high на один ход.

Проблема была и с max effort — уровень существовал в API, его можно было прописать в settings.json, но /model показывал только три варианта (low/medium/high). Откроешь /model — и твой max тихо откатится на high. Баг #30726, который раздражал людей с марта.

В v2.1.72 это починили. Теперь /model показывает:

◉ Max effort   ← → to adjust

Четыре уровня, четыре иконки:

  • — low. Claude экономит токены, пропускает thinking на простых задачах
  • — medium. Баланс скорости и качества, дефолт для Opus 4.6 на Max-подписке
  • — high. Claude почти всегда думает, тратит столько, сколько нужно. Дефолт API
  • — max. Никаких ограничений. Максимальная глубина рассуждений, больше tool calls, развёрнутые объяснения. Только Opus 4.6 — на других моделях вернёт ошибку

Переключаешь стрелками ← → прямо в /model. Плюс новая команда /effort auto — сбрасывает effort на дефолт для твоей модели. До этого не было способа вернуться к автоматическому выбору, не ковыряя settings.json.

Max vs high — в чём реальная разница

На high effort Claude "почти всегда думает" — extended thinking включается для сложных задач, пропускается для тривиальных. На max — думает всегда и максимально глубоко, без оглядки на расход токенов.

На практике это значит:

  • Больше шагов рассуждения перед ответом
  • Больше tool calls (Claude проверяет то, что на high мог бы пропустить)
  • Развёрнутые объяснения вместо кратких
  • Для сложных архитектурных решений или дебага race condition — разница заметна

Обратная сторона: по данным пользователей, на high effort один промпт с Opus 4.6 съедает 6-8% сессионной квоты (против ~4% на старом Opus 4.5). На max расход ещё выше. Anthropic не раскрывает формулу, но ожидайте, что max effort сократит ваше рабочее окно примерно вдвое по сравнению с high.

Через API max effort выглядит так:

{
  "model": "claude-opus-4-6",
  "max_tokens": 4096,
  "messages": [{"role": "user", "content": "..."}],
  "output_config": {
    "effort": "max"
  }
}

/plan теперь принимает описание задачи

До v2.1.72 /plan просто переключал в режим планирования. Нужно было отдельным сообщением писать, что планировать. Теперь:

/plan fix the auth bug and add rate limiting

Claude сразу входит в plan mode и начинает работу. Один turn меньше — а на Opus 4.6 каждый turn это токены.

Остальное, что стоит знать

/copy + клавиша w — раньше /copy только копировал в буфер. Теперь w записывает выделенный фрагмент напрямую в файл. Работа через SSH, где буфер обмена недоступен, стала на шаг удобнее.

ExitWorktree — можно выйти из worktree-сессии (после EnterWorktree) без перезапуска. Раньше вход в worktree был билетом в один конец.

CLAUDE_CODE_DISABLE_CRON — переменная окружения для остановки cron-задач посреди сессии. Если /loop из v2.1.71 зажил своей жизнью — теперь есть стоп-кран.

Agent tool: параметр model вернулся — снова можно указывать модель для каждого субагента отдельно. Убирали, теперь починили.

Prompt cache fixисправление инвалидации кеша в SDK query() даёт до 12× снижение стоимости токенов. Если используете Agent SDK — это, возможно, самое важное изменение в релизе.

VSCode — URI-хендлер vscode://anthropic.claude-code/open с параметрами prompt и session для программного открытия Claude Code. Плюс индикатор effort на рамке поля ввода.

Подводные камни

Max effort + квота = быстрый конец рабочей сессии. На Max-подписке ($200/мес) пользователи сообщают, что недельная квота при high effort сливается за 1.5-1.8 часа вместо пятичасового окна. Max effort только усугубит это — каждый промпт станет дороже, а точной формулы пересчёта Anthropic не публикуют.

/effort auto не задокументирован. Команда работает, но её нет в документации — ни на странице model-config, ни в списке built-in команд. Если не знаешь — не найдёшь.

Max effort = max risk при auto-compact. Когда контекст переполняется, Claude Code сжимает историю (auto-compact). На max effort контекст растёт быстрее, compact срабатывает чаще, и каждый compact — потеря нюансов. Для длинных сессий это задокументированная проблема, которая на max effort проявится раньше.

Альтернативы

  • Codex CLI — имеет свою систему уровней (low/medium/high/minimal). GPT-5.3-Codex лидирует на Terminal-Bench 2.0 с 77.3% против 65.4% у Claude. Для чисто терминальных задач (DevOps, скрипты, CI/CD) может быть объективно лучше, но у Claude Code выше пользовательский рейтинг в VS Code (4.0/5 vs 3.4/5)
  • Ключевое слово ultrathink — если не хочется ковыряться в настройках, пишешь ultrathink в промпте и получаешь high effort на один ход. Работает с v2.1.68. Для разового усиления рассуждений проще, чем переключать effort
  • CLAUDE_CODE_EFFORT_LEVEL env-переменная — альтернатива UI для тех, кто запускает Claude Code в скриптах или CI. Значения: low, medium, high. Max через env-переменную пока не задокументирован

Вердикт

Max effort в /model — это не революция, а починка того, что должно было работать с самого начала. Но для тех, кто пишет сложные архитектурные промпты или дебажит многопоточные гонки, разница с high заметна и стоит потраченных токенов. Для ежедневного кодинга оптимальная стратегия не изменилась: medium по умолчанию + ultrathink когда нужно думать глубже. А вот /plan с аргументом и фикс prompt cache (12× экономия) — это то, что улучшит жизнь всем.

Как попробовать

  1. Обнови: claude update или brew upgrade claude-code
  2. Проверь версию: claude --version — должна быть 2.1.72
  3. Открой /model, стрелками ← → двигай effort до ◉ Max (только на Opus 4.6)
  4. Попробуй /plan fix the auth bug — plan mode стартует сразу
  5. Сбрось effort на дефолт: /effort auto
  6. Полный changelog на GitHub
$ ls ./related/

Похожие статьи

subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe