Claude Code v2.1.72 — max effort наконец в /model, /plan с аргументом и 12× экономия на кеше
Claude Code v2.1.72 — max effort наконец в /model, /plan с аргументом и 12× экономия на кеше
Anthropic выкатили v2.1.72, и главное — max effort, который раньше тихо перезаписывался на high при открытии /model, наконец появился в UI. Теперь в /model четыре уровня с иконками, и самый жирный — ◉ Max effort — доступен для Opus 4.6 прямо из интерфейса.
TL;DR: v2.1.72 добавляет max effort в
/model(четыре круга: ○ ◐ ● ◉), новую команду/effort autoдля сброса,/planс описанием задачи, и фикс prompt cache, который снижает расход токенов до 12×. Max effort — это Opus 4.6 без ограничений на токены, но квота тает пропорционально.
Что случилось с effort
Напомню контекст. В v2.1.68 Anthropic переключили Opus 4.6 с high на medium effort по умолчанию. Рутинные задачи стали быстрее, но 500+ человек на GitHub сообщили о деградации — Claude видел инструкции, но не следовал им, задачи требовали 7+ лишних итераций. Anthropic вернули ключевое слово ultrathink для переключения на high на один ход.
Проблема была и с max effort — уровень существовал в API, его можно было прописать в settings.json, но /model показывал только три варианта (low/medium/high). Откроешь /model — и твой max тихо откатится на high. Баг #30726, который раздражал людей с марта.
В v2.1.72 это починили. Теперь /model показывает:
◉ Max effort ← → to adjust
Четыре уровня, четыре иконки:
- ○ — low. Claude экономит токены, пропускает thinking на простых задачах
- ◐ — medium. Баланс скорости и качества, дефолт для Opus 4.6 на Max-подписке
- ● — high. Claude почти всегда думает, тратит столько, сколько нужно. Дефолт API
- ◉ — max. Никаких ограничений. Максимальная глубина рассуждений, больше tool calls, развёрнутые объяснения. Только Opus 4.6 — на других моделях вернёт ошибку
Переключаешь стрелками ← → прямо в /model. Плюс новая команда /effort auto — сбрасывает effort на дефолт для твоей модели. До этого не было способа вернуться к автоматическому выбору, не ковыряя settings.json.
Max vs high — в чём реальная разница
На high effort Claude "почти всегда думает" — extended thinking включается для сложных задач, пропускается для тривиальных. На max — думает всегда и максимально глубоко, без оглядки на расход токенов.
На практике это значит:
- Больше шагов рассуждения перед ответом
- Больше tool calls (Claude проверяет то, что на high мог бы пропустить)
- Развёрнутые объяснения вместо кратких
- Для сложных архитектурных решений или дебага race condition — разница заметна
Обратная сторона: по данным пользователей, на high effort один промпт с Opus 4.6 съедает 6-8% сессионной квоты (против ~4% на старом Opus 4.5). На max расход ещё выше. Anthropic не раскрывает формулу, но ожидайте, что max effort сократит ваше рабочее окно примерно вдвое по сравнению с high.
Через API max effort выглядит так:
{ "model": "claude-opus-4-6", "max_tokens": 4096, "messages": [{"role": "user", "content": "..."}], "output_config": { "effort": "max" } }
/plan теперь принимает описание задачи
До v2.1.72 /plan просто переключал в режим планирования. Нужно было отдельным сообщением писать, что планировать. Теперь:
/plan fix the auth bug and add rate limiting
Claude сразу входит в plan mode и начинает работу. Один turn меньше — а на Opus 4.6 каждый turn это токены.
Остальное, что стоит знать
/copy + клавиша w — раньше /copy только копировал в буфер. Теперь w записывает выделенный фрагмент напрямую в файл. Работа через SSH, где буфер обмена недоступен, стала на шаг удобнее.
ExitWorktree — можно выйти из worktree-сессии (после EnterWorktree) без перезапуска. Раньше вход в worktree был билетом в один конец.
CLAUDE_CODE_DISABLE_CRON — переменная окружения для остановки cron-задач посреди сессии. Если /loop из v2.1.71 зажил своей жизнью — теперь есть стоп-кран.
Agent tool: параметр model вернулся — снова можно указывать модель для каждого субагента отдельно. Убирали, теперь починили.
Prompt cache fix — исправление инвалидации кеша в SDK query() даёт до 12× снижение стоимости токенов. Если используете Agent SDK — это, возможно, самое важное изменение в релизе.
VSCode — URI-хендлер vscode://anthropic.claude-code/open с параметрами prompt и session для программного открытия Claude Code. Плюс индикатор effort на рамке поля ввода.
Подводные камни
Max effort + квота = быстрый конец рабочей сессии. На Max-подписке ($200/мес) пользователи сообщают, что недельная квота при high effort сливается за 1.5-1.8 часа вместо пятичасового окна. Max effort только усугубит это — каждый промпт станет дороже, а точной формулы пересчёта Anthropic не публикуют.
/effort auto не задокументирован. Команда работает, но её нет в документации — ни на странице model-config, ни в списке built-in команд. Если не знаешь — не найдёшь.
Max effort = max risk при auto-compact. Когда контекст переполняется, Claude Code сжимает историю (auto-compact). На max effort контекст растёт быстрее, compact срабатывает чаще, и каждый compact — потеря нюансов. Для длинных сессий это задокументированная проблема, которая на max effort проявится раньше.
Альтернативы
- Codex CLI — имеет свою систему уровней (low/medium/high/minimal). GPT-5.3-Codex лидирует на Terminal-Bench 2.0 с 77.3% против 65.4% у Claude. Для чисто терминальных задач (DevOps, скрипты, CI/CD) может быть объективно лучше, но у Claude Code выше пользовательский рейтинг в VS Code (4.0/5 vs 3.4/5)
- Ключевое слово
ultrathink— если не хочется ковыряться в настройках, пишешь ultrathink в промпте и получаешь high effort на один ход. Работает с v2.1.68. Для разового усиления рассуждений проще, чем переключать effort CLAUDE_CODE_EFFORT_LEVELenv-переменная — альтернатива UI для тех, кто запускает Claude Code в скриптах или CI. Значения:low,medium,high. Max через env-переменную пока не задокументирован
Вердикт
Max effort в /model — это не революция, а починка того, что должно было работать с самого начала. Но для тех, кто пишет сложные архитектурные промпты или дебажит многопоточные гонки, разница с high заметна и стоит потраченных токенов. Для ежедневного кодинга оптимальная стратегия не изменилась: medium по умолчанию + ultrathink когда нужно думать глубже. А вот /plan с аргументом и фикс prompt cache (12× экономия) — это то, что улучшит жизнь всем.
Как попробовать
- Обнови:
claude updateилиbrew upgrade claude-code - Проверь версию:
claude --version— должна быть 2.1.72 - Открой
/model, стрелками ← → двигай effort до ◉ Max (только на Opus 4.6) - Попробуй
/plan fix the auth bug— plan mode стартует сразу - Сбрось effort на дефолт:
/effort auto - Полный changelog на GitHub