8 приёмов, которые режут расход токенов в Claude Code вдвое
8 приёмов, которые режут расход токенов в Claude Code вдвое
Средний разработчик тратит на Claude Code ~$6 в день. Звучит терпимо — пока не посчитаешь за месяц. Если запускаешь параллельные сессии или работаешь с большой кодовой базой — расход легко улетает за $200-300/месяц. При этом официальная документация прямо говорит: на типичном проекте 80-90% токенового бюджета уходит не на кодинг, а на exploration — чтение файлов, которые Claude мог бы не читать.
TL;DR: 8 конкретных приёмов для экономии токенов в Claude Code: переключение моделей, агрессивная чистка контекста, .claudeignore, субагенты для тяжёлых операций и точные промпты. Большинство разработчиков сокращают расходы на 40-70%.
1. Переключай модель под задачу
Claude Code по умолчанию работает на Opus — самой мощной и самой дорогой модели. Sonnet стоит в 5 раз дешевле ($3/$15 за миллион токенов вместо $15/$75), а справляется с 80% повседневных задач не хуже.
/model sonnet # для повседневного кода /model opus # сложная архитектура, дебаг на несколько файлов
Для субагентов можно поставить Haiku — он ищет по файлам и отвечает на простые вопросы за копейки:
# .claude/agents/quick-search.md --- model: haiku ---
Есть и хитрый гибрид — opusplan. Opus рассуждает в режиме планирования, а Sonnet генерирует код:
claude --model opusplan
Качество рассуждений Opus, стоимость генерации Sonnet. Только за счёт правильного выбора модели расход падает на 30-40%.
2. /clear между задачами — самый простой приём
Каждое сообщение Claude обрабатывает ВЕСЬ контекст от начала разговора. Дебажил авторизацию, потом писал тесты, потом рефакторил API в одной сессии — каждый новый запрос таскает весь этот мусор.
/rename auth-debug # чтобы потом найти сессию /clear # полный сброс контекста # начинаем новую задачу с чистого листа
Если понадобится вернуться:
claude --resume # выбрать из списка сессий claude --continue # продолжить последнюю
Правило простое: закончил задачу → /clear → начал новую. Одна команда — и тысячи токенов сэкономлены.
3. Компактируй на 50%, а не на 90%
Claude Code автоматически сжимает историю, когда контекст подходит к лимиту. Но к этому моменту ты уже несколько сообщений переплачиваешь за раздутый контекст, плюс автоматика может потерять важное.
/compact Focus on code samples and API changes
Мониторь заполнение через /cost или настрой status line — и компактируй вручную на 50-70%.
Мощный трюк — частичная компактизация. Жмёшь Esc + Esc (или /rewind), выбираешь точку в разговоре и "Summarize from here". Сжимается только хвост, а начало с важными решениями остаётся нетронутым.
Можно прописать правила компактизации прямо в CLAUDE.md:
# Compact instructions
When compacting, always preserve the full list of modified files and test commands
Теперь Claude знает, что при сжатии нельзя терять список изменённых файлов и результаты тестов.
4. .claudeignore — 30-100K токенов одним файлом
На стандартном Node.js проекте одна папка node_modules/ может сожрать десятки тысяч токенов при exploration. Файл .claudeignore работает как .gitignore — исключает директории из индексации:
# .claudeignore node_modules/ dist/ build/ .next/ coverage/ *.log *.lock __pycache__/ .venv/
По данным документации, это экономит от 30 000 до 100 000 токенов на стандартном проекте. Бесплатные токены — без единого компромисса в качестве.
5. Субагенты — пусть контекст пухнет у них
Запуск тестов, чтение логов, анализ документации — всё это заливает основной контекст тысячами строк. Субагент работает в изолированном контексте и возвращает только краткое саммари:
Use a subagent to run all tests and report only failures with file paths
Use subagents to investigate how our auth handles token refresh
Без субагента: Claude читает 20 файлов → 50K токенов в контексте. С субагентом: те же 20 файлов → в основной контекст попадает саммари на 200 токенов.
Для максимальной экономии запускай субагентов на Sonnet:
export CLAUDE_CODE_SUBAGENT_MODEL=sonnet
Субагенты — один из самых мощных инструментов управления контекстом, потому что решают главную проблему: exploration раздувает контекст, а субагент берёт это раздувание на себя.
6. Тонкий CLAUDE.md + Skills вместо монолита
CLAUDE.md загружается в КАЖДУЮ сессию. Если туда запихнуть инструкции по деплою, гайд по code review и описание архитектуры — это 15 000+ токенов ещё до первого вопроса.
Правило: держи CLAUDE.md под 500 строк. Только то, что нужно всегда:
# CLAUDE.md (slim) ## Code style - ES modules (import/export), not CommonJS - Destructure imports when possible ## Workflow - Run typecheck after code changes - Prefer single tests over full suite
Всё специфическое — в Skills, которые загружаются по требованию:
# .claude/skills/deploy/SKILL.md --- name: deploy description: Deployment workflow and checklist --- # Deploy Process 1. Run full test suite 2. Build production bundle ...
По данным claudefa.st, переход от раздутого CLAUDE.md к архитектуре skills + slim CLAUDE.md экономит ~15 000 токенов на сессию — это 82% от прежнего base context.
7. Сократи overhead от MCP серверов
Каждый MCP сервер добавляет описания инструментов в контекст — даже когда ты ими не пользуешься. 10 серверов × 500 токенов = 5000 токенов мёртвого груза в каждом запросе.
/context # что сейчас ест контекст /mcp # какие серверы подключены
Три правила:
- CLI вместо MCP —
gh,aws,gcloud,sentry-cliне добавляют постоянных определений в контекст. Claude запускает их через Bash только когда нужно - Отключай неактивные — если из 10 серверов реально используешь 3, остальные 7 просто жрут токены
- Снижай порог tool search — переменная
ENABLE_TOOL_SEARCH=auto:5автоматически откладывает инструменты, когда они превышают 5% контекста, и подгружает по требованию
8. Точные промпты — экономия на exploration
Размытый запрос заставляет Claude сканировать полпроекта. Конкретный — работать точечно.
- Дорого: "fix the login bug" → Claude читает всю
src/auth/, перебирает файлы - Дёшево: "fix the off-by-one error in
src/auth/tokenRefresh.tsline 45 that skips the last token" → один файл, одно исправление
Батчинг тоже помогает — объединяй связанные задачи:
Update error handling in auth.js, user.js, and api.js — add try/catch around all DB calls, log errors with request context
Один запрос с тремя файлами вместо трёх отдельных сессий.
И ещё: если нужно разобраться в коде, давай Claude направление поиска. Не "how does auth work?" а "look through src/auth/ git history and summarize how token refresh evolved". Это сокращает количество файлов, которые Claude прочитает.
Бонус: контролируй extended thinking
Extended thinking включен по умолчанию с бюджетом в 31 999 токенов. Thinking tokens — это output tokens, самые дорогие. Для простых задач такой бюджет — чистый перерасход.
export MAX_THINKING_TOKENS=8000
Или снижай effort level для Opus 4.6 через /model, или отключай thinking через /config для тривиальных задач.
Как мониторить расход
Экономить без цифр — гадание на кофейной гуще. Три инструмента:
/cost— расход текущей сессии прямо в терминале- ccusage — CLI-анализатор расхода из локальных логов:
npm install -g @ryoppippi/ccusage ccusage daily --breakdown # разбивка по моделям ccusage monthly # итоги за месяц
- Status line — постоянный индикатор контекста в терминале, настраивается через
/config
Кому это важно
- Разработчику — начни с
/model sonnetи/clearмежду задачами, добавь.claudeignore. Три действия, которые сразу дают 30-40% экономии - Тимлиду — при 10 разработчиках и ~$150/мес каждый, правильные настройки экономят $500-700/мес на команду. Пропиши модели и правила компактизации в общий CLAUDE.md
- Следишь за рынком — контекст-менеджмент становится core skill для AI-разработки. Кто научится управлять токенами — получит тот же результат за долю цены
Как попробовать
- Прямо сейчас — переключись на Sonnet:
/model sonnet - Создай
.claudeignoreв корне проекта — исключиnode_modules/,dist/,build/,coverage/ - Поставь ccusage —
npm install -g @ryoppippi/ccusage && ccusage daily— увидишь, сколько тратишь - Попробуй субагента — в следующий раз при прогоне тестов напиши
Use a subagent to run tests and report only failures - Документация: Manage costs effectively и Best practices
Claude Code — мощный инструмент, но мощь без контроля — это просто дорогой хаос. Ни один из этих приёмов не требует ничего сложного. Большинство — одна команда или один файл. А результат — 40-70% экономии и счета, которые не пугают в конце месяца.