> · 7 мин

8 приёмов, которые режут расход токенов в Claude Code вдвое

8 приёмов, которые режут расход токенов в Claude Code вдвое

8 приёмов, которые режут расход токенов в Claude Code вдвое

Средний разработчик тратит на Claude Code ~$6 в день. Звучит терпимо — пока не посчитаешь за месяц. Если запускаешь параллельные сессии или работаешь с большой кодовой базой — расход легко улетает за $200-300/месяц. При этом официальная документация прямо говорит: на типичном проекте 80-90% токенового бюджета уходит не на кодинг, а на exploration — чтение файлов, которые Claude мог бы не читать.

TL;DR: 8 конкретных приёмов для экономии токенов в Claude Code: переключение моделей, агрессивная чистка контекста, .claudeignore, субагенты для тяжёлых операций и точные промпты. Большинство разработчиков сокращают расходы на 40-70%.

1. Переключай модель под задачу

Claude Code по умолчанию работает на Opus — самой мощной и самой дорогой модели. Sonnet стоит в 5 раз дешевле ($3/$15 за миллион токенов вместо $15/$75), а справляется с 80% повседневных задач не хуже.

/model sonnet   # для повседневного кода
/model opus     # сложная архитектура, дебаг на несколько файлов

Для субагентов можно поставить Haiku — он ищет по файлам и отвечает на простые вопросы за копейки:

# .claude/agents/quick-search.md
---
model: haiku
---

Есть и хитрый гибрид — opusplan. Opus рассуждает в режиме планирования, а Sonnet генерирует код:

claude --model opusplan

Качество рассуждений Opus, стоимость генерации Sonnet. Только за счёт правильного выбора модели расход падает на 30-40%.

2. /clear между задачами — самый простой приём

Каждое сообщение Claude обрабатывает ВЕСЬ контекст от начала разговора. Дебажил авторизацию, потом писал тесты, потом рефакторил API в одной сессии — каждый новый запрос таскает весь этот мусор.

/rename auth-debug    # чтобы потом найти сессию
/clear                # полный сброс контекста
# начинаем новую задачу с чистого листа

Если понадобится вернуться:

claude --resume       # выбрать из списка сессий
claude --continue     # продолжить последнюю

Правило простое: закончил задачу → /clear → начал новую. Одна команда — и тысячи токенов сэкономлены.

3. Компактируй на 50%, а не на 90%

Claude Code автоматически сжимает историю, когда контекст подходит к лимиту. Но к этому моменту ты уже несколько сообщений переплачиваешь за раздутый контекст, плюс автоматика может потерять важное.

/compact Focus on code samples and API changes

Мониторь заполнение через /cost или настрой status line — и компактируй вручную на 50-70%.

Мощный трюк — частичная компактизация. Жмёшь Esc + Esc (или /rewind), выбираешь точку в разговоре и "Summarize from here". Сжимается только хвост, а начало с важными решениями остаётся нетронутым.

Можно прописать правила компактизации прямо в CLAUDE.md:

# Compact instructions
When compacting, always preserve the full list of modified files and test commands

Теперь Claude знает, что при сжатии нельзя терять список изменённых файлов и результаты тестов.

4. .claudeignore — 30-100K токенов одним файлом

На стандартном Node.js проекте одна папка node_modules/ может сожрать десятки тысяч токенов при exploration. Файл .claudeignore работает как .gitignore — исключает директории из индексации:

# .claudeignore
node_modules/
dist/
build/
.next/
coverage/
*.log
*.lock
__pycache__/
.venv/

По данным документации, это экономит от 30 000 до 100 000 токенов на стандартном проекте. Бесплатные токены — без единого компромисса в качестве.

5. Субагенты — пусть контекст пухнет у них

Запуск тестов, чтение логов, анализ документации — всё это заливает основной контекст тысячами строк. Субагент работает в изолированном контексте и возвращает только краткое саммари:

Use a subagent to run all tests and report only failures with file paths
Use subagents to investigate how our auth handles token refresh

Без субагента: Claude читает 20 файлов → 50K токенов в контексте. С субагентом: те же 20 файлов → в основной контекст попадает саммари на 200 токенов.

Для максимальной экономии запускай субагентов на Sonnet:

export CLAUDE_CODE_SUBAGENT_MODEL=sonnet

Субагенты — один из самых мощных инструментов управления контекстом, потому что решают главную проблему: exploration раздувает контекст, а субагент берёт это раздувание на себя.

6. Тонкий CLAUDE.md + Skills вместо монолита

CLAUDE.md загружается в КАЖДУЮ сессию. Если туда запихнуть инструкции по деплою, гайд по code review и описание архитектуры — это 15 000+ токенов ещё до первого вопроса.

Правило: держи CLAUDE.md под 500 строк. Только то, что нужно всегда:

# CLAUDE.md (slim)
## Code style
- ES modules (import/export), not CommonJS
- Destructure imports when possible

## Workflow
- Run typecheck after code changes
- Prefer single tests over full suite

Всё специфическое — в Skills, которые загружаются по требованию:

# .claude/skills/deploy/SKILL.md
---
name: deploy
description: Deployment workflow and checklist
---
# Deploy Process
1. Run full test suite
2. Build production bundle
...

По данным claudefa.st, переход от раздутого CLAUDE.md к архитектуре skills + slim CLAUDE.md экономит ~15 000 токенов на сессию — это 82% от прежнего base context.

7. Сократи overhead от MCP серверов

Каждый MCP сервер добавляет описания инструментов в контекст — даже когда ты ими не пользуешься. 10 серверов × 500 токенов = 5000 токенов мёртвого груза в каждом запросе.

/context   # что сейчас ест контекст
/mcp       # какие серверы подключены

Три правила:

  • CLI вместо MCPgh, aws, gcloud, sentry-cli не добавляют постоянных определений в контекст. Claude запускает их через Bash только когда нужно
  • Отключай неактивные — если из 10 серверов реально используешь 3, остальные 7 просто жрут токены
  • Снижай порог tool search — переменная ENABLE_TOOL_SEARCH=auto:5 автоматически откладывает инструменты, когда они превышают 5% контекста, и подгружает по требованию

8. Точные промпты — экономия на exploration

Размытый запрос заставляет Claude сканировать полпроекта. Конкретный — работать точечно.

  • Дорого: "fix the login bug" → Claude читает всю src/auth/, перебирает файлы
  • Дёшево: "fix the off-by-one error in src/auth/tokenRefresh.ts line 45 that skips the last token" → один файл, одно исправление

Батчинг тоже помогает — объединяй связанные задачи:

Update error handling in auth.js, user.js, and api.js — 
add try/catch around all DB calls, log errors with request context

Один запрос с тремя файлами вместо трёх отдельных сессий.

И ещё: если нужно разобраться в коде, давай Claude направление поиска. Не "how does auth work?" а "look through src/auth/ git history and summarize how token refresh evolved". Это сокращает количество файлов, которые Claude прочитает.

Бонус: контролируй extended thinking

Extended thinking включен по умолчанию с бюджетом в 31 999 токенов. Thinking tokens — это output tokens, самые дорогие. Для простых задач такой бюджет — чистый перерасход.

export MAX_THINKING_TOKENS=8000

Или снижай effort level для Opus 4.6 через /model, или отключай thinking через /config для тривиальных задач.

Как мониторить расход

Экономить без цифр — гадание на кофейной гуще. Три инструмента:

  • /cost — расход текущей сессии прямо в терминале
  • ccusage — CLI-анализатор расхода из локальных логов:
npm install -g @ryoppippi/ccusage
ccusage daily --breakdown    # разбивка по моделям
ccusage monthly              # итоги за месяц
  • Status line — постоянный индикатор контекста в терминале, настраивается через /config

Кому это важно

  • Разработчику — начни с /model sonnet и /clear между задачами, добавь .claudeignore. Три действия, которые сразу дают 30-40% экономии
  • Тимлиду — при 10 разработчиках и ~$150/мес каждый, правильные настройки экономят $500-700/мес на команду. Пропиши модели и правила компактизации в общий CLAUDE.md
  • Следишь за рынком — контекст-менеджмент становится core skill для AI-разработки. Кто научится управлять токенами — получит тот же результат за долю цены

Как попробовать

  1. Прямо сейчас — переключись на Sonnet: /model sonnet
  2. Создай .claudeignore в корне проекта — исключи node_modules/, dist/, build/, coverage/
  3. Поставь ccusagenpm install -g @ryoppippi/ccusage && ccusage daily — увидишь, сколько тратишь
  4. Попробуй субагента — в следующий раз при прогоне тестов напиши Use a subagent to run tests and report only failures
  5. Документация: Manage costs effectively и Best practices

Claude Code — мощный инструмент, но мощь без контроля — это просто дорогой хаос. Ни один из этих приёмов не требует ничего сложного. Большинство — одна команда или один файл. А результат — 40-70% экономии и счета, которые не пугают в конце месяца.

$ ls ./related/

Похожие статьи

subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe