> · 5 мин

Claude Code теперь слушает — нативный голосовой режим, /voice и push-to-talk прямо в терминале

Claude Code теперь слушает — нативный голосовой режим, /voice и push-to-talk прямо в терминале

Claude Code теперь слушает — нативный голосовой режим, /voice и push-to-talk прямо в терминале

Борис Черни, создатель Claude Code, неделю писал CLI-код голосом. Тарик из Anthropic анонсировал роллаут нативного voice mode — пока для 5% пользователей, с расширением в ближайшие недели. Никаких сторонних сервисов, никаких MCP-серверов — голос встроен прямо в терминал.

TL;DR: В Claude Code появился нативный voice mode. Жмёшь пробел — говоришь — отпускаешь. Текст вставляется в промпт, не заменяя то, что уже набрано. Токены на транскрипцию не считаются в rate limits. Включается через /voice. Пока доступен ~5% пользователей Pro, Max, Team и Enterprise.

Как это работает

Механика проста до безобразия. Набираешь /voice в сессии Claude Code — и всё, голосовой режим активен. Дальше:

  1. Удерживаешь пробел
  2. Говоришь
  3. Отпускаешь

Распознанный текст вставляется в позицию курсора. Не заменяет то, что ты уже начал печатать — дополняет. Можно начать промпт руками, середину надиктовать, а конец дописать. Типичный workflow:

> Напечатал: "Перепиши функцию auth в"
> [Жмёшь пробел, говоришь: "модуль который принимает JWT токен, валидирует его и возвращает user ID"]
> Допечатал: ", добавь тесты на edge cases"

Текст и голос смешиваются в одном промпте — без разрывов, без переключения контекста.

Что реально важно: транскрипция бесплатна

Главная деталь, которую легко пропустить: токены на транскрипцию не учитываются в rate limits. На Max-плане за $100/мес это особенно ценно — каждый токен на счету, а голосовой ввод позволяет вводить длинные промпты, не тратя лимит на набор текста.

Дополнительной платы за voice mode нет. Он входит в любой план: Pro ($20), Max ($100/$200), Team, Enterprise.

Когда голос бьёт клавиатуру

Голосовой ввод — не замена клавиатуре. Это расширение того, когда ты можешь работать с Claude Code. Вот где голос реально полезен:

Описание багов. Объяснить словами, что именно сломалось, часто быстрее, чем печатать. "Когда пользователь логинится через Google OAuth, redirect_uri теряется, и после авторизации его кидает на главную вместо dashboard" — это 5 секунд голосом и 30 секунд клавиатурой.

Архитектурные обсуждения. "Сделай мне план миграции с Sidekiq на Temporal для задач обработки платежей, учти что у нас 50 воркеров и пиковая нагрузка 10К jobs в минуту" — проговорить такой промпт быстрее и детальнее, чем набивать.

Руки заняты. Код-ревью с кофе в руке. Диктовка документации на прогулке (если Claude Code запущен через SSH). Разбор pull request, пока ешь.

А вот для чего голос не подходит: переменные (camelCase и snake_case голосом — мучение), URL-ы, точные команды типа git rebase -i HEAD~3. Тут клавиатура всё ещё рулит.

Альтернативы

Голосовой ввод в AI-кодинге — не новость. Claude Code не первый.

Aider — open-source AI-ассистент с /voice командой из коробки. Использует PortAudio для захвата звука. Проще всего попробовать: aider --voice. Работает с любой моделью (GPT-4, Claude, Gemini). Минус — нет push-to-talk через пробел, нужно нажать Enter для отправки.

VoiceMode MCP — community-плагин для Claude Code с 847 звёздами на GitHub. Работает через OpenAI Whisper для STT и OpenAI TTS для озвучки ответов. Можно запустить полностью локально через Whisper.cpp и Kokoro — никакие API-ключи не нужны. 143 релиза, MIT-лицензия. Это то, чем пользовались до нативного voice mode.

Wispr Flow — внешний инструмент для голосовой диктовки, работает поверх любого приложения. Не привязан к Claude Code — просто конвертирует речь в текст в любое поле ввода. $10/мес. Плюс: работает с Cursor, VS Code, любым браузером. Минус: нет интеграции с контекстом Claude Code.

Подводные камни

Только английский. Voice mode пока работает только на английском. Для русскоязычных промптов придётся либо говорить на английском (и Claude ответит на русском, если CLAUDE.md так настроен), либо ждать поддержки других языков. Когда она появится — неизвестно.

5% пользователей. Роллаут начался, но большинство пока не получили доступ. Уведомление появится на welcome screen, когда очередь дойдёт до тебя. Ускорить нельзя — просто обновляй Claude Code (claude update) и жди.

Обрезание фраз. Общая проблема голосового режима Claude (не только в Code) — модель иногда прерывает пользователя на середине предложения. На Reddit и в GitHub Issues жалуются: иногда Claude слушает минуту, а иногда обрезает после первого предложения. Anthropic знает о проблеме, но пока не починили.

Bluetooth-наушники. Если используешь AirPods или другие Bluetooth-наушники, будь готов к задержкам. Bluetooth добавляет latency, и push-to-talk может реагировать с опозданием. Проводной микрофон работает надёжнее.

Имена переменных. Голосом диктовать getUserAuthTokenByEmail — это боль. Whisper транскрибирует как "get user auth token by email", и Claude Code должен угадать, что ты имел в виду camelCase. Иногда угадывает, иногда нет. Для промптов на естественном языке — работает отлично, для точных технических команд — нет.

Вердикт

Если ты на Max-плане и пишешь длинные промпты — voice mode экономит время и пальцы. Особенно для описания багов, архитектурных задач и код-ревью. Бесплатная транскрипция, не жрущая rate limits — сильный плюс.

Если тебе нужен голос прямо сейчас и ты не попал в 5% — ставь VoiceMode MCP, он работает уже сегодня. А если хочешь голосовой ввод везде, не только в Claude Code — смотри на Wispr Flow.

Ждать стоит: поддержку русского языка и исправление бага с обрезанием фраз. Без этого voice mode — скорее приятный бонус, чем must-have фича.

Как попробовать

  1. Обнови Claude Code до последней версии: claude update
  2. Проверь welcome screen — если видишь уведомление о voice mode, ты в числе 5%
  3. Набери /voice в сессии Claude Code, чтобы включить голосовой режим
  4. Удерживай пробел, говори промпт, отпускай — текст появится в поле ввода
  5. Если доступа ещё нет — установи VoiceMode MCP как временную альтернативу: claude mcp add --scope user voice-mode uvx voice-mode
$ ls ./related/

Похожие статьи

subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe