> · 9 мин

Не трогай клавиатуру — голосовой workflow с Claude Code, который заменил мне IDE

Не трогай клавиатуру — голосовой workflow с Claude Code, который заменил мне IDE

Не трогай клавиатуру — голосовой workflow с Claude Code, который заменил мне IDE

Kevin Rose спросил в X: какой IDE использовать? 128 ответов. Самый залайканный — от Matt Van Horn: «No IDE. Just plan.md files and voice.» 32 700 просмотров. Every подхватили: «Voice-pilled and compound-pilled.»

Звучит как провокация. Но за ней — конкретная система: 80% времени на планирование, 20% на код. Голос вместо клавиатуры. 4-6 параллельных сессий Claude Code. Плагин с 29 агентами, который запоминает каждое решение.

TL;DR: Голосовой ввод через Monologue/SuperWhisper + Compound Engineering plugin (/ce:plan/ce:work/ce:review/ce:compound) + параллельные сессии = workflow, где вы дирижируете оркестром агентов, а не стучите по клавиатуре. Рабочая скорость — 150 слов в минуту вместо 40.

Почему голос работает именно сейчас

Голосовой ввод для программистов существует давно — Dragon NaturallySpeaking появился в 90-х. Проблема была не в скорости (говорить всегда быстрее), а в тупости слушателя. Скажи «refactor the useAuth hook» — и получишь «ree-factor the use off hook». Regex-движки не понимают контекст.

LLM всё изменили. Когда транскрипция проходит через языковую модель, она использует контекст: содержимое CLAUDE.md, историю беседы, структуру проекта. «Ree-factor the use off hook» превращается в правильную команду, потому что модель знает, что в проекте есть useAuth hook. Как объясняет James Phoenix из Understanding Data: «Transcription does not need to be perfect because the LLM understands context and fills in gaps.»

Результат: вы говорите со скоростью 150 слов в минуту вместо 40 при печати. И — что важнее — вы естественно включаете больше контекста. Один разработчик на Reddit описал это так: «when you talk you naturally include more detail than when you type. you mention the file the error what you already tried. All the stuff that makes Claude Code nail it on the first pass instead of going back and forth.»

Три слоя voice-first workflow

Matt Van Horn не просто подключил микрофон к терминалу. Его workflow состоит из трёх слоёв, каждый усиливает предыдущий.

Слой 1: Голос → промпт

Идея приходит в голову — вы проговариваете её вслух. Инструмент транскрипции (Monologue, SuperWhisper, Wispr Flow — сравнение ниже) ловит речь и вставляет текст в активное окно терминала. Ключевой момент: между голосом и Claude Code стоит «промежуточный AI» — не просто транскрибер, а модель, которая чистит речь.

Вот системный промпт, который один разработчик использует в SuperWhisper для превращения устной речи в чистый промпт:

You are a prompt formatter for Claude Code. Take my spoken input 
(may be in French) and convert it to a clear, direct technical 
instruction in English. Include file paths, function names, and 
error messages I mention. Remove filler words. Output only the 
formatted prompt, nothing else.

Итог: вы говорите 10 секунд — получаете промпт, который руками набирали бы минуту. И он точнее, потому что вы не поленились объяснить контекст.

Слой 2: Промпт → plan.md

Это ядро системы. Каждая идея, баг или скриншот превращается не в код, а в план. Van Horn использует команду /ce:plan из Compound Engineering plugin (11.2K звёзд на GitHub). Что происходит внутри:

/ce:plan "Add user authentication with OAuth"

Плагин спавнит три параллельных research-агента: один сканирует кодбазу на существующие паттерны, второй проверяет документацию фреймворков, третий ищет индустриальные best practices. Результаты сливаются в структурированный plan.md с шагами, зависимостями и критериями готовности.

Дальше — /ce:work, который берёт plan.md и выполняет его пошагово:

/ce:work docs/plans/2026-03-23-feat-user-auth-plan.md

Claude сначала задаёт уточняющие вопросы, потом пишет код и тесты строго по плану. Не импровизирует — следует документу.

Слой 3: Параллельные сессии

Van Horn запускает 4-6 сессий Claude Code одновременно. Одна исследует проблему, вторая пишет фичу, третья фиксит баги, четвёртая ревьюит код. Каждая — в своём контекстном окне, не мешает другим.

Как описывает Antoine Buteau: «The strategy transforms the developer into a conductor of an automated swarm rather than a manual coder.»

Голос здесь критически важен: когда у вас 4-6 терминалов, переключаться между ними и набирать команды — медленно. Голосом вы говорите инструкцию в фокусированное окно и переключаетесь на следующее за секунды.

Compound Engineering: полный цикл за 4 команды

Compound Engineering — это плагин от Every Inc. (те же люди, что сделали Monologue). 29 агентов, 22 команды, 20 скиллов. Философия создателя Kieran Klaassen: «Each unit of work makes future work easier, not harder.»

Четыре основных команды образуют цикл:

  • /ce:plan — три research-агента параллельно исследуют задачу и создают план
  • /ce:work — выполнение плана с уточняющими вопросами и тестами
  • /ce:review14 специализированных ревьюеров одновременно: security-sentinel (OWASP), архитектурный ревьюер, performance-анализатор и другие
  • /ce:compound — документирует решения в docs/solutions/, обновляет CLAUDE.md

И есть /lfg (let's f***ing go) — одна команда, которая цепочкой проходит весь пайплайн: planning → implementation → review → bug fixing → browser testing → compounding. Спавнит 50+ агентов по всем стадиям. По описанию Kieran Klaassen из интервью с Peter Yang: «describe a feature, and the agent chains the full pipeline from planning through implementation, review, bug resolution, browser testing, and compounding.»

Установка:

claude plugin install compound-engineering

Для Cursor, Codex и других инструментов:

bunx @every-env/compound-plugin install --to cursor

Какой голосовой инструмент выбрать

Пять основных вариантов, от бесплатного до дорогого:

  • Native /voice (бесплатно) — push-to-talk прямо в Claude Code: зажимаете пробел, говорите, отпускаете. Транскрипция не расходует токены. Но на Reddit жалуются: «I cannot even reliably record more than one sentence without some kind of disturbance or network error.» Для коротких команд работает, для длинных описаний — пока нестабильно.

  • Wispr Flow (бесплатный tier) — кроссплатформенный (Mac, Windows, iOS, Android), понимает camelCase и snake_case, распознаёт developer jargon. Работает в любом приложении. По сравнению от Zack Proser — лучший выбор для тех, кто работает на нескольких устройствах.

  • Monologue ($10/мес или $30/мес в связке Every) — от создателей Compound Engineering. Есть специальный Claude Code mode, DeepContext (адаптируется к приложению в фокусе), поддержка Apple Watch. Облачная обработка — аудио уходит на сервер.

  • SuperWhisper ($849 пожизненно, подписка дешевле) — кастомные режимы для каждого приложения, выбор AI-модели (GPT, Claude, Llama), локальная обработка. Один разработчик на Reddit настроил системный промпт, который берёт его французскую речь и переформатирует в чистый английский технический промпт — и Claude Code «just works first try way more often».

  • Spokenly (бесплатно, BYOK) — имеет MCP-сервер для прямого подключения к Claude Code и Cursor. Полностью офлайн режим — аудио не покидает устройство. Но нет Apple Watch и пока без Windows. Единственный инструмент с нативной интеграцией через MCP.

Что выбрать? Если нужно попробовать бесплатно — Wispr Flow или native /voice. Если важна приватность — Spokenly с офлайн-режимом. Если вы в экосистеме Every и уже используете Compound Engineering — Monologue, чтобы всё работало из одной связки.

Подводные камни

Native /voice нестабилен. На момент марта 2026 функция раскатана примерно на 5% пользователей и работает с перебоями. Wispr Flow или SuperWhisper надёжнее в разы, но стоят денег.

Голос не заменяет клавиатуру для кода. Диктовать const handleAuth = async (req: Request) голосом — мучение. Голос работает для описания задач на естественном языке. Код пишет агент, не вы. Если вам нужно вручную набирать код — этот workflow не для вас.

50+ агентов /lfg = серьёзный расход токенов. Anthropic официально указывает, что Agent Teams потребляют примерно 7x больше токенов, чем одиночная сессия. Compound Engineering на /lfg с 50+ агентами может легко сжечь $50-100 за одну фичу на API-тарифе. На Max-плане за $200/мес вы упрётесь в лимит быстрее, чем ожидаете.

Облачные голосовые инструменты отправляют аудио на серверы. Monologue обрабатывает речь в облаке — ваши технические обсуждения проходят через чужие серверы. Spokenly и SuperWhisper предлагают офлайн-режим, но с ограничениями по качеству транскрипции.

Compound Engineering plugin — не панацея. Из 47 протестированных скиллов разработчик обнаружил, что 40 ухудшают качество. Compound Engineering — один из тех, что работает, но его 29 агентов и 20 скиллов добавляют нагрузку на контекстное окно. Используйте /ce:plan и /ce:review целенаправленно, а не вызывайте /lfg на каждый мелкий баг.

Вердикт

Из трёх слоёв workflow самый ценный — второй: plan.md как центральный артефакт разработки. Это работает даже без голоса и без Compound Engineering — достаточно /plan из стандартного Claude Code. Голосовой ввод реально ускоряет ввод длинных описаний и переключение между параллельными сессиями, но нативный /voice пока сырой, а сторонние инструменты стоят $10-30/мес. Compound Engineering оправдан на проектах, где вы делаете больше одной фичи в день и хотите, чтобы каждое решение документировалось автоматически — /ce:compound экономит часы на документации.

Как попробовать

  1. Установите Compound Engineering plugin: claude plugin install compound-engineering — получите /ce:plan, /ce:work, /ce:review, /ce:compound.

  2. Попробуйте голосовой ввод бесплатно: /voice в Claude Code (если доступно) или установите Wispr Flow с бесплатным тарифом.

  3. Запустите первый plan-first workflow: скажите или напишите /ce:plan "опиши свою задачу" — три research-агента исследуют кодбазу и создадут plan.md.

  4. Откройте 2-3 параллельных терминала: один для /ce:work, другой для исследования, третий для тестов. Переключайтесь голосом.

  5. После завершения — /ce:compound: плагин задокументирует решения и обновит CLAUDE.md, чтобы следующая задача решалась быстрее.

$ ls ./related/

Похожие статьи

subscribe.sh

$ cat /dev/blog/updates

> Свежие заметки о программировании,

> DevOps и AI — прямо в мессенджер

./subscribe