$ grep -r "voice" ./posts/

# voice

Голосовые технологии — TTS-модели, синтез речи, клонирование голоса и open-source альтернативы ElevenLabs.

free-tts-models-replace-elevenlabs.md
7 бесплатных голосовых моделей, после которых ElevenLabs можно отменить
> · 8 мин

7 бесплатных голосовых моделей, после которых ElevenLabs можно отменить

Voxtral побеждает ElevenLabs в 68% слепых тестов, Kokoro генерирует речь на CPU, Silero решает омографы в русском. Разбираем лучшие open-source TTS-модели с установкой, примерами и подводными камнями.

ai open-source voice tools
qwen35-omni-multimodal-voice.md
Qwen3.5-Omni — 113 языков, голосовые клоны и аудио-видео в одном контуре. Alibaba наступает на пятки Gemini
> · 7 мин

Qwen3.5-Omni — 113 языков, голосовые клоны и аудио-видео в одном контуре. Alibaba наступает на пятки Gemini

Alibaba выкатила Qwen3.5-Omni — мультимодальную модель с текстом, картинками, аудио и видео в одном контуре. Три версии (Plus/Flash/Light), 256K контекста, 113 языков распознавания речи и voice cloning. Разбираем, что это даёт разработчику.

ai llm open-source qwen
voice-first-claude-code-workflow.md
Не трогай клавиатуру — голосовой workflow с Claude Code, который заменил мне IDE
> · 9 мин

Не трогай клавиатуру — голосовой workflow с Claude Code, который заменил мне IDE

Matt Van Horn ответил Kevin Rose: «No IDE. Just plan.md files and voice» — и это стало самым залайканным ответом из 128. Разбираем workflow: голос, Compound Engineering, параллельные сессии.

ai workflow claude-code productivity
claude-code-voice-mode.md
Claude Code теперь слушает — нативный голосовой режим, /voice и push-to-talk прямо в терминале
> · 5 мин

Claude Code теперь слушает — нативный голосовой режим, /voice и push-to-talk прямо в терминале

В Claude Code появился нативный голосовой режим. Жмёшь пробел, говоришь — текст вставляется в промпт. Пока доступен 5% пользователей, но роллаут идёт. Разбираем, как это работает, какие есть альтернативы и стоит ли ждать.

ai coding anthropic claude-code