Voxtral побеждает ElevenLabs в 68% слепых тестов, Kokoro генерирует речь на CPU, Silero решает омографы в русском. Разбираем лучшие open-source TTS-модели с установкой, примерами и подводными камнями.