--- license: cc-by-nc-4.0 tags: - tts - russian - fine-tuned - f5-tts - voice-clone language: - ru base_model: - SWivid/F5-TTS pipeline_tag: text-to-speech --- **F5-TTS_RUSSIAN** - дообученная версия оригинальной модели **[F5-TTS](https://huggingface.co/SWivid/F5-TTS)**, адаптированная для синтеза русской речи. Модель обучалась на 5 000 часах с сочетанием русской и английской речи и поддерживает управление ударением в словах. ## Ключевые особенности * **Ударения**: для изменения ударения поставьте символ `+` перед ударной гласной (`молок+о → молокó`). Для автоматической расстановки ударений можно использовать модель **[RUAccent](https://github.com/Den4ikAI/ruaccent)**. * **Демо**: демо работы модели (F5-TTS_RUSSIAN/F5TTS_v1_Base) и сравнение с XTTS и FishSpeech — ## Обучающие данные (5000+ часов) | Источник | Часов | |--------------------------------------|-------| | Кастомный русский датасет | 4 000 | | Common Voice RU | 239 | | Common Voice EN | 240 | | Sova (RuDevices + RuAudiobooks) | 400 | | LibriHeavy (частично) | 180 | # Доступные модели * F5-TTS_RUSSIAN/F5TTS_v1_Base — первая версия модели, использованная для генерации демо-записей. * F5-TTS_RUSSIAN/F5TTS_v1_Base_accent_tune — дообученная версия с полной разметкой ударений (100% предложений в обучающем датасете). Рекомендуется использовать символы ударения для лучшего качества синтеза. * F5-TTS_RUSSIAN/F5TTS_v1_Base_v2 — дообученная версия (+16 эпох). Добавлена фильтрация данных (удалено ~5% записей с артефактами, soft-clean), с полной разметка ударений в тексте.