update readme

Files changed (7) hide show

examples/ex_1/gen_chuvash_1.wav +3 -0
examples/ex_1/promt.wav +3 -0
examples/ex_2/gen.wav +3 -0
examples/ex_2/ref.mp3 +3 -0
examples/ex_3/gen.wav +3 -0
examples/ex_3/ref.mp3 +3 -0
readme.md +51 -0

examples/ex_1/gen_chuvash_1.wav ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf9c4364112e4b67609f419e6c70580afb4c20201b6af5436f484311287a039b
+size 328236

examples/ex_1/promt.wav ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f06a4c0da80032c48790358cc6448f4375584693bf21308b1708d0b6dff5fe60
+size 714464

examples/ex_2/gen.wav ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dc8fad6b7951b921c78685dc36f78744def191f6b3689d7b281797dba8c61104
+size 325676

examples/ex_2/ref.mp3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a991b934c53232b51ac3b5bbc65cba62bb92bf927a8647b93d6b1b06816e53e2
+size 59948

examples/ex_3/gen.wav ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:80b9f5e30c6d222e90d6113d91c0e17abf17e54deb275257a60d9c79c5971fcc
+size 220204

examples/ex_3/ref.mp3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:682532a656ca5e0e8e63b0beae85c1570ecd8ea442735fec71ce5eb88c2a132f
+size 85868

readme.md ADDED Viewed

	@@ -0,0 +1,51 @@

+---
+license: cc-by-nc-4.0
+tags:
+- tts
+- chuvash
+- russian
+- fine-tuned
+- f5-tts
+- voice-clone
+- low-resource
+language:
+- chuvash
+base_model:
+- Misha24-10/F5-TTS_CHUVASH
+pipeline_tag: text-to-speech
+---
+# F5-TTS_CHUVASH
+Эксперимент по дообучению модели F5-TTS для чувашского языка, основанный на предварительно обученной русскоязычной модели **[F5-TTS](https://huggingface.co/Misha24-10/F5-TTS_RUSSIAN)**.
+## О проекте
+Данный эксперимент был проведен для проверки возможности дообучения моделей F5-TTS на малоресурсных языке. Для дообучения был выбран чувашский язык, который имеет похожую фонетическую структуру с русским языком.
+## Методология
+- В токенайзер были добавлены специфические символы чувашского алфавита: «ҫ», «ĕ», «ӑ», «ӳ», «ӗ», «Ÿ»
+- Для обучения использован набор данных Common Voice на чувашском языке (все файлы из validated.tsv)
+- Датасет был дополнительно обработан для унификации представления чувашских символов:
+  ```python
+  text.replace('ӱ', 'ӳ').replace('ÿ', 'ӳ').replace('ӗ', 'ĕ')
+  ```
+- Проведена фильтрация аудиофайлов по длительности (0.3-30 секунд)
+- Итоговый объем данных для обучения - 24.2 часа аудио
+## Результаты
+Эксперимент показал возможность успешного дообучения модели на близкородственном языке даже с ограниченным объемом данных (25 часов). Модель частично освоила задачу клонирования голоса на чувашском языке.
+**Примечание**: Для тестирования использовался чекпоинт без загрузки EMA весов, так как 40 000 итераций оказалось недостаточно для cходимотси  EMA весов, необходимо большее количество итераций обучения.
+## Примеры сгенерированной речи
+В таблице ниже представлены некоторые примеры генерации речи на чувашском языке без загрузки EMA весов:
+| Текст для генерации | Prompt | Generation |
+|---------------------|--------|------------|
+| ҫапла хӑтланнишӗн парламент ертӳҫисем «Тӗрӗслӗхшӗн Раҫҫей» парти пайташне депутат этикине пӑснишӗн ӳпкеленӗ теҫҫӗ. | <audio controls src="examples/ex_1/promt.wav"></audio> | <audio controls src="examples/ex_1/gen_chuvash_1.wav"></audio> |
+| «Чӑваш Ен» кӑларӑм валли Ирина Николаева, Наталья Егорова, Алиса Александрова, Михаил Солин. | <audio controls src="examples/ex_2/ref.mp3"></audio> | <audio controls src="examples/ex_2/gen.wav"></audio> |
+| Ку вӗрентӳре ҫапла, чӑн пурнӑҫра вара штраф ҫын пурнӑҫӗпе танлашать. | <audio controls src="examples/ex_3/ref.mp3"></audio> | <audio controls src="examples/ex_3/gen.wav"></audio> |