alakxender
/

mms-tts-div-finetuned-md-m02

Model card Files Files and versions

alakxender commited on Jun 12

Commit

1685a68

·

verified ·

1 Parent(s): 27eca39

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -11,11 +11,11 @@ base_model:
 - facebook/mms-tts-div
 ---
-# 🎙️ Divehi TTS – Male Voice (VITS-based)
 This is a fine-tuned VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) model for Divehi speech synthesis. The model produces Male voice audio from Thaana-scripted Divehi text. Fine-tuned from Meta’s MMS-TTS architecture using a curated dataset of synthetic Divehi speech.
-## 🧠 Model Details
 | Field                 | Value                                           |
 |----------------------|-------------------------------------------------|
@@ -28,7 +28,7 @@ This is a fine-tuned VITS (Variational Inference with adversarial learning for e
 | **Inference Engine** | Transformers (🤗 Hugging Face)                  |
-## 🚀 Usage
 ```python
 from transformers import VitsModel, VitsTokenizer
@@ -44,7 +44,7 @@ waveform = model.generate(**inputs).waveform[0]
 torchaudio.save("output.wav", waveform.unsqueeze(0), 16000)
 ```
-## 📊 Evaluation Summary
 - **Model**: `alakxender/mms-tts-div-finetuned-md-m02`
 - **Evaluated Samples**: 3
@@ -64,7 +64,7 @@ torchaudio.save("output.wav", waveform.unsqueeze(0), 16000)
   - 📄 Report: `outputs/report.txt`
   - 📈 MOS Scores: `outputs/mos_scores.txt`
-## 🙏 Acknowledgements
 - [Meta MMS-TTS](https://github.com/facebookresearch/fairseq/tree/main/examples/mms)
 - [Tarepan's SpeechMOS](https://github.com/Tarepan/SpeechMOS)

 - facebook/mms-tts-div
 ---
+# Divehi TTS – Male Voice (VITS-based)
 This is a fine-tuned VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) model for Divehi speech synthesis. The model produces Male voice audio from Thaana-scripted Divehi text. Fine-tuned from Meta’s MMS-TTS architecture using a curated dataset of synthetic Divehi speech.
+## Model Details
 | Field                 | Value                                           |
 |----------------------|-------------------------------------------------|
 | **Inference Engine** | Transformers (🤗 Hugging Face)                  |
+## Usage
 ```python
 from transformers import VitsModel, VitsTokenizer
 torchaudio.save("output.wav", waveform.unsqueeze(0), 16000)
 ```
+## Evaluation Summary
 - **Model**: `alakxender/mms-tts-div-finetuned-md-m02`
 - **Evaluated Samples**: 3
   - 📄 Report: `outputs/report.txt`
   - 📈 MOS Scores: `outputs/mos_scores.txt`
+## Acknowledgements
 - [Meta MMS-TTS](https://github.com/facebookresearch/fairseq/tree/main/examples/mms)
 - [Tarepan's SpeechMOS](https://github.com/Tarepan/SpeechMOS)