VIZINTZOR commited on
Commit
82e778f
·
verified ·
1 Parent(s): e3cce59

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +34 -0
README.md ADDED
@@ -0,0 +1,34 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - th
4
+ tags:
5
+ - text-to-speech
6
+ - Thai
7
+ ---
8
+ โมเดลนี้ใช้ เสียงที่บันทึกจาก Play.ht : https://play.ht/ เพื่อนำมา finetune model.
9
+
10
+ Finetune โมเดลโค้ด GitHub : https://github.com/VYNCX/finetune-local-vits
11
+
12
+ การใช้งาน :
13
+ ```py
14
+ import torch
15
+ from transformers import VitsTokenizer, VitsModel, set_seed
16
+ import scipy
17
+
18
+ tokenizer = VitsTokenizer.from_pretrained("VIZINTZOR/VIZINTZOR/MMS-TTS-THAI-FEMALEV1",cache_dir="./mms")
19
+ model = VitsModel.from_pretrained("VIZINTZOR/VIZINTZOR/MMS-TTS-THAI-FEMALEV1",cache_dir="./mms")
20
+
21
+ inputs = tokenizer(text="สวัสดีค่ะ นี่คือเสียงพูดภาษาไทย", return_tensors="pt")
22
+
23
+ set_seed(456) # make deterministic
24
+
25
+ with torch.no_grad():
26
+ outputs = model(**inputs)
27
+
28
+ waveform = outputs.waveform[0]
29
+
30
+ # Convert PyTorch tensor to NumPy array
31
+ waveform_array = waveform.numpy()
32
+
33
+ scipy.io.wavfile.write("techno_output.wav", rate=model.config.sampling_rate, data=waveform_array)
34
+ ```