maskgct

Paused

cocktailpeanut commited on Oct 25, 2024

Commit

f2cbc32

1 Parent(s): 6ec52a1

update

Files changed (2) hide show

app.py CHANGED Viewed

@@ -19,10 +19,13 @@ from models.tts.maskgct.g2p.g2p_generation import g2p, chn_eng_g2p
 from transformers import SeamlessM4TFeatureExtractor
 import py3langid as langid
 processor = SeamlessM4TFeatureExtractor.from_pretrained("facebook/w2v-bert-2.0")
-device = torch.device("cuda" if torch.cuda.is_available() else "CPU")
 whisper_model = None
 output_file_name_idx = 0
@@ -356,7 +359,7 @@ def maskgct_inference(
     return recovered_audio
-@spaces.GPU
 def inference(
     prompt_wav,
     target_text,

 from transformers import SeamlessM4TFeatureExtractor
 import py3langid as langid
+import devicetorch
 processor = SeamlessM4TFeatureExtractor.from_pretrained("facebook/w2v-bert-2.0")
+DEVICE_NAME = devicetorch.get(torch)
+device = torch.device(DEVICE_NAME)
+#device = torch.device("cuda" if torch.cuda.is_available() else "CPU")
 whisper_model = None
 output_file_name_idx = 0
     return recovered_audio
+#@spaces.GPU
 def inference(
     prompt_wav,
     target_text,

requirements.txt CHANGED Viewed

@@ -5,7 +5,7 @@ ruamel.yaml
 tqdm
 tensorboard
 tensorboardX
-torch==2.0.1
 transformers===4.41.1
 encodec
 black==24.1.1
@@ -30,4 +30,6 @@ LangSegment
 onnxruntime
 pyopenjtalk
 pykakasi
-openai-whisper

 tqdm
 tensorboard
 tensorboardX
+#torch==2.0.1
 transformers===4.41.1
 encodec
 black==24.1.1
 onnxruntime
 pyopenjtalk
 pykakasi
+openai-whisper
+devicetorch
+gradio