speech-to-speech-translation

Sleeping

GatinhoEducado commited on Nov 24, 2024

Commit

cded203

verified ·

1 Parent(s): 13f8a3e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,6 +13,8 @@ asr_pipe = pipeline(
     "automatic-speech-recognition",
     model="GatinhoEducado/whisper-tiny-finetuned-minds14",
     device=device,
     tokenizer = tokenizer,
     generate_kwargs = {"language":"<|pt|>",
                      "task": "transcribe",
@@ -32,7 +34,7 @@ speaker_embeddings = torch.tensor(embeddings_dataset[7306]["xvector"]).unsqueeze
 def translate(audio):
     #outputs = asr_pipe(audio, max_new_tokens=256, generate_kwargs={"task": "translate"})
-    outputs = asr_pipe(audio, max_new_tokens=100)
     return outputs["text"]

     "automatic-speech-recognition",
     model="GatinhoEducado/whisper-tiny-finetuned-minds14",
     device=device,
+    max_new_tokens=60,
+    chunk_length_s=0,
     tokenizer = tokenizer,
     generate_kwargs = {"language":"<|pt|>",
                      "task": "transcribe",
 def translate(audio):
     #outputs = asr_pipe(audio, max_new_tokens=256, generate_kwargs={"task": "translate"})
+    outputs = asr_pipe(audio, max_new_tokens=256)
     return outputs["text"]