Spaces:

jhj0517
/

Whisper-WebUI

Running

jhj0517 commited on Oct 28, 2024

Commit

eec0c16

1 Parent(s): ddbe0b6

Fix VAD syntax & add vad handling case

Files changed (1) hide show

modules/whisper/base_transcription_pipeline.py CHANGED Viewed

@@ -135,12 +135,17 @@ class BaseTranscriptionPipeline(ABC):
                 speech_pad_ms=vad_params.speech_pad_ms
             )
-            audio, speech_chunks = self.vad.run(
                 audio=audio,
                 vad_parameters=vad_options,
                 progress=progress
             )
         result, elapsed_time = self.transcribe(
             audio,
             progress,
@@ -150,7 +155,7 @@ class BaseTranscriptionPipeline(ABC):
         if vad_params.vad_filter:
             result = self.vad.restore_speech_timestamps(
                 segments=result,
-                speech_chunks=vad_params.speech_chunks,
             )
         if diarization_params.is_diarize:

                 speech_pad_ms=vad_params.speech_pad_ms
             )
+            vad_processed, speech_chunks = self.vad.run(
                 audio=audio,
                 vad_parameters=vad_options,
                 progress=progress
             )
+            if vad_processed.size > 0:
+                audio = vad_processed
+            else:
+                vad_params.vad_filter = False
         result, elapsed_time = self.transcribe(
             audio,
             progress,
         if vad_params.vad_filter:
             result = self.vad.restore_speech_timestamps(
                 segments=result,
+                speech_chunks=speech_chunks,
             )
         if diarization_params.is_diarize: