Spaces:

openpecha
/

STT_Garchen_Rinpche_Demo

Runtime error

App Files Files

xet

Community

ganga4364 commited on 11 days ago

Commit

d0ee919

verified ·

1 Parent(s): 010db8e

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -8

app.py CHANGED Viewed

@@ -273,18 +273,38 @@ def process_audio(model_choice, mode, voice_print_path, audio_path, speaker_name
         if diarization_pipeline is None:
             return "Pyannote diarization is not available.", None, None
         diarization = diarization_pipeline({"waveform": waveform, "sample_rate": sample_rate})
-        data = []
-        # Handle both pyannote APIs
-        if hasattr(diarization, "itertracks"):
-            for turn, _, speaker in diarization.itertracks(yield_label=True):
-                data.append({"start": turn.start, "end": turn.end, "speaker": speaker})
         else:
-            for segment in diarization.iter_segments():
-                speaker = diarization.label(segment)
-                data.append({"start": segment.start, "end": segment.end, "speaker": speaker})
         diarization_df = pd.DataFrame(data)
         # Identify target speaker

         if diarization_pipeline is None:
             return "Pyannote diarization is not available.", None, None
         diarization = diarization_pipeline({"waveform": waveform, "sample_rate": sample_rate})
+        # Run diarization - pass audio file path directly for better compatibility
+        #diarization = diarization_pipeline(audio_path)
+        # Correct API for pyannote 3.1+ with DiarizeOutput
+        data = []
+        # Check if we have the new API (DiarizeOutput with speaker_diarization attribute)
+        if hasattr(diarization, 'speaker_diarization'):
+            # New API (pyannote 3.1+) - iterate over speaker_diarization
+            for turn, speaker in diarization.speaker_diarization:
+                data.append({
+                    "start": turn.start,
+                    "end": turn.end,
+                    "speaker": speaker
+                })
+        elif hasattr(diarization, 'itertracks'):
+            # Old API (pyannote < 3.1) - Annotation object
+            for segment, track, speaker in diarization.itertracks(yield_label=True):
+                data.append({
+                    "start": segment.start,
+                    "end": segment.end,
+                    "speaker": speaker
+                })
         else:
+            return "Unsupported pyannote.audio version. Please check the diarization output format.", None, None
+        if not data:
+            return "No speaker segments found in diarization.", None, None
         diarization_df = pd.DataFrame(data)
         # Identify target speaker