Spaces:

vikram-iitm
/

asr-demo

Sleeping

vikram-iitm commited on Jun 10

Commit

dd534ea

1 Parent(s): d3c4c72

Add mic & upload tabs with numpy audio

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,10 +16,8 @@ def init_models():
     from transformers import AutoProcessor, AutoModelForCTC
     from pyctcdecode import build_ctcdecoder
-    processor =
-AutoProcessor.from_pretrained("ai4bharat/indicwav2vec-hindi")
-    model =
-AutoModelForCTC.from_pretrained("ai4bharat/indicwav2vec-hindi")
     vocab = processor.tokenizer.get_vocab()
     sorted_vocab = sorted(vocab.items(), key=lambda kv: kv[1])
@@ -61,8 +59,7 @@ iface = gr.Interface(
     inputs=gr.Audio(type="filepath", label="Upload a WAV file"),
     outputs="text",
     title="Indic ASR Demo (Hindi)",
-    description="Upload a Hindi audio file (.wav) to see the
-transcription."
 )
 if __name__ == "__main__":

     from transformers import AutoProcessor, AutoModelForCTC
     from pyctcdecode import build_ctcdecoder
+    processor = AutoProcessor.from_pretrained("ai4bharat/indicwav2vec-hindi")
+    model = AutoModelForCTC.from_pretrained("ai4bharat/indicwav2vec-hindi")
     vocab = processor.tokenizer.get_vocab()
     sorted_vocab = sorted(vocab.items(), key=lambda kv: kv[1])
     inputs=gr.Audio(type="filepath", label="Upload a WAV file"),
     outputs="text",
     title="Indic ASR Demo (Hindi)",
+    description="Upload a Hindi audio file (.wav) to see the transcription."
 )
 if __name__ == "__main__":