techiaith
/

whisper-large-v3-ft-verbatim-cy-en

Automatic Speech Recognition

Generated from Trainer

Model card Files Files and versions Metrics Training metrics

DewiBrynJones commited on Mar 24

Commit

b8ac8c5

·

verified ·

1 Parent(s): d4dda56

Update README.md

Files changed (1) hide show

README.md +13 -8

README.md CHANGED Viewed

@@ -12,23 +12,28 @@ model-index:
 datasets:
 - techiaith/banc-trawsgrifiadau-bangor
 - techiaith/commonvoice_18_0_cy
 language:
 - cy
 pipeline_tag: automatic-speech-recognition
 ---
-# whisper-large-v3-ft-btb-cv-cy
 This model is a version of [openai/whisper-large-v3](https://huggingface.co/openai/whisper-large-v3) finedtuned with
-transcriptions of Welsh language spontaneous speech [Banc Trawsgrifiadau Bangor (btb)](https://huggingface.co/datasets/techiaith/banc-trawsgrifiadau-bangor)
-ac well as recordings of read speach from [Welsh Common Voice version 18 (cv)](https://huggingface.co/datasets/techiaith/commonvoice_18_0_cy)
-for additional training.
-As such this model is suitable for more verbatim transcribing of spontaneous or unplanned speech.
-It achieves the following results on the [Banc Trawsgrifiadau Bangor'r test set](https://huggingface.co/datasets/techiaith/banc-trawsgrifiadau-bangor/viewer/default/test)
-- WER: 29.72
-- CER: 11.01
 ## Usage

 datasets:
 - techiaith/banc-trawsgrifiadau-bangor
 - techiaith/commonvoice_18_0_cy
+- techiaith/commonvoice_vad_cy
+- cymen-arfor/lleisiau-arfor
 language:
 - cy
+- en
 pipeline_tag: automatic-speech-recognition
 ---
+# whisper-large-v3-ft-verbatim-cy-en
 This model is a version of [openai/whisper-large-v3](https://huggingface.co/openai/whisper-large-v3) finedtuned with
+transcriptions of Welsh language spontaneous speech from
+[Banc Trawsgrifiadau Bangor (btb)](https://huggingface.co/datasets/techiaith/banc-trawsgrifiadau-bangor) and
+[Lleisiau Arfor](https://huggingface.co/datasets/cymen-arfor/lleisiau-arfor) as well as recordings of read speech
+from [Welsh Common Voice version 18 (cv)](https://huggingface.co/datasets/techiaith/commonvoice_18_0_cy) and
+[Welsh Common Voice Vad Segments](https://huggingface.co/datasets/techiaith/commonvoice_vad_cy) for additional training.
+As such this model is suitable for more verbatim transcribing of spontaneous or unplanned speech. It achieves the
+following results on the [Banc Trawsgrifiadau Bangor'r test set](https://huggingface.co/datasets/techiaith/banc-trawsgrifiadau-bangor/viewer/default/test)
+- WER: 28.99
+- CER: 10.27
 ## Usage