whisper-tiny-fa-puct-combine-5k / README.md

CheeLi03

Upload tokenizer

ac2e3e6 verified 11 months ago

preview code

raw

history blame contribute delete

1.89 kB

metadata

base_model: openai/whisper-tiny
language:
  - fa
library_name: transformers
license: apache-2.0
metrics:
  - wer
tags:
  - hf-asr-leaderboard
  - generated_from_trainer
model-index:
  - name: Whisper Tiny Persian Combine 5k - Chee Li
    results: []

Whisper Tiny Persian Combine 5k - Chee Li

This model is a fine-tuned version of openai/whisper-tiny on the Meta JSON Persian Dataset dataset. It achieves the following results on the evaluation set:

Loss: 0.8506
Wer: 141.9355

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 1e-05
train_batch_size: 16
eval_batch_size: 8
seed: 42
optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
lr_scheduler_warmup_steps: 500
training_steps: 5000
mixed_precision_training: Native AMP

Training results

Training Loss	Epoch	Step	Validation Loss	Wer
2.1197	11.9048	1000	2.1120	124.2566
1.3524	23.8095	2000	1.5111	137.1238
0.7488	35.7143	3000	1.1182	138.0068
0.4132	47.6190	4000	0.9147	145.9182
0.3265	59.5238	5000	0.8506	141.9355

Framework versions

Transformers 4.46.2
Pytorch 2.3.1+cu121
Datasets 2.20.0
Tokenizers 0.20.3