End of training

Browse files

Files changed (3) hide show

README.md +16 -17
adapter_model.safetensors +1 -1
runs/Apr15_03-58-21_interns/events.out.tfevents.1744689547.interns +2 -2

README.md CHANGED Viewed

@@ -2,25 +2,25 @@
 library_name: peft
 language:
 - uz
-license: apache-2.0
-base_model: mustafoyev202/whisper-uz
 tags:
 - generated_from_trainer
 datasets:
 - mozilla-foundation/common_voice_17_0
 model-index:
-- name: Whisper Medium Uzbek
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-# Whisper Medium Uzbek
-This model is a fine-tuned version of [mustafoyev202/whisper-uz](https://huggingface.co/mustafoyev202/whisper-uz) on the Common Voice 17.0 dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7319
 ## Model description
@@ -40,30 +40,29 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 2
-- total_train_batch_size: 16
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
 - training_steps: 2000
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss |
-|:-------------:|:-----:|:----:|:---------------:|
-| 0.7933        | 0.8   | 500  | 0.9289          |
-| 0.678         | 1.6   | 1000 | 0.8336          |
-| 0.6008        | 2.4   | 1500 | 0.7544          |
-| 0.6056        | 3.2   | 2000 | 0.7319          |
 ### Framework versions
 - PEFT 0.15.2.dev0
-- Transformers 4.51.0.dev0
 - Pytorch 2.6.0+cu124
 - Datasets 3.5.0
 - Tokenizers 0.21.1

 library_name: peft
 language:
 - uz
+license: mit
+base_model: openai/whisper-large-v2
 tags:
 - generated_from_trainer
 datasets:
 - mozilla-foundation/common_voice_17_0
 model-index:
+- name: Uzbek STT
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+# Uzbek STT
+This model is a fine-tuned version of [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) on the Common Voice 17.0 dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.1178
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
 - training_steps: 2000
+- mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss |
+|:-------------:|:------:|:----:|:---------------:|
+| 2.323         | 0.1650 | 500  | 2.0135          |
+| 1.4141        | 0.3300 | 1000 | 1.2143          |
+| 1.2739        | 0.4950 | 1500 | 1.1382          |
+| 1.3098        | 0.6601 | 2000 | 1.1178          |
 ### Framework versions
 - PEFT 0.15.2.dev0
+- Transformers 4.52.0.dev0
 - Pytorch 2.6.0+cu124
 - Datasets 3.5.0
 - Tokenizers 0.21.1

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5923a8b4358638c0ad3a8244e88ae76908b743533ebf2c860c26251890f60c45
 size 62969640

 version https://git-lfs.github.com/spec/v1
+oid sha256:1db55124b254e4a06974b1bbf0ebb8977889f81099abcc13895810ad7aa871b6
 size 62969640

runs/Apr15_03-58-21_interns/events.out.tfevents.1744689547.interns CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cd11be6dd3af10f26bf4154a720c9ca2df363e7772e07b97782e8ed2926a0be8
-size 15863

 version https://git-lfs.github.com/spec/v1
+oid sha256:2be3da875ee836f94c708c06c04196e9e166df5746b4a9678c286271370540d2
+size 25470