La1ya
/

english-hindi-colloquial-translator

Text2Text Generation

Generated from Trainer

Model card Files Files and versions Community

La1ya commited on Feb 20

Commit

13d770a

·

verified ·

1 Parent(s): f0bfcac

Model save

Files changed (3) hide show

README.md +19 -8
generation_config.json +1 -1
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -15,6 +15,8 @@ should probably proofread and complete it, then remove this comment. -->
 # english-hindi-colloquial-translator
 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-hi](https://huggingface.co/Helsinki-NLP/opus-mt-en-hi) on the None dataset.
 ## Model description
@@ -33,23 +35,32 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0005
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
-- optimizer: Use OptimizerNames.ADAMW_BNB with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 10
-- num_epochs: 3
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
-- Transformers 4.48.3
 - Pytorch 2.6.0+cu124
-- Datasets 3.3.1
 - Tokenizers 0.21.0

 # english-hindi-colloquial-translator
 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-hi](https://huggingface.co/Helsinki-NLP/opus-mt-en-hi) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.6868
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0003
+- train_batch_size: 4
+- eval_batch_size: 4
 - seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 8
+- optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 2
+- num_epochs: 10
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 17.5249       | 2.0   | 2    | 9.0542          |
+| 17.3367       | 4.0   | 4    | 9.0542          |
+| 9.4521        | 6.0   | 6    | 3.3342          |
+| 5.0478        | 8.0   | 8    | 2.1933          |
+| 3.1079        | 10.0  | 10   | 1.6868          |
 ### Framework versions
+- Transformers 4.47.1
 - Pytorch 2.6.0+cu124
+- Datasets 3.3.2
 - Tokenizers 0.21.0

generation_config.json CHANGED Viewed

@@ -12,5 +12,5 @@
   "num_beams": 4,
   "pad_token_id": 61949,
   "renormalize_logits": true,
-  "transformers_version": "4.48.3"
 }

   "num_beams": 4,
   "pad_token_id": 61949,
   "renormalize_logits": true,
+  "transformers_version": "4.47.1"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:35d6b11291116179fcff0594f5f49a6c5e3071949b54c18cdca56a6d28e42ca7
 size 303704440

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ca68bff28c4e1093f35e86dc85f80da84ca4fd4cd33cb7944ad70323851cc18
 size 303704440