Training complete

Browse files

Files changed (4) hide show

README.md +72 -0
generation_config.json +6 -0
runs/Jun24_08-27-34_13a782d7de9d/events.out.tfevents.1750753673.13a782d7de9d.730.0 +2 -2
runs/Jun24_08-27-34_13a782d7de9d/events.out.tfevents.1750755137.13a782d7de9d.730.1 +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,72 @@

+---
+library_name: transformers
+license: apache-2.0
+base_model: google/mt5-small
+tags:
+- summarization
+- generated_from_trainer
+metrics:
+- rouge
+model-index:
+- name: mt5-small-finetuned-amazon-en-es
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# mt5-small-finetuned-amazon-en-es
+This model is a fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 3.0317
+- Rouge1: 17.2998
+- Rouge2: 8.514
+- Rougel: 16.7839
+- Rougelsum: 16.7295
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5.6e-05
+- train_batch_size: 8
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
+- lr_scheduler_type: linear
+- num_epochs: 8
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2 | Rougel  | Rougelsum |
+|:-------------:|:-----:|:----:|:---------------:|:-------:|:------:|:-------:|:---------:|
+| 7.1025        | 1.0   | 1209 | 3.3149          | 14.7066 | 5.6469 | 14.2918 | 14.2422   |
+| 3.9339        | 2.0   | 2418 | 3.1875          | 14.9552 | 7.4879 | 14.6933 | 14.7511   |
+| 3.6066        | 3.0   | 3627 | 3.1181          | 16.5524 | 8.1899 | 15.8521 | 15.9021   |
+| 3.4249        | 4.0   | 4836 | 3.0716          | 17.8867 | 9.6131 | 17.3769 | 17.2952   |
+| 3.3141        | 5.0   | 6045 | 3.0495          | 16.3503 | 8.0257 | 16.0782 | 15.9745   |
+| 3.2545        | 6.0   | 7254 | 3.0398          | 17.4253 | 8.6171 | 16.9486 | 16.9007   |
+| 3.2059        | 7.0   | 8463 | 3.0272          | 17.4573 | 8.4029 | 17.0702 | 17.0073   |
+| 3.1763        | 8.0   | 9672 | 3.0317          | 17.2998 | 8.514  | 16.7839 | 16.7295   |
+### Framework versions
+- Transformers 4.52.4
+- Pytorch 2.6.0+cu124
+- Datasets 3.6.0
+- Tokenizers 0.21.1

generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "decoder_start_token_id": 0,
+  "eos_token_id": 1,
+  "pad_token_id": 0,
+  "transformers_version": "4.52.4"
+}

runs/Jun24_08-27-34_13a782d7de9d/events.out.tfevents.1750753673.13a782d7de9d.730.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b7d7ba75ee905c4f7c113fb2fc92a9c34e25d09a9f61907ee9b4e7ed8b555a33
-size 10256

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4450db395a167b2fea333d6400668f60072f156ae4d85c88b8bb858f317f6fa
+size 11084

runs/Jun24_08-27-34_13a782d7de9d/events.out.tfevents.1750755137.13a782d7de9d.730.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b66511737b756ef94b4a61ba5ae86b00c4a65f37a1065ee10f6a25fd3fde223
+size 562