Shakhovak
/

llama-7b-absa-MT-laptops

Generated from Trainer

Model card Files Files and versions Community

Shakhovak commited on Apr 22, 2024

Commit

7049a80

verified ·

1 Parent(s): 4561f5a

End of training

Browse files

Files changed (3) hide show

README.md +35 -25
adapter_model.bin +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ license: other
 base_model: baffo32/decapoda-research-llama-7B-hf
 tags:
 - generated_from_trainer
 model-index:
 - name: llama-7b-absa-MT-laptops
   results: []
@@ -13,9 +15,9 @@ should probably proofread and complete it, then remove this comment. -->
 # llama-7b-absa-MT-laptops
-This model is a fine-tuned version of [baffo32/decapoda-research-llama-7B-hf](https://huggingface.co/baffo32/decapoda-research-llama-7B-hf) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0026
 ## Model description
@@ -43,35 +45,43 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
-- training_steps: 900
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.0877        | 0.13  | 40   | 0.0277          |
-| 0.0225        | 0.25  | 80   | 0.0218          |
-| 0.0179        | 0.38  | 120  | 0.0170          |
-| 0.0165        | 0.51  | 160  | 0.0140          |
-| 0.0126        | 0.63  | 200  | 0.0121          |
-| 0.0295        | 0.76  | 240  | 0.0132          |
-| 0.0122        | 0.89  | 280  | 0.0107          |
-| 0.0096        | 1.01  | 320  | 0.0094          |
-| 0.0063        | 1.14  | 360  | 0.0087          |
-| 0.0055        | 1.26  | 400  | 0.0081          |
-| 0.0051        | 1.39  | 440  | 0.0073          |
-| 0.0045        | 1.52  | 480  | 0.0071          |
-| 0.0035        | 1.64  | 520  | 0.0060          |
-| 0.0034        | 1.77  | 560  | 0.0055          |
-| 0.0041        | 1.9   | 600  | 0.0041          |
-| 0.0028        | 2.02  | 640  | 0.0038          |
-| 0.0015        | 2.15  | 680  | 0.0033          |
-| 0.0014        | 2.28  | 720  | 0.0037          |
-| 0.0008        | 2.4   | 760  | 0.0038          |
-| 0.0014        | 2.53  | 800  | 0.0031          |
-| 0.0005        | 2.66  | 840  | 0.0027          |
-| 0.0008        | 2.78  | 880  | 0.0026          |
 ### Framework versions

 base_model: baffo32/decapoda-research-llama-7B-hf
 tags:
 - generated_from_trainer
+datasets:
+- sem_eval2014_task4
 model-index:
 - name: llama-7b-absa-MT-laptops
   results: []
 # llama-7b-absa-MT-laptops
+This model is a fine-tuned version of [baffo32/decapoda-research-llama-7B-hf](https://huggingface.co/baffo32/decapoda-research-llama-7B-hf) on the sem_eval2014_task4 dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0007
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
+- training_steps: 1200
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.0877        | 0.13  | 40   | 0.0245          |
+| 0.0223        | 0.25  | 80   | 0.0205          |
+| 0.0202        | 0.38  | 120  | 0.0159          |
+| 0.0585        | 0.51  | 160  | 0.0139          |
+| 0.014         | 0.63  | 200  | 0.0116          |
+| 0.0112        | 0.76  | 240  | 0.0106          |
+| 0.0113        | 0.89  | 280  | 0.0086          |
+| 0.0094        | 1.01  | 320  | 0.0086          |
+| 0.0065        | 1.14  | 360  | 0.0088          |
+| 0.0057        | 1.26  | 400  | 0.0061          |
+| 0.005         | 1.39  | 440  | 0.0060          |
+| 0.0059        | 1.52  | 480  | 0.0051          |
+| 0.0047        | 1.64  | 520  | 0.0065          |
+| 0.0046        | 1.77  | 560  | 0.0041          |
+| 0.0035        | 1.9   | 600  | 0.0039          |
+| 0.0032        | 2.02  | 640  | 0.0033          |
+| 0.0015        | 2.15  | 680  | 0.0038          |
+| 0.002         | 2.28  | 720  | 0.0027          |
+| 0.0016        | 2.4   | 760  | 0.0023          |
+| 0.0014        | 2.53  | 800  | 0.0020          |
+| 0.0011        | 2.66  | 840  | 0.0019          |
+| 0.001         | 2.78  | 880  | 0.0018          |
+| 0.001         | 2.91  | 920  | 0.0015          |
+| 0.0007        | 3.04  | 960  | 0.0012          |
+| 0.0005        | 3.16  | 1000 | 0.0010          |
+| 0.0003        | 3.29  | 1040 | 0.0009          |
+| 0.0003        | 3.42  | 1080 | 0.0007          |
+| 0.0003        | 3.54  | 1120 | 0.0007          |
+| 0.0002        | 3.67  | 1160 | 0.0007          |
+| 0.0002        | 3.79  | 1200 | 0.0007          |
 ### Framework versions

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfd04b63a96651a736d4605449b427cf49c4a675b5b8de2a6d2af411bd08bb3c
 size 268528394

 version https://git-lfs.github.com/spec/v1
+oid sha256:b52a659dd565a166ac60c88a7ecd3887dac2b0c6c43756016d36b687f3677450
 size 268528394

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6109ca14d2480797b4e04b72c744c00dcf4636e01e4a1a8d2be6e4ce6a1e80f
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:c53e9219f7e885b728dfc74d40a7b7bf464d27519dc63db1b220c1b0ad29ebf0
 size 4984