Adi's training complete!

Browse files

Files changed (5) hide show

README.md +9 -26
model.safetensors +1 -1
runs/Nov06_03-07-38_24b41b0a61e7/events.out.tfevents.1762398469.24b41b0a61e7.358.0 +3 -0
runs/Nov06_03-07-38_24b41b0a61e7/events.out.tfevents.1762398502.24b41b0a61e7.358.1 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [huawei-noah/TinyBERT_General_4L_312D](https://huggingface.co/huawei-noah/TinyBERT_General_4L_312D) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.3865
-- Accuracy: 0.271
 ## Model description
@@ -38,38 +38,21 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.056
-- train_batch_size: 128
-- eval_batch_size: 128
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 20
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 4.2291        | 1.0   | 32   | 3.5369          | 0.249    |
-| 2.2138        | 2.0   | 64   | 2.1160          | 0.262    |
-| 2.3143        | 3.0   | 96   | 1.8886          | 0.262    |
-| 2.6088        | 4.0   | 128  | 2.4046          | 0.262    |
-| 2.8324        | 5.0   | 160  | 2.9637          | 0.249    |
-| 1.6379        | 6.0   | 192  | 1.8444          | 0.271    |
-| 1.8639        | 7.0   | 224  | 1.9289          | 0.218    |
-| 1.8878        | 8.0   | 256  | 1.8120          | 0.271    |
-| 1.8503        | 9.0   | 288  | 1.7120          | 0.262    |
-| 2.3268        | 10.0  | 320  | 1.7966          | 0.271    |
-| 1.5671        | 11.0  | 352  | 1.3987          | 0.271    |
-| 1.6683        | 12.0  | 384  | 1.5892          | 0.218    |
-| 1.4877        | 13.0  | 416  | 1.4932          | 0.262    |
-| 1.8511        | 14.0  | 448  | 1.7354          | 0.218    |
-| 1.5663        | 15.0  | 480  | 1.5564          | 0.262    |
-| 1.5913        | 16.0  | 512  | 1.3891          | 0.271    |
-| 1.5751        | 17.0  | 544  | 1.6062          | 0.271    |
-| 1.5021        | 18.0  | 576  | 1.4647          | 0.249    |
-| 1.3676        | 19.0  | 608  | 1.4898          | 0.262    |
-| 1.4029        | 20.0  | 640  | 1.3865          | 0.271    |
 ### Framework versions

 This model is a fine-tuned version of [huawei-noah/TinyBERT_General_4L_312D](https://huggingface.co/huawei-noah/TinyBERT_General_4L_312D) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8162
+- Accuracy: 0.783
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 32
+- eval_batch_size: 32
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 2
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| 0.9778        | 1.0   | 125  | 0.9455          | 0.751    |
+| 0.8738        | 2.0   | 250  | 0.8162          | 0.783    |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ae9082dd20ea223563e7860c357e5d122a108b6ddc875b25cdc07102edc1ade0
 size 57414312

 version https://git-lfs.github.com/spec/v1
+oid sha256:1f8ec00711a639e70ec024d5fc89b276dcfd008a11313d7952f35a4b3fd1c23e
 size 57414312

runs/Nov06_03-07-38_24b41b0a61e7/events.out.tfevents.1762398469.24b41b0a61e7.358.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f40fe8125d5908e63ac2ac5ba2b7a6c60de4dc163a9f1a506513deb6d3131e59
+size 32367

runs/Nov06_03-07-38_24b41b0a61e7/events.out.tfevents.1762398502.24b41b0a61e7.358.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ce86142468398dd57ddebf3a7e83f56bdc87831c3b3f9ab3cabf3be09ef5553
+size 411

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c9ba6c101e519aa606087e46c9e614e52562ca02addaa8176d649cf6a8de078
 size 5905

 version https://git-lfs.github.com/spec/v1
+oid sha256:a800f829b25adbe4dedfecc020103c80140a87d8143aa3ecf28f5aba1259ab75
 size 5905