End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ license: apache-2.0
 base_model: distilbert-base-uncased
 tags:
 - generated_from_trainer
 model-index:
 - name: distilbert-base-uncased-finetuned-voxi-mnli
   results: []
@@ -14,6 +16,9 @@ should probably proofread and complete it, then remove this comment. -->
 # distilbert-base-uncased-finetuned-voxi-mnli
 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on the None dataset.
 ## Model description
@@ -33,13 +38,13 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 32
-- eval_batch_size: 32
 - seed: 42
 - distributed_type: multi-GPU
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 - mixed_precision_training: Native AMP
 ### Training results
@@ -48,7 +53,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.40.2
-- Pytorch 2.3.0+cu121
 - Datasets 2.19.1
 - Tokenizers 0.19.0

 base_model: distilbert-base-uncased
 tags:
 - generated_from_trainer
+metrics:
+- accuracy
 model-index:
 - name: distilbert-base-uncased-finetuned-voxi-mnli
   results: []
 # distilbert-base-uncased-finetuned-voxi-mnli
 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.7452
+- Accuracy: 0.8208
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 64
+- eval_batch_size: 64
 - seed: 42
 - distributed_type: multi-GPU
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 5
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- Transformers 4.41.2
+- Pytorch 2.3.1+cu121
 - Datasets 2.19.1
 - Tokenizers 0.19.0

config.json CHANGED Viewed

@@ -30,6 +30,6 @@
   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.40.2",
   "vocab_size": 30522
 }

   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.41.2",
   "vocab_size": 30522
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec9a8b99653a918ce6a8870b234b6d826a60d004e6119df172538e78b6114e25
 size 267835644

 version https://git-lfs.github.com/spec/v1
+oid sha256:55a2fb8be0fe7e328e73d71f4e3d8d30519151fb36c021f7cf06faee2e04133a
 size 267835644

runs/Sep24_16-38-49_0923-144205-8hd988vk-10-139-64-5/events.out.tfevents.1727195948.0923-144205-8hd988vk-10-139-64-5.1875.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0f2d5130d4d4d46d44f452fadf88c0ff5edd5d6680f38f32a688b7c4179272ff
+size 18302

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5583c85056fbd4370386ae8afb978e3e246b4c570ad4b94235b59c289e207667
-size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:8fd8def01c83c31a3e3a648ffefd3f97f16a1e8e89e8af9349e6312a5b338879
+size 5240