End of training

Files changed (7) hide show

README.md CHANGED Viewed

@@ -33,15 +33,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0005
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
-- total_train_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 1000
-- num_epochs: 100
 ### Training results
@@ -49,7 +49,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.34.1
 - Pytorch 2.1.0+cu118
-- Datasets 2.14.6
-- Tokenizers 0.14.1

 The following hyperparameters were used during training:
 - learning_rate: 0.0005
+- train_batch_size: 4
+- eval_batch_size: 4
 - seed: 42
 - gradient_accumulation_steps: 8
+- total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 1000
+- num_epochs: 200
 ### Training results
 ### Framework versions
+- Transformers 4.35.2
 - Pytorch 2.1.0+cu118
+- Datasets 2.15.0
+- Tokenizers 0.15.0

config.json CHANGED Viewed

@@ -35,7 +35,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.34.1",
   "use_cache": true,
   "vocab_size": 50257
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
   "use_cache": true,
   "vocab_size": 50257
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.34.1"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.35.2"
 }

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:61c56a0d3a30c572301c772101743211590cb116ec861f3807757b8d46a01473
+size 1419322880

runs/Nov21_05-14-36_a6bc864b532e/events.out.tfevents.1700543681.a6bc864b532e.7575.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b49e1c60285e9b16f57144b6570994f4a6cb193306245602c8753d7b9d08894c
+size 4184

runs/Nov21_05-16-52_a6bc864b532e/events.out.tfevents.1700543819.a6bc864b532e.8264.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:349b646c198c46fabdc5874050c8afbdc55a71a66a0db11c67893e6ef6f312f5
+size 4871

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbe4f1bcbc1fde4b077080b5a448277bd4049d2a83d9a65e1a2bc57011d38601
-size 4536

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d10d3a5851a2aab0bbaee0dd921c94ef501c50d21226274d33a6970462c3dc6
+size 4600