Model save

Files changed (4) hide show

README.md CHANGED Viewed

@@ -38,9 +38,10 @@ The following hyperparameters were used during training:
 - eval_batch_size: 1
 - seed: 42
 - distributed_type: multi-GPU
-- num_devices: 4
-- total_train_batch_size: 4
-- total_eval_batch_size: 4
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.05

 - eval_batch_size: 1
 - seed: 42
 - distributed_type: multi-GPU
+- num_devices: 2
+- gradient_accumulation_steps: 16
+- total_train_batch_size: 32
+- total_eval_batch_size: 2
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.05

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:33b7c74b0d70dfad5465d73eb31e8c0ec19eda8dbd7e21d78de83e13af84fa35
 size 1204780872

 version https://git-lfs.github.com/spec/v1
+oid sha256:05869f2a4c856eaaac3380f22816e635116d1048eb686df5380a47578c684782
 size 1204780872

train.log CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8999c98f10599d2fa516604d703482d136eae950e3c6c9e4fcb9249240bc7a61
 size 7544

 version https://git-lfs.github.com/spec/v1
+oid sha256:d8bea4b6855a51dc80f1ba22d86c24e3c6fa84e8ce043dc5c76b00cc099a20bc
 size 7544