Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -38,15 +38,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 3
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 6
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- num_epochs: 3
 ### Training results

 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 10
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 20
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 15
 ### Training results

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb324d946f36508b3201842b514b6b7cbdb425a42cb1c271597785389cbd948e
 size 671106704

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c29bd177d9bbf5d3eb3d7fb13c69f420a639ae8ddca9a4e83556dfb7cce761c
 size 671106704

runs/Oct08_14-11-59_527893ef3caa/events.out.tfevents.1728396734.527893ef3caa.2069.2 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:91ddaabc45d86ef74fb034c27821f094c69805a9e417fa7e91b6bff9fb612997
-size 7279

 version https://git-lfs.github.com/spec/v1
+oid sha256:f26a641bfad3db01b1907f306ac35a1951c58728464746dec3fe53771d2a6929
+size 7935