Training in progress, epoch 1

Browse files

Files changed (15) hide show

model.safetensors +1 -1
run-1/checkpoint-113/model.safetensors +1 -1
run-1/checkpoint-113/optimizer.pt +1 -1
run-1/checkpoint-113/rng_state.pth +2 -2
run-1/checkpoint-113/scheduler.pt +1 -1
run-1/checkpoint-113/trainer_state.json +11 -11
run-1/checkpoint-113/training_args.bin +1 -1
run-1/checkpoint-226/model.safetensors +1 -1
run-1/checkpoint-226/optimizer.pt +1 -1
run-1/checkpoint-226/rng_state.pth +2 -2
run-1/checkpoint-226/scheduler.pt +1 -1
run-1/checkpoint-226/trainer_state.json +17 -17
run-1/checkpoint-226/training_args.bin +1 -1
runs/Aug01_13-47-28_1d376fbba8fb/events.out.tfevents.1722520214.1d376fbba8fb.194.5 +3 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f4d143b5f97e100392dff4ff2aecad133b5b40858872418dd3d5f7892a4635b
 size 433270768

 version https://git-lfs.github.com/spec/v1
+oid sha256:721dbbf13b18d4e97562e05bbf7bb36ff3966e4e8c36d1e9836f616c17b7a6e0
 size 433270768

run-1/checkpoint-113/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f2b492a33229cc295e578f8876cfcb94b1b9407e722e41bb5f4a1741f37afe0
 size 433270768

 version https://git-lfs.github.com/spec/v1
+oid sha256:721dbbf13b18d4e97562e05bbf7bb36ff3966e4e8c36d1e9836f616c17b7a6e0
 size 433270768

run-1/checkpoint-113/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ee62648bf57a9472dcfa38c6bd16777e2608b37027ffbfb8dc7cff75f4c9104
 size 866662650

 version https://git-lfs.github.com/spec/v1
+oid sha256:6627dec85d1bc12127c42b8b8d8fbfa4c5a7471058d3f18f9ece1ddb7b463093
 size 866662650

run-1/checkpoint-113/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:47699f1e70fae69639d282116d434321f3d1cd7f81cae74d8fd73fe47a6ebb1d
-size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c1c36e6c4412b6dec3c300996cb47291225f16311da0b2742bf0676c76b2e6a
+size 14308

run-1/checkpoint-113/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:33882787a2f8e4f5f3246a6bc6d4daf1168f9e144d0f3bc3dec0b05e0804b4dd
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:92667e15536d299d658be02de3e3b7fa48d9c236cda09be9b077b4d59f80eaa6
 size 1064

run-1/checkpoint-113/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.5365,
   "best_model_checkpoint": "BERTForDetectingDepression-Twitter2020/run-1/checkpoint-113",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -10,18 +10,18 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.5365,
-      "eval_loss": 0.6904081106185913,
-      "eval_runtime": 3.0555,
-      "eval_samples_per_second": 654.568,
-      "eval_steps_per_second": 40.911,
       "step": 113
     }
   ],
   "logging_steps": 500,
-  "max_steps": 452,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 4,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -39,9 +39,9 @@
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 1.02690913847536e-06,
-    "num_train_epochs": 4,
     "per_device_train_batch_size": 16,
-    "seed": 23
   }
 }

 {
+  "best_metric": 0.581,
   "best_model_checkpoint": "BERTForDetectingDepression-Twitter2020/run-1/checkpoint-113",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.581,
+      "eval_loss": 0.6762082576751709,
+      "eval_runtime": 3.0563,
+      "eval_samples_per_second": 654.384,
+      "eval_steps_per_second": 40.899,
       "step": 113
     }
   ],
   "logging_steps": 500,
+  "max_steps": 226,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.5496936564274416e-06,
+    "num_train_epochs": 2,
     "per_device_train_batch_size": 16,
+    "seed": 33
   }
 }

run-1/checkpoint-113/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7521cb30664a0c20ab156d8ccb08d3894654e486488a3d8c1ca49fd6c3bb6cce
 size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:e626e5276f88d7b36e3de08cf7cf9df1408793f00e2c8a2fad3dc1b2b04d6df4
 size 5176

run-1/checkpoint-226/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:434459f2b9611bc7196ea398a951b828dd4c54a05f2cd271b4cd7fc41966492d
 size 433270768

 version https://git-lfs.github.com/spec/v1
+oid sha256:dd4e233f047d138d70b6e2c1b5ed321be980cc37e0fb72fd57e44be66ac14a53
 size 433270768

run-1/checkpoint-226/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a7f600edac7b21b20307f5513fcc65cb9e5d5c52b0b39aae6f3ec2d6567385f2
 size 866662650

 version https://git-lfs.github.com/spec/v1
+oid sha256:3fb7e8a482a5b61dce4e775f1acd498324e26fce681a223da6fa043ac5caa912
 size 866662650

run-1/checkpoint-226/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:76eb78e52a83da373ca5ab83ad2f5050f82f26131a5facbd32da52aee3bb6968
-size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:81e054fe749394d48e0a8528ed186f2a02a6f2b05ecac1673889919307fe0014
+size 14308

run-1/checkpoint-226/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:75bb5dbc4af33b636365d97902be8a9e2cf2279962b171fc089c5dbdd229fae0
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:1aeca43622a71a47471f089c87d94d7798d36d2f1506fc7075d54c51b3f8c65c
 size 1064

run-1/checkpoint-226/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.5585,
   "best_model_checkpoint": "BERTForDetectingDepression-Twitter2020/run-1/checkpoint-226",
   "epoch": 2.0,
   "eval_steps": 500,
@@ -10,27 +10,27 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.5365,
-      "eval_loss": 0.6904081106185913,
-      "eval_runtime": 3.0555,
-      "eval_samples_per_second": 654.568,
-      "eval_steps_per_second": 40.911,
       "step": 113
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.5585,
-      "eval_loss": 0.6850683093070984,
-      "eval_runtime": 3.0686,
-      "eval_samples_per_second": 651.768,
-      "eval_steps_per_second": 40.736,
       "step": 226
     }
   ],
   "logging_steps": 500,
-  "max_steps": 452,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 4,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -39,7 +39,7 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
@@ -48,9 +48,9 @@
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 1.02690913847536e-06,
-    "num_train_epochs": 4,
     "per_device_train_batch_size": 16,
-    "seed": 23
   }
 }

 {
+  "best_metric": 0.5885,
   "best_model_checkpoint": "BERTForDetectingDepression-Twitter2020/run-1/checkpoint-226",
   "epoch": 2.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.581,
+      "eval_loss": 0.6762082576751709,
+      "eval_runtime": 3.0563,
+      "eval_samples_per_second": 654.384,
+      "eval_steps_per_second": 40.899,
       "step": 113
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.5885,
+      "eval_loss": 0.671400249004364,
+      "eval_runtime": 3.1262,
+      "eval_samples_per_second": 639.748,
+      "eval_steps_per_second": 39.984,
       "step": 226
     }
   ],
   "logging_steps": 500,
+  "max_steps": 226,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.5496936564274416e-06,
+    "num_train_epochs": 2,
     "per_device_train_batch_size": 16,
+    "seed": 33
   }
 }

run-1/checkpoint-226/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7521cb30664a0c20ab156d8ccb08d3894654e486488a3d8c1ca49fd6c3bb6cce
 size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:e626e5276f88d7b36e3de08cf7cf9df1408793f00e2c8a2fad3dc1b2b04d6df4
 size 5176

runs/Aug01_13-47-28_1d376fbba8fb/events.out.tfevents.1722520214.1d376fbba8fb.194.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb3560e04646f108e421022d93698b97a4777c86680aea5557e1d1e97fa33115
+size 5943

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f5e7886cec37e6d7adf3d7a1ca71b01930e812265faaa75a7daaaaac101d4154
 size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:e626e5276f88d7b36e3de08cf7cf9df1408793f00e2c8a2fad3dc1b2b04d6df4
 size 5176