End of training

Files changed (5) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 70.0,
+    "eval_loss": 0.617826521396637,
+    "eval_runtime": 12.9706,
+    "eval_samples": 301,
+    "eval_samples_per_second": 23.206,
+    "eval_steps_per_second": 2.93,
+    "eval_wer": 0.579388353581902,
+    "train_loss": 2.7389903675426135,
+    "train_runtime": 3757.1772,
+    "train_samples": 704,
+    "train_samples_per_second": 13.116,
+    "train_steps_per_second": 0.205
+}

eval_results.json ADDED Viewed

+{
+    "epoch": 70.0,
+    "eval_loss": 0.617826521396637,
+    "eval_runtime": 12.9706,
+    "eval_samples": 301,
+    "eval_samples_per_second": 23.206,
+    "eval_steps_per_second": 2.93,
+    "eval_wer": 0.579388353581902
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bbb3198808cf612f13e045d1fcf7a774656b78f4c1e51071f44cbada579e9372
 size 1262108145

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a2714bff2398ab7fafb43dafa29eb9ded2eabc93b25793c08510e35fad67b8a
 size 1262108145

train_results.json ADDED Viewed

+{
+    "epoch": 70.0,
+    "train_loss": 2.7389903675426135,
+    "train_runtime": 3757.1772,
+    "train_samples": 704,
+    "train_samples_per_second": 13.116,
+    "train_steps_per_second": 0.205
+}

trainer_state.json ADDED Viewed

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 70.0,
+  "global_step": 770,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 27.27,
+      "learning_rate": 0.0001495,
+      "loss": 5.2793,
+      "step": 300
+    },
+    {
+      "epoch": 27.27,
+      "eval_loss": 3.073740243911743,
+      "eval_runtime": 13.7846,
+      "eval_samples_per_second": 21.836,
+      "eval_steps_per_second": 2.757,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 54.55,
+      "learning_rate": 0.00015833333333333332,
+      "loss": 1.5348,
+      "step": 600
+    },
+    {
+      "epoch": 54.55,
+      "eval_loss": 0.6312472820281982,
+      "eval_runtime": 13.5036,
+      "eval_samples_per_second": 22.29,
+      "eval_steps_per_second": 2.814,
+      "eval_wer": 0.6334310850439883,
+      "step": 600
+    },
+    {
+      "epoch": 70.0,
+      "step": 770,
+      "total_flos": 1.0714540362717635e+19,
+      "train_loss": 2.7389903675426135,
+      "train_runtime": 3757.1772,
+      "train_samples_per_second": 13.116,
+      "train_steps_per_second": 0.205
+    }
+  ],
+  "max_steps": 770,
+  "num_train_epochs": 70,
+  "total_flos": 1.0714540362717635e+19,
+  "trial_name": null,
+  "trial_params": null
+}