Training completed

Files changed (3) hide show

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.0182648401826484,
     "total_flos": 5.5657843654656e+16,
-    "train_loss": 1.3610095977783203,
-    "train_runtime": 143.4567,
-    "train_samples_per_second": 11.153,
-    "train_steps_per_second": 0.07
 }

 {
     "epoch": 0.0182648401826484,
     "total_flos": 5.5657843654656e+16,
+    "train_loss": 1.3686250686645507,
+    "train_runtime": 146.0605,
+    "train_samples_per_second": 10.954,
+    "train_steps_per_second": 0.068
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.0182648401826484,
     "total_flos": 5.5657843654656e+16,
-    "train_loss": 1.3610095977783203,
-    "train_runtime": 143.4567,
-    "train_samples_per_second": 11.153,
-    "train_steps_per_second": 0.07
 }

 {
     "epoch": 0.0182648401826484,
     "total_flos": 5.5657843654656e+16,
+    "train_loss": 1.3686250686645507,
+    "train_runtime": 146.0605,
+    "train_samples_per_second": 10.954,
+    "train_steps_per_second": 0.068
 }

trainer_state.json CHANGED Viewed

@@ -13,10 +13,10 @@
       "epoch": 0.0182648401826484,
       "step": 10,
       "total_flos": 5.5657843654656e+16,
-      "train_loss": 1.3610095977783203,
-      "train_runtime": 143.4567,
-      "train_samples_per_second": 11.153,
-      "train_steps_per_second": 0.07
     }
   ],
   "logging_steps": 100,

       "epoch": 0.0182648401826484,
       "step": 10,
       "total_flos": 5.5657843654656e+16,
+      "train_loss": 1.3686250686645507,
+      "train_runtime": 146.0605,
+      "train_samples_per_second": 10.954,
+      "train_steps_per_second": 0.068
     }
   ],
   "logging_steps": 100,