ashik1104
/

Bengali_wav2vec2_BERT_P

@@ -1,401 +0,0 @@
-{
-  "best_metric": 0.2302779592132956,
-  "best_model_checkpoint": "Bengali_wav2vec2_bert_punct\\checkpoint-230000",
-  "epoch": 4.0,
-  "eval_steps": 10000,
-  "global_step": 232060,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.17236921485822632,
-      "grad_norm": 4.759167671203613,
-      "learning_rate": 4.79499913629297e-05,
-      "loss": 1.4067,
-      "step": 10000
-    },
-    {
-      "epoch": 0.17236921485822632,
-      "eval_WER": 0.40140793961825966,
-      "eval_loss": 0.3006719648838043,
-      "eval_runtime": 76.2909,
-      "eval_samples_per_second": 39.323,
-      "eval_steps_per_second": 4.915,
-      "step": 10000
-    },
-    {
-      "epoch": 0.34473842971645263,
-      "grad_norm": 3.7281529903411865,
-      "learning_rate": 4.5791371566764555e-05,
-      "loss": 1.0498,
-      "step": 20000
-    },
-    {
-      "epoch": 0.34473842971645263,
-      "eval_WER": 0.35401698236446766,
-      "eval_loss": 0.24728824198246002,
-      "eval_runtime": 78.6228,
-      "eval_samples_per_second": 38.157,
-      "eval_steps_per_second": 4.77,
-      "step": 20000
-    },
-    {
-      "epoch": 0.517107644574679,
-      "grad_norm": 3.5825536251068115,
-      "learning_rate": 4.363253584384177e-05,
-      "loss": 0.9196,
-      "step": 30000
-    },
-    {
-      "epoch": 0.517107644574679,
-      "eval_WER": 0.3367080339647289,
-      "eval_loss": 0.22603251039981842,
-      "eval_runtime": 77.3702,
-      "eval_samples_per_second": 38.775,
-      "eval_steps_per_second": 4.847,
-      "step": 30000
-    },
-    {
-      "epoch": 0.6894768594329053,
-      "grad_norm": 5.719975471496582,
-      "learning_rate": 4.147434790119192e-05,
-      "loss": 0.8347,
-      "step": 40000
-    },
-    {
-      "epoch": 0.6894768594329053,
-      "eval_WER": 0.32026997605051166,
-      "eval_loss": 0.1984129399061203,
-      "eval_runtime": 76.0573,
-      "eval_samples_per_second": 39.444,
-      "eval_steps_per_second": 4.93,
-      "step": 40000
-    },
-    {
-      "epoch": 0.8618460742911316,
-      "grad_norm": 12.707213401794434,
-      "learning_rate": 3.931594403178442e-05,
-      "loss": 0.7728,
-      "step": 50000
-    },
-    {
-      "epoch": 0.8618460742911316,
-      "eval_WER": 0.30205385006168806,
-      "eval_loss": 0.18471553921699524,
-      "eval_runtime": 77.2641,
-      "eval_samples_per_second": 38.828,
-      "eval_steps_per_second": 4.853,
-      "step": 50000
-    },
-    {
-      "epoch": 1.034215289149358,
-      "grad_norm": 2.484391689300537,
-      "learning_rate": 3.715732423561928e-05,
-      "loss": 0.7257,
-      "step": 60000
-    },
-    {
-      "epoch": 1.034215289149358,
-      "eval_WER": 0.29552217142027726,
-      "eval_loss": 0.17463411390781403,
-      "eval_runtime": 77.8642,
-      "eval_samples_per_second": 38.529,
-      "eval_steps_per_second": 4.816,
-      "step": 60000
-    },
-    {
-      "epoch": 1.2065845040075842,
-      "grad_norm": 2.728205680847168,
-      "learning_rate": 3.4999136292969425e-05,
-      "loss": 0.6895,
-      "step": 70000
-    },
-    {
-      "epoch": 1.2065845040075842,
-      "eval_WER": 0.2906596995427825,
-      "eval_loss": 0.16489063203334808,
-      "eval_runtime": 85.1263,
-      "eval_samples_per_second": 35.242,
-      "eval_steps_per_second": 4.405,
-      "step": 70000
-    },
-    {
-      "epoch": 1.3789537188658105,
-      "grad_norm": 3.63918399810791,
-      "learning_rate": 3.284030057004664e-05,
-      "loss": 0.6653,
-      "step": 80000
-    },
-    {
-      "epoch": 1.3789537188658105,
-      "eval_WER": 0.28917192829668337,
-      "eval_loss": 0.16142985224723816,
-      "eval_runtime": 77.5124,
-      "eval_samples_per_second": 38.704,
-      "eval_steps_per_second": 4.838,
-      "step": 80000
-    },
-    {
-      "epoch": 1.5513229337240368,
-      "grad_norm": 3.3453214168548584,
-      "learning_rate": 3.06816807738815e-05,
-      "loss": 0.6418,
-      "step": 90000
-    },
-    {
-      "epoch": 1.5513229337240368,
-      "eval_WER": 0.2765440162566224,
-      "eval_loss": 0.1598576009273529,
-      "eval_runtime": 77.4372,
-      "eval_samples_per_second": 38.741,
-      "eval_steps_per_second": 4.843,
-      "step": 90000
-    },
-    {
-      "epoch": 1.7236921485822632,
-      "grad_norm": 3.1832072734832764,
-      "learning_rate": 2.8523492831231646e-05,
-      "loss": 0.6241,
-      "step": 100000
-    },
-    {
-      "epoch": 1.7236921485822632,
-      "eval_WER": 0.2766165904637492,
-      "eval_loss": 0.14717546105384827,
-      "eval_runtime": 77.4687,
-      "eval_samples_per_second": 38.725,
-      "eval_steps_per_second": 4.841,
-      "step": 100000
-    },
-    {
-      "epoch": 1.8960613634404895,
-      "grad_norm": 4.113869667053223,
-      "learning_rate": 2.6364873035066505e-05,
-      "loss": 0.6092,
-      "step": 110000
-    },
-    {
-      "epoch": 1.8960613634404895,
-      "eval_WER": 0.26765367588359096,
-      "eval_loss": 0.1441964954137802,
-      "eval_runtime": 77.6139,
-      "eval_samples_per_second": 38.653,
-      "eval_steps_per_second": 4.832,
-      "step": 110000
-    },
-    {
-      "epoch": 2.068430578298716,
-      "grad_norm": 1.85727858543396,
-      "learning_rate": 2.4206253238901367e-05,
-      "loss": 0.5805,
-      "step": 120000
-    },
-    {
-      "epoch": 2.068430578298716,
-      "eval_WER": 0.26322664924885697,
-      "eval_loss": 0.13760210573673248,
-      "eval_runtime": 77.692,
-      "eval_samples_per_second": 38.614,
-      "eval_steps_per_second": 4.827,
-      "step": 120000
-    },
-    {
-      "epoch": 2.2407997931569423,
-      "grad_norm": 2.774275779724121,
-      "learning_rate": 2.204741751597858e-05,
-      "loss": 0.5611,
-      "step": 130000
-    },
-    {
-      "epoch": 2.2407997931569423,
-      "eval_WER": 0.2587633355105595,
-      "eval_loss": 0.1326003223657608,
-      "eval_runtime": 75.6029,
-      "eval_samples_per_second": 39.681,
-      "eval_steps_per_second": 4.96,
-      "step": 130000
-    },
-    {
-      "epoch": 2.4131690080151684,
-      "grad_norm": 1.8835299015045166,
-      "learning_rate": 1.9889013646571085e-05,
-      "loss": 0.5433,
-      "step": 140000
-    },
-    {
-      "epoch": 2.4131690080151684,
-      "eval_WER": 0.2550983380506568,
-      "eval_loss": 0.12959806621074677,
-      "eval_runtime": 75.9556,
-      "eval_samples_per_second": 39.497,
-      "eval_steps_per_second": 4.937,
-      "step": 140000
-    },
-    {
-      "epoch": 2.585538222873395,
-      "grad_norm": 2.7739031314849854,
-      "learning_rate": 1.773060977716359e-05,
-      "loss": 0.5315,
-      "step": 150000
-    },
-    {
-      "epoch": 2.585538222873395,
-      "eval_WER": 0.2523405181798389,
-      "eval_loss": 0.12333784997463226,
-      "eval_runtime": 75.6489,
-      "eval_samples_per_second": 39.657,
-      "eval_steps_per_second": 4.957,
-      "step": 150000
-    },
-    {
-      "epoch": 2.757907437731621,
-      "grad_norm": 5.59724235534668,
-      "learning_rate": 1.5572421834513734e-05,
-      "loss": 0.5192,
-      "step": 160000
-    },
-    {
-      "epoch": 2.757907437731621,
-      "eval_WER": 0.2465708687132593,
-      "eval_loss": 0.11873666197061539,
-      "eval_runtime": 75.813,
-      "eval_samples_per_second": 39.571,
-      "eval_steps_per_second": 4.946,
-      "step": 160000
-    },
-    {
-      "epoch": 2.9302766525898476,
-      "grad_norm": 1.7511285543441772,
-      "learning_rate": 1.3413802038348594e-05,
-      "loss": 0.508,
-      "step": 170000
-    },
-    {
-      "epoch": 2.9302766525898476,
-      "eval_WER": 0.24355903911749763,
-      "eval_loss": 0.11491911858320236,
-      "eval_runtime": 76.2555,
-      "eval_samples_per_second": 39.341,
-      "eval_steps_per_second": 4.918,
-      "step": 170000
-    },
-    {
-      "epoch": 3.1026458674480737,
-      "grad_norm": 1.3240278959274292,
-      "learning_rate": 1.1255830022456384e-05,
-      "loss": 0.4885,
-      "step": 180000
-    },
-    {
-      "epoch": 3.1026458674480737,
-      "eval_WER": 0.24315988097830032,
-      "eval_loss": 0.11166874319314957,
-      "eval_runtime": 77.1138,
-      "eval_samples_per_second": 38.904,
-      "eval_steps_per_second": 4.863,
-      "step": 180000
-    },
-    {
-      "epoch": 3.2750150823063002,
-      "grad_norm": 1.0281517505645752,
-      "learning_rate": 9.096994299533598e-06,
-      "loss": 0.4709,
-      "step": 190000
-    },
-    {
-      "epoch": 3.2750150823063002,
-      "eval_WER": 0.23887800275781987,
-      "eval_loss": 0.10879674553871155,
-      "eval_runtime": 77.1588,
-      "eval_samples_per_second": 38.881,
-      "eval_steps_per_second": 4.86,
-      "step": 190000
-    },
-    {
-      "epoch": 3.4473842971645263,
-      "grad_norm": 2.2434046268463135,
-      "learning_rate": 6.938590430126101e-06,
-      "loss": 0.4669,
-      "step": 200000
-    },
-    {
-      "epoch": 3.4473842971645263,
-      "eval_WER": 0.23492270846940996,
-      "eval_loss": 0.10604960471391678,
-      "eval_runtime": 77.0841,
-      "eval_samples_per_second": 38.919,
-      "eval_steps_per_second": 4.865,
-      "step": 200000
-    },
-    {
-      "epoch": 3.619753512022753,
-      "grad_norm": 0.7335111498832703,
-      "learning_rate": 4.780186560718605e-06,
-      "loss": 0.451,
-      "step": 210000
-    },
-    {
-      "epoch": 3.619753512022753,
-      "eval_WER": 0.23452355033021263,
-      "eval_loss": 0.10134341567754745,
-      "eval_runtime": 77.1143,
-      "eval_samples_per_second": 38.903,
-      "eval_steps_per_second": 4.863,
-      "step": 210000
-    },
-    {
-      "epoch": 3.792122726880979,
-      "grad_norm": 1.7208735942840576,
-      "learning_rate": 2.6215667645534633e-06,
-      "loss": 0.445,
-      "step": 220000
-    },
-    {
-      "epoch": 3.792122726880979,
-      "eval_WER": 0.2329632048769867,
-      "eval_loss": 0.10342755168676376,
-      "eval_runtime": 77.7151,
-      "eval_samples_per_second": 38.603,
-      "eval_steps_per_second": 4.825,
-      "step": 220000
-    },
-    {
-      "epoch": 3.9644919417392055,
-      "grad_norm": 1.0953819751739502,
-      "learning_rate": 4.6316289514596653e-07,
-      "loss": 0.4379,
-      "step": 230000
-    },
-    {
-      "epoch": 3.9644919417392055,
-      "eval_WER": 0.2302779592132956,
-      "eval_loss": 0.09944533556699753,
-      "eval_runtime": 78.1453,
-      "eval_samples_per_second": 38.39,
-      "eval_steps_per_second": 4.799,
-      "step": 230000
-    }
-  ],
-  "logging_steps": 10000,
-  "max_steps": 232060,
-  "num_input_tokens_seen": 0,
-  "num_train_epochs": 4,
-  "save_steps": 10000,
-  "stateful_callbacks": {
-    "TrainerControl": {
-      "args": {
-        "should_epoch_stop": false,
-        "should_evaluate": false,
-        "should_log": false,
-        "should_save": true,
-        "should_training_stop": true
-      },
-      "attributes": {}
-    }
-  },
-  "total_flos": 4.7334394582539475e+20,
-  "train_batch_size": 8,
-  "trial_name": null,
-  "trial_params": null
-}