{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 1.0,
  "eval_steps": 500,
  "global_step": 7133,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.0,
      "learning_rate": 9.345794392523364e-08,
      "loss": 1.2777,
      "step": 1
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.8691588785046729e-07,
      "loss": 1.4387,
      "step": 2
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.8037383177570096e-07,
      "loss": 1.5653,
      "step": 3
    },
    {
      "epoch": 0.0,
      "learning_rate": 3.7383177570093457e-07,
      "loss": 1.2499,
      "step": 4
    },
    {
      "epoch": 0.0,
      "learning_rate": 4.6728971962616824e-07,
      "loss": 1.2639,
      "step": 5
    },
    {
      "epoch": 0.0,
      "learning_rate": 5.607476635514019e-07,
      "loss": 1.2006,
      "step": 6
    },
    {
      "epoch": 0.0,
      "learning_rate": 6.542056074766355e-07,
      "loss": 1.2965,
      "step": 7
    },
    {
      "epoch": 0.0,
      "learning_rate": 7.476635514018691e-07,
      "loss": 1.3215,
      "step": 8
    },
    {
      "epoch": 0.0,
      "learning_rate": 8.411214953271029e-07,
      "loss": 1.4203,
      "step": 9
    },
    {
      "epoch": 0.0,
      "learning_rate": 9.345794392523365e-07,
      "loss": 1.3097,
      "step": 10
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.0280373831775702e-06,
      "loss": 1.3496,
      "step": 11
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.1214953271028038e-06,
      "loss": 0.985,
      "step": 12
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.2149532710280374e-06,
      "loss": 1.2122,
      "step": 13
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.308411214953271e-06,
      "loss": 1.0728,
      "step": 14
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.4018691588785047e-06,
      "loss": 1.0768,
      "step": 15
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.4953271028037383e-06,
      "loss": 1.2588,
      "step": 16
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.588785046728972e-06,
      "loss": 0.9936,
      "step": 17
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.6822429906542057e-06,
      "loss": 1.1589,
      "step": 18
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.7757009345794394e-06,
      "loss": 1.1133,
      "step": 19
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.869158878504673e-06,
      "loss": 1.0823,
      "step": 20
    },
    {
      "epoch": 0.0,
      "learning_rate": 1.962616822429907e-06,
      "loss": 1.2316,
      "step": 21
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.0560747663551404e-06,
      "loss": 0.9953,
      "step": 22
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.149532710280374e-06,
      "loss": 1.0876,
      "step": 23
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.2429906542056077e-06,
      "loss": 0.949,
      "step": 24
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.3364485981308413e-06,
      "loss": 0.7936,
      "step": 25
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.429906542056075e-06,
      "loss": 1.0383,
      "step": 26
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.5233644859813085e-06,
      "loss": 1.0141,
      "step": 27
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.616822429906542e-06,
      "loss": 1.041,
      "step": 28
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.7102803738317757e-06,
      "loss": 0.8972,
      "step": 29
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.8037383177570094e-06,
      "loss": 1.1319,
      "step": 30
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.897196261682243e-06,
      "loss": 0.9124,
      "step": 31
    },
    {
      "epoch": 0.0,
      "learning_rate": 2.9906542056074766e-06,
      "loss": 0.9291,
      "step": 32
    },
    {
      "epoch": 0.0,
      "learning_rate": 3.08411214953271e-06,
      "loss": 0.933,
      "step": 33
    },
    {
      "epoch": 0.0,
      "learning_rate": 3.177570093457944e-06,
      "loss": 0.9062,
      "step": 34
    },
    {
      "epoch": 0.0,
      "learning_rate": 3.2710280373831774e-06,
      "loss": 1.0631,
      "step": 35
    },
    {
      "epoch": 0.01,
      "learning_rate": 3.3644859813084115e-06,
      "loss": 0.9117,
      "step": 36
    },
    {
      "epoch": 0.01,
      "learning_rate": 3.457943925233645e-06,
      "loss": 0.9303,
      "step": 37
    },
    {
      "epoch": 0.01,
      "learning_rate": 3.5514018691588787e-06,
      "loss": 0.7371,
      "step": 38
    },
    {
      "epoch": 0.01,
      "learning_rate": 3.6448598130841123e-06,
      "loss": 0.9119,
      "step": 39
    },
    {
      "epoch": 0.01,
      "learning_rate": 3.738317757009346e-06,
      "loss": 0.8987,
      "step": 40
    },
    {
      "epoch": 0.01,
      "learning_rate": 3.8317757009345796e-06,
      "loss": 0.7404,
      "step": 41
    },
    {
      "epoch": 0.01,
      "learning_rate": 3.925233644859814e-06,
      "loss": 0.9063,
      "step": 42
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.018691588785047e-06,
      "loss": 0.7979,
      "step": 43
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.112149532710281e-06,
      "loss": 0.9106,
      "step": 44
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.205607476635514e-06,
      "loss": 0.85,
      "step": 45
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.299065420560748e-06,
      "loss": 0.8817,
      "step": 46
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.392523364485981e-06,
      "loss": 0.865,
      "step": 47
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.485981308411215e-06,
      "loss": 0.9454,
      "step": 48
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.579439252336449e-06,
      "loss": 0.8636,
      "step": 49
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.6728971962616825e-06,
      "loss": 1.0481,
      "step": 50
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.766355140186917e-06,
      "loss": 0.8438,
      "step": 51
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.85981308411215e-06,
      "loss": 0.6942,
      "step": 52
    },
    {
      "epoch": 0.01,
      "learning_rate": 4.953271028037384e-06,
      "loss": 0.9348,
      "step": 53
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.046728971962617e-06,
      "loss": 0.7701,
      "step": 54
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.14018691588785e-06,
      "loss": 0.914,
      "step": 55
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.233644859813084e-06,
      "loss": 0.9355,
      "step": 56
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.3271028037383174e-06,
      "loss": 0.8104,
      "step": 57
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.4205607476635515e-06,
      "loss": 0.9827,
      "step": 58
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.514018691588785e-06,
      "loss": 0.8715,
      "step": 59
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.607476635514019e-06,
      "loss": 0.8649,
      "step": 60
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.700934579439253e-06,
      "loss": 0.7464,
      "step": 61
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.794392523364486e-06,
      "loss": 0.8902,
      "step": 62
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.88785046728972e-06,
      "loss": 0.8532,
      "step": 63
    },
    {
      "epoch": 0.01,
      "learning_rate": 5.981308411214953e-06,
      "loss": 0.9002,
      "step": 64
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.074766355140187e-06,
      "loss": 0.8107,
      "step": 65
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.16822429906542e-06,
      "loss": 0.8764,
      "step": 66
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.2616822429906544e-06,
      "loss": 0.7917,
      "step": 67
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.355140186915888e-06,
      "loss": 0.7527,
      "step": 68
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.448598130841122e-06,
      "loss": 0.6796,
      "step": 69
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.542056074766355e-06,
      "loss": 0.8896,
      "step": 70
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.635514018691589e-06,
      "loss": 0.8285,
      "step": 71
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.728971962616823e-06,
      "loss": 0.7695,
      "step": 72
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.822429906542056e-06,
      "loss": 0.9194,
      "step": 73
    },
    {
      "epoch": 0.01,
      "learning_rate": 6.91588785046729e-06,
      "loss": 0.8517,
      "step": 74
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.009345794392523e-06,
      "loss": 0.7981,
      "step": 75
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.1028037383177574e-06,
      "loss": 0.7925,
      "step": 76
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.196261682242991e-06,
      "loss": 0.8784,
      "step": 77
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.289719626168225e-06,
      "loss": 0.7617,
      "step": 78
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.383177570093458e-06,
      "loss": 0.8446,
      "step": 79
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.476635514018692e-06,
      "loss": 0.807,
      "step": 80
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.570093457943926e-06,
      "loss": 0.8491,
      "step": 81
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.663551401869159e-06,
      "loss": 0.794,
      "step": 82
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.757009345794392e-06,
      "loss": 0.7853,
      "step": 83
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.850467289719627e-06,
      "loss": 0.8586,
      "step": 84
    },
    {
      "epoch": 0.01,
      "learning_rate": 7.94392523364486e-06,
      "loss": 0.6728,
      "step": 85
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.037383177570094e-06,
      "loss": 0.9314,
      "step": 86
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.130841121495327e-06,
      "loss": 0.7265,
      "step": 87
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.224299065420562e-06,
      "loss": 0.7548,
      "step": 88
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.317757009345795e-06,
      "loss": 0.7724,
      "step": 89
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.411214953271028e-06,
      "loss": 0.8722,
      "step": 90
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.504672897196263e-06,
      "loss": 0.8724,
      "step": 91
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.598130841121496e-06,
      "loss": 0.7559,
      "step": 92
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.69158878504673e-06,
      "loss": 0.8183,
      "step": 93
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.785046728971963e-06,
      "loss": 0.8727,
      "step": 94
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.878504672897197e-06,
      "loss": 0.7667,
      "step": 95
    },
    {
      "epoch": 0.01,
      "learning_rate": 8.97196261682243e-06,
      "loss": 0.9218,
      "step": 96
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.065420560747664e-06,
      "loss": 0.8385,
      "step": 97
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.158878504672899e-06,
      "loss": 0.6916,
      "step": 98
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.252336448598132e-06,
      "loss": 0.7953,
      "step": 99
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.345794392523365e-06,
      "loss": 0.7808,
      "step": 100
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.439252336448598e-06,
      "loss": 0.8402,
      "step": 101
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.532710280373833e-06,
      "loss": 0.8363,
      "step": 102
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.626168224299066e-06,
      "loss": 0.7978,
      "step": 103
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.7196261682243e-06,
      "loss": 0.7556,
      "step": 104
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.813084112149533e-06,
      "loss": 0.791,
      "step": 105
    },
    {
      "epoch": 0.01,
      "learning_rate": 9.906542056074768e-06,
      "loss": 0.711,
      "step": 106
    },
    {
      "epoch": 0.02,
      "learning_rate": 1e-05,
      "loss": 0.8767,
      "step": 107
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0093457943925234e-05,
      "loss": 0.8005,
      "step": 108
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0186915887850469e-05,
      "loss": 0.7626,
      "step": 109
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.02803738317757e-05,
      "loss": 0.8292,
      "step": 110
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0373831775700935e-05,
      "loss": 0.7724,
      "step": 111
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0467289719626168e-05,
      "loss": 0.7256,
      "step": 112
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0560747663551403e-05,
      "loss": 0.7002,
      "step": 113
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0654205607476635e-05,
      "loss": 0.764,
      "step": 114
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.074766355140187e-05,
      "loss": 0.7698,
      "step": 115
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0841121495327103e-05,
      "loss": 0.8495,
      "step": 116
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.0934579439252338e-05,
      "loss": 0.7571,
      "step": 117
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.102803738317757e-05,
      "loss": 0.679,
      "step": 118
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1121495327102804e-05,
      "loss": 0.6923,
      "step": 119
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1214953271028037e-05,
      "loss": 0.8017,
      "step": 120
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1308411214953272e-05,
      "loss": 0.7856,
      "step": 121
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1401869158878505e-05,
      "loss": 0.8358,
      "step": 122
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1495327102803739e-05,
      "loss": 0.7373,
      "step": 123
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1588785046728972e-05,
      "loss": 0.747,
      "step": 124
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1682242990654207e-05,
      "loss": 0.8416,
      "step": 125
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.177570093457944e-05,
      "loss": 0.7323,
      "step": 126
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1869158878504675e-05,
      "loss": 0.9055,
      "step": 127
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.1962616822429906e-05,
      "loss": 0.6664,
      "step": 128
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2056074766355141e-05,
      "loss": 0.7585,
      "step": 129
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2149532710280374e-05,
      "loss": 0.8058,
      "step": 130
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.224299065420561e-05,
      "loss": 0.8424,
      "step": 131
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.233644859813084e-05,
      "loss": 0.6575,
      "step": 132
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2429906542056076e-05,
      "loss": 0.7419,
      "step": 133
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2523364485981309e-05,
      "loss": 0.6423,
      "step": 134
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2616822429906544e-05,
      "loss": 0.9012,
      "step": 135
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2710280373831775e-05,
      "loss": 0.7885,
      "step": 136
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.280373831775701e-05,
      "loss": 0.7683,
      "step": 137
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2897196261682243e-05,
      "loss": 0.834,
      "step": 138
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.2990654205607478e-05,
      "loss": 0.7809,
      "step": 139
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.308411214953271e-05,
      "loss": 0.7388,
      "step": 140
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.3177570093457945e-05,
      "loss": 0.7366,
      "step": 141
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.3271028037383178e-05,
      "loss": 0.893,
      "step": 142
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.3364485981308413e-05,
      "loss": 0.7046,
      "step": 143
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.3457943925233646e-05,
      "loss": 0.7606,
      "step": 144
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.355140186915888e-05,
      "loss": 0.8447,
      "step": 145
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.3644859813084112e-05,
      "loss": 0.8595,
      "step": 146
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.3738317757009347e-05,
      "loss": 0.8223,
      "step": 147
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.383177570093458e-05,
      "loss": 0.7674,
      "step": 148
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.3925233644859815e-05,
      "loss": 0.8049,
      "step": 149
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4018691588785047e-05,
      "loss": 0.7327,
      "step": 150
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4112149532710282e-05,
      "loss": 0.7469,
      "step": 151
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4205607476635515e-05,
      "loss": 0.6934,
      "step": 152
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.429906542056075e-05,
      "loss": 0.7073,
      "step": 153
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4392523364485981e-05,
      "loss": 0.7734,
      "step": 154
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4485981308411216e-05,
      "loss": 0.689,
      "step": 155
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.457943925233645e-05,
      "loss": 0.7603,
      "step": 156
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4672897196261684e-05,
      "loss": 0.858,
      "step": 157
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4766355140186916e-05,
      "loss": 0.8327,
      "step": 158
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.485981308411215e-05,
      "loss": 0.6753,
      "step": 159
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.4953271028037384e-05,
      "loss": 0.7029,
      "step": 160
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5046728971962619e-05,
      "loss": 0.7794,
      "step": 161
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5140186915887852e-05,
      "loss": 0.7646,
      "step": 162
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5233644859813087e-05,
      "loss": 0.8051,
      "step": 163
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5327102803738318e-05,
      "loss": 0.8043,
      "step": 164
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5420560747663555e-05,
      "loss": 0.8711,
      "step": 165
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5514018691588785e-05,
      "loss": 0.7704,
      "step": 166
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.560747663551402e-05,
      "loss": 0.8212,
      "step": 167
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5700934579439254e-05,
      "loss": 0.802,
      "step": 168
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5794392523364488e-05,
      "loss": 0.8419,
      "step": 169
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.588785046728972e-05,
      "loss": 0.8156,
      "step": 170
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.5981308411214954e-05,
      "loss": 0.7211,
      "step": 171
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.6074766355140187e-05,
      "loss": 0.6761,
      "step": 172
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.6168224299065424e-05,
      "loss": 0.743,
      "step": 173
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.6261682242990654e-05,
      "loss": 0.7641,
      "step": 174
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.635514018691589e-05,
      "loss": 0.7416,
      "step": 175
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.6448598130841123e-05,
      "loss": 0.7623,
      "step": 176
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.6542056074766357e-05,
      "loss": 0.574,
      "step": 177
    },
    {
      "epoch": 0.02,
      "learning_rate": 1.663551401869159e-05,
      "loss": 0.6304,
      "step": 178
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.6728971962616823e-05,
      "loss": 0.8758,
      "step": 179
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.6822429906542056e-05,
      "loss": 0.8049,
      "step": 180
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.6915887850467293e-05,
      "loss": 0.7493,
      "step": 181
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.7009345794392526e-05,
      "loss": 0.7349,
      "step": 182
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.710280373831776e-05,
      "loss": 0.6951,
      "step": 183
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.7196261682242992e-05,
      "loss": 0.6855,
      "step": 184
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.7289719626168225e-05,
      "loss": 0.7946,
      "step": 185
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.738317757009346e-05,
      "loss": 0.7897,
      "step": 186
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.7476635514018695e-05,
      "loss": 0.7615,
      "step": 187
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.7570093457943925e-05,
      "loss": 0.7692,
      "step": 188
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.766355140186916e-05,
      "loss": 0.7079,
      "step": 189
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.7757009345794395e-05,
      "loss": 0.8037,
      "step": 190
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.7850467289719628e-05,
      "loss": 0.7534,
      "step": 191
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.794392523364486e-05,
      "loss": 0.7153,
      "step": 192
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8037383177570094e-05,
      "loss": 0.8153,
      "step": 193
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8130841121495328e-05,
      "loss": 0.8806,
      "step": 194
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8224299065420564e-05,
      "loss": 0.696,
      "step": 195
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8317757009345797e-05,
      "loss": 0.7872,
      "step": 196
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.841121495327103e-05,
      "loss": 0.7177,
      "step": 197
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8504672897196264e-05,
      "loss": 0.7521,
      "step": 198
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8598130841121497e-05,
      "loss": 0.7385,
      "step": 199
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.869158878504673e-05,
      "loss": 0.8255,
      "step": 200
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8785046728971967e-05,
      "loss": 0.7329,
      "step": 201
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8878504672897197e-05,
      "loss": 0.6868,
      "step": 202
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.8971962616822433e-05,
      "loss": 0.6927,
      "step": 203
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9065420560747666e-05,
      "loss": 0.6707,
      "step": 204
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.91588785046729e-05,
      "loss": 0.7241,
      "step": 205
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9252336448598133e-05,
      "loss": 0.7836,
      "step": 206
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9345794392523366e-05,
      "loss": 0.7831,
      "step": 207
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.94392523364486e-05,
      "loss": 0.7063,
      "step": 208
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9532710280373836e-05,
      "loss": 0.8905,
      "step": 209
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9626168224299065e-05,
      "loss": 0.7246,
      "step": 210
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9719626168224302e-05,
      "loss": 0.8297,
      "step": 211
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9813084112149535e-05,
      "loss": 0.9889,
      "step": 212
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.990654205607477e-05,
      "loss": 0.675,
      "step": 213
    },
    {
      "epoch": 0.03,
      "learning_rate": 2e-05,
      "loss": 0.8126,
      "step": 214
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999999896917942e-05,
      "loss": 0.821,
      "step": 215
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999999587671789e-05,
      "loss": 0.725,
      "step": 216
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999990722616046e-05,
      "loss": 0.7233,
      "step": 217
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999983506874953e-05,
      "loss": 0.8096,
      "step": 218
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999974229496097e-05,
      "loss": 0.6621,
      "step": 219
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999996289048139e-05,
      "loss": 0.7682,
      "step": 220
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999949489833172e-05,
      "loss": 0.8128,
      "step": 221
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999934027554206e-05,
      "loss": 0.7274,
      "step": 222
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999916503647676e-05,
      "loss": 0.7975,
      "step": 223
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.99998969181172e-05,
      "loss": 0.6988,
      "step": 224
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999875270966812e-05,
      "loss": 0.7738,
      "step": 225
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999851562200975e-05,
      "loss": 0.7611,
      "step": 226
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999825791824583e-05,
      "loss": 0.6289,
      "step": 227
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999979795984294e-05,
      "loss": 0.7449,
      "step": 228
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999768066261785e-05,
      "loss": 0.7635,
      "step": 229
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999973611108729e-05,
      "loss": 0.7988,
      "step": 230
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999702094326033e-05,
      "loss": 0.5495,
      "step": 231
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999666015985034e-05,
      "loss": 0.6929,
      "step": 232
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999627876071725e-05,
      "loss": 0.6571,
      "step": 233
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999958767459397e-05,
      "loss": 0.7797,
      "step": 234
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999545411560065e-05,
      "loss": 0.7639,
      "step": 235
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999501086978713e-05,
      "loss": 0.7345,
      "step": 236
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999454700859057e-05,
      "loss": 0.6855,
      "step": 237
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999406253210664e-05,
      "loss": 0.646,
      "step": 238
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999355744043513e-05,
      "loss": 0.7733,
      "step": 239
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999303173368022e-05,
      "loss": 0.7539,
      "step": 240
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999924854119503e-05,
      "loss": 0.7456,
      "step": 241
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.99991918475358e-05,
      "loss": 0.7445,
      "step": 242
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999133092402018e-05,
      "loss": 0.8085,
      "step": 243
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9999072275805796e-05,
      "loss": 0.8778,
      "step": 244
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.999900939775968e-05,
      "loss": 0.7359,
      "step": 245
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9998944458276625e-05,
      "loss": 0.77,
      "step": 246
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9998877457370022e-05,
      "loss": 0.8193,
      "step": 247
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9998808395053687e-05,
      "loss": 0.5906,
      "step": 248
    },
    {
      "epoch": 0.03,
      "learning_rate": 1.9998737271341855e-05,
      "loss": 0.7665,
      "step": 249
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9998664086249188e-05,
      "loss": 0.7734,
      "step": 250
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9998588839790777e-05,
      "loss": 0.7173,
      "step": 251
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9998511531982134e-05,
      "loss": 0.748,
      "step": 252
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.99984321628392e-05,
      "loss": 0.7779,
      "step": 253
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9998350732378332e-05,
      "loss": 0.7364,
      "step": 254
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9998267240616322e-05,
      "loss": 0.7019,
      "step": 255
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999818168757038e-05,
      "loss": 0.8314,
      "step": 256
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999809407325815e-05,
      "loss": 0.7109,
      "step": 257
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9998004397697688e-05,
      "loss": 0.7745,
      "step": 258
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999791266090749e-05,
      "loss": 0.6839,
      "step": 259
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9997818862906456e-05,
      "loss": 0.7124,
      "step": 260
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9997723003713937e-05,
      "loss": 0.7933,
      "step": 261
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999762508334969e-05,
      "loss": 0.671,
      "step": 262
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.99975251018339e-05,
      "loss": 0.6507,
      "step": 263
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9997423059187185e-05,
      "loss": 0.76,
      "step": 264
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999731895543058e-05,
      "loss": 0.8268,
      "step": 265
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999721279058555e-05,
      "loss": 0.8426,
      "step": 266
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999710456467398e-05,
      "loss": 0.6884,
      "step": 267
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9996994277718175e-05,
      "loss": 0.7829,
      "step": 268
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9996881929740886e-05,
      "loss": 0.7614,
      "step": 269
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9996767520765266e-05,
      "loss": 0.7679,
      "step": 270
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9996651050814906e-05,
      "loss": 0.764,
      "step": 271
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9996532519913815e-05,
      "loss": 0.7424,
      "step": 272
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9996411928086435e-05,
      "loss": 0.6702,
      "step": 273
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999628927535762e-05,
      "loss": 0.7368,
      "step": 274
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9996164561752662e-05,
      "loss": 0.7578,
      "step": 275
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999603778729727e-05,
      "loss": 0.8966,
      "step": 276
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9995908952017587e-05,
      "loss": 0.7473,
      "step": 277
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9995778055940166e-05,
      "loss": 0.856,
      "step": 278
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999564509909199e-05,
      "loss": 0.7948,
      "step": 279
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9995510081500483e-05,
      "loss": 0.71,
      "step": 280
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999537300319347e-05,
      "loss": 0.7377,
      "step": 281
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9995233864199213e-05,
      "loss": 0.7942,
      "step": 282
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9995092664546406e-05,
      "loss": 0.8714,
      "step": 283
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999494940426415e-05,
      "loss": 0.8401,
      "step": 284
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9994804083381982e-05,
      "loss": 0.7405,
      "step": 285
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9994656701929864e-05,
      "loss": 0.7534,
      "step": 286
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9994507259938178e-05,
      "loss": 0.7303,
      "step": 287
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999435575743774e-05,
      "loss": 0.6631,
      "step": 288
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9994202194459772e-05,
      "loss": 0.6322,
      "step": 289
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9994046571035946e-05,
      "loss": 0.8325,
      "step": 290
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999388888719834e-05,
      "loss": 0.6657,
      "step": 291
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9993729142979467e-05,
      "loss": 0.7604,
      "step": 292
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999356733841225e-05,
      "loss": 0.7383,
      "step": 293
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9993403473530058e-05,
      "loss": 0.8033,
      "step": 294
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9993237548366672e-05,
      "loss": 0.7785,
      "step": 295
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9993069562956296e-05,
      "loss": 0.7485,
      "step": 296
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999289951733357e-05,
      "loss": 0.73,
      "step": 297
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999272741153354e-05,
      "loss": 0.6055,
      "step": 298
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9992553245591694e-05,
      "loss": 0.8412,
      "step": 299
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9992377019543943e-05,
      "loss": 0.7729,
      "step": 300
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999219873342661e-05,
      "loss": 0.7112,
      "step": 301
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999201838727646e-05,
      "loss": 0.7499,
      "step": 302
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9991835981130666e-05,
      "loss": 0.7545,
      "step": 303
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999165151502684e-05,
      "loss": 0.7051,
      "step": 304
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999146498900301e-05,
      "loss": 0.8509,
      "step": 305
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9991276403097627e-05,
      "loss": 0.7825,
      "step": 306
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9991085757349578e-05,
      "loss": 0.7462,
      "step": 307
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9990893051798158e-05,
      "loss": 0.6973,
      "step": 308
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9990698286483107e-05,
      "loss": 0.6877,
      "step": 309
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.999050146144457e-05,
      "loss": 0.7548,
      "step": 310
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9990302576723127e-05,
      "loss": 0.6749,
      "step": 311
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9990101632359785e-05,
      "loss": 0.6799,
      "step": 312
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.998989862839597e-05,
      "loss": 0.8644,
      "step": 313
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.998969356487353e-05,
      "loss": 0.7853,
      "step": 314
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9989486441834744e-05,
      "loss": 0.6889,
      "step": 315
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9989277259322314e-05,
      "loss": 0.8158,
      "step": 316
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.998906601737937e-05,
      "loss": 0.7429,
      "step": 317
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9988852716049452e-05,
      "loss": 0.7547,
      "step": 318
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9988637355376547e-05,
      "loss": 0.6799,
      "step": 319
    },
    {
      "epoch": 0.04,
      "learning_rate": 1.9988419935405042e-05,
      "loss": 0.851,
      "step": 320
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9988200456179775e-05,
      "loss": 0.7123,
      "step": 321
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9987978917745984e-05,
      "loss": 0.7709,
      "step": 322
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9987755320149352e-05,
      "loss": 0.8196,
      "step": 323
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9987529663435965e-05,
      "loss": 0.7224,
      "step": 324
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9987301947652354e-05,
      "loss": 0.762,
      "step": 325
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9987072172845462e-05,
      "loss": 0.7781,
      "step": 326
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998684033906266e-05,
      "loss": 0.6991,
      "step": 327
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998660644635175e-05,
      "loss": 0.8092,
      "step": 328
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9986370494760944e-05,
      "loss": 0.715,
      "step": 329
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998613248433889e-05,
      "loss": 0.788,
      "step": 330
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998589241513466e-05,
      "loss": 0.6618,
      "step": 331
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9985650287197743e-05,
      "loss": 0.6382,
      "step": 332
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998540610057806e-05,
      "loss": 0.7922,
      "step": 333
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998515985532595e-05,
      "loss": 0.7036,
      "step": 334
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9984911551492187e-05,
      "loss": 0.8629,
      "step": 335
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9984661189127958e-05,
      "loss": 0.8196,
      "step": 336
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9984408768284877e-05,
      "loss": 0.7839,
      "step": 337
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9984154289014985e-05,
      "loss": 0.7049,
      "step": 338
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998389775137075e-05,
      "loss": 0.701,
      "step": 339
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9983639155405056e-05,
      "loss": 0.7377,
      "step": 340
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998337850117122e-05,
      "loss": 0.7237,
      "step": 341
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998311578872298e-05,
      "loss": 0.7914,
      "step": 342
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998285101811449e-05,
      "loss": 0.6724,
      "step": 343
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998258418940035e-05,
      "loss": 0.6775,
      "step": 344
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9982315302635556e-05,
      "loss": 0.7695,
      "step": 345
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998204435787555e-05,
      "loss": 0.8021,
      "step": 346
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998177135517619e-05,
      "loss": 0.8102,
      "step": 347
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9981496294593764e-05,
      "loss": 0.6873,
      "step": 348
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9981219176184977e-05,
      "loss": 0.7889,
      "step": 349
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9980940000006956e-05,
      "loss": 0.9112,
      "step": 350
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9980658766117257e-05,
      "loss": 0.7645,
      "step": 351
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998037547457387e-05,
      "loss": 0.7602,
      "step": 352
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.998009012543519e-05,
      "loss": 0.7657,
      "step": 353
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997980271876005e-05,
      "loss": 0.6536,
      "step": 354
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9979513254607702e-05,
      "loss": 0.8176,
      "step": 355
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997922173303782e-05,
      "loss": 0.8218,
      "step": 356
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9978928154110515e-05,
      "loss": 0.6819,
      "step": 357
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.99786325178863e-05,
      "loss": 0.752,
      "step": 358
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9978334824426137e-05,
      "loss": 0.7418,
      "step": 359
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9978035073791386e-05,
      "loss": 0.7238,
      "step": 360
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9977733266043854e-05,
      "loss": 0.7792,
      "step": 361
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9977429401245764e-05,
      "loss": 0.7244,
      "step": 362
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9977123479459756e-05,
      "loss": 0.7251,
      "step": 363
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9976815500748907e-05,
      "loss": 0.6491,
      "step": 364
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9976505465176703e-05,
      "loss": 0.6275,
      "step": 365
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997619337280707e-05,
      "loss": 0.8063,
      "step": 366
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997587922370434e-05,
      "loss": 0.6579,
      "step": 367
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997556301793329e-05,
      "loss": 0.793,
      "step": 368
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997524475555911e-05,
      "loss": 0.8492,
      "step": 369
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997492443664741e-05,
      "loss": 0.7227,
      "step": 370
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997460206126422e-05,
      "loss": 0.6894,
      "step": 371
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997427762947602e-05,
      "loss": 0.7813,
      "step": 372
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9973951141349685e-05,
      "loss": 0.7216,
      "step": 373
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9973622596952526e-05,
      "loss": 0.7569,
      "step": 374
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997329199635228e-05,
      "loss": 0.7464,
      "step": 375
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9972959339617102e-05,
      "loss": 0.698,
      "step": 376
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9972624626815577e-05,
      "loss": 0.6687,
      "step": 377
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9972287858016704e-05,
      "loss": 0.7459,
      "step": 378
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9971949033289925e-05,
      "loss": 0.916,
      "step": 379
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997160815270508e-05,
      "loss": 0.7558,
      "step": 380
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9971265216332456e-05,
      "loss": 0.7608,
      "step": 381
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997092022424275e-05,
      "loss": 0.7445,
      "step": 382
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9970573176507088e-05,
      "loss": 0.7286,
      "step": 383
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.997022407319702e-05,
      "loss": 0.7001,
      "step": 384
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9969872914384515e-05,
      "loss": 0.7459,
      "step": 385
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.996951970014197e-05,
      "loss": 0.8781,
      "step": 386
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.996916443054221e-05,
      "loss": 0.6708,
      "step": 387
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9968807105658473e-05,
      "loss": 0.7645,
      "step": 388
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9968447725564427e-05,
      "loss": 0.8132,
      "step": 389
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9968086290334168e-05,
      "loss": 0.8698,
      "step": 390
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9967722800042208e-05,
      "loss": 0.6893,
      "step": 391
    },
    {
      "epoch": 0.05,
      "learning_rate": 1.9967357254763486e-05,
      "loss": 0.816,
      "step": 392
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9966989654573364e-05,
      "loss": 0.7066,
      "step": 393
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9966619999547628e-05,
      "loss": 0.706,
      "step": 394
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996624828976249e-05,
      "loss": 0.604,
      "step": 395
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9965874525294574e-05,
      "loss": 0.668,
      "step": 396
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996549870622095e-05,
      "loss": 0.7225,
      "step": 397
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996512083261909e-05,
      "loss": 0.7348,
      "step": 398
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9964740904566903e-05,
      "loss": 0.7336,
      "step": 399
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996435892214271e-05,
      "loss": 0.8511,
      "step": 400
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9963974885425267e-05,
      "loss": 0.748,
      "step": 401
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9963588794493747e-05,
      "loss": 0.7377,
      "step": 402
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996320064942775e-05,
      "loss": 0.7346,
      "step": 403
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9962810450307294e-05,
      "loss": 0.8184,
      "step": 404
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9962418197212828e-05,
      "loss": 0.6752,
      "step": 405
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9962023890225216e-05,
      "loss": 0.7869,
      "step": 406
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9961627529425756e-05,
      "loss": 0.7683,
      "step": 407
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9961229114896157e-05,
      "loss": 0.6139,
      "step": 408
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996082864671856e-05,
      "loss": 0.6752,
      "step": 409
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9960426124975528e-05,
      "loss": 0.7139,
      "step": 410
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996002154975005e-05,
      "loss": 0.6765,
      "step": 411
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995961492112553e-05,
      "loss": 0.7798,
      "step": 412
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.99592062391858e-05,
      "loss": 0.7332,
      "step": 413
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995879550401512e-05,
      "loss": 0.7529,
      "step": 414
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995838271569816e-05,
      "loss": 0.771,
      "step": 415
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9957967874320033e-05,
      "loss": 0.6318,
      "step": 416
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995755097996626e-05,
      "loss": 0.6953,
      "step": 417
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9957132032722787e-05,
      "loss": 0.7138,
      "step": 418
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9956711032675988e-05,
      "loss": 0.8456,
      "step": 419
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995628797991266e-05,
      "loss": 0.6596,
      "step": 420
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995586287452002e-05,
      "loss": 0.7498,
      "step": 421
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9955435716585704e-05,
      "loss": 0.6416,
      "step": 422
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9955006506197786e-05,
      "loss": 0.8103,
      "step": 423
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995457524344475e-05,
      "loss": 0.7207,
      "step": 424
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.99541419284155e-05,
      "loss": 0.8043,
      "step": 425
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995370656119938e-05,
      "loss": 0.718,
      "step": 426
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9953269141886143e-05,
      "loss": 0.7405,
      "step": 427
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995282967056597e-05,
      "loss": 0.6959,
      "step": 428
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9952388147329465e-05,
      "loss": 0.8138,
      "step": 429
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.995194457226765e-05,
      "loss": 0.7223,
      "step": 430
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9951498945471977e-05,
      "loss": 0.6994,
      "step": 431
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9951051267034325e-05,
      "loss": 0.7328,
      "step": 432
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9950601537046977e-05,
      "loss": 0.8317,
      "step": 433
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9950149755602657e-05,
      "loss": 0.8202,
      "step": 434
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9949695922794508e-05,
      "loss": 0.6833,
      "step": 435
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9949240038716092e-05,
      "loss": 0.6611,
      "step": 436
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9948782103461394e-05,
      "loss": 0.7254,
      "step": 437
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9948322117124826e-05,
      "loss": 0.7183,
      "step": 438
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.994786007980122e-05,
      "loss": 0.6383,
      "step": 439
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9947395991585833e-05,
      "loss": 0.6985,
      "step": 440
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9946929852574345e-05,
      "loss": 0.8166,
      "step": 441
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9946461662862854e-05,
      "loss": 0.7517,
      "step": 442
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9945991422547882e-05,
      "loss": 0.7313,
      "step": 443
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9945519131726376e-05,
      "loss": 0.6803,
      "step": 444
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.994504479049571e-05,
      "loss": 0.7046,
      "step": 445
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9944568398953675e-05,
      "loss": 0.7466,
      "step": 446
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9944089957198484e-05,
      "loss": 0.8122,
      "step": 447
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9943609465328772e-05,
      "loss": 0.7589,
      "step": 448
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9943126923443606e-05,
      "loss": 0.7457,
      "step": 449
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9942642331642465e-05,
      "loss": 0.8307,
      "step": 450
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.994215569002525e-05,
      "loss": 0.7924,
      "step": 451
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.99416669986923e-05,
      "loss": 0.7355,
      "step": 452
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9941176257744353e-05,
      "loss": 0.8279,
      "step": 453
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9940683467282592e-05,
      "loss": 0.6608,
      "step": 454
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9940188627408607e-05,
      "loss": 0.7281,
      "step": 455
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.993969173822442e-05,
      "loss": 0.8268,
      "step": 456
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9939192799832465e-05,
      "loss": 0.7955,
      "step": 457
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9938691812335613e-05,
      "loss": 0.7688,
      "step": 458
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9938188775837147e-05,
      "loss": 0.6568,
      "step": 459
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9937683690440778e-05,
      "loss": 0.6147,
      "step": 460
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.993717655625063e-05,
      "loss": 0.8315,
      "step": 461
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.993666737337126e-05,
      "loss": 0.7165,
      "step": 462
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.9936156141907645e-05,
      "loss": 0.7363,
      "step": 463
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9935642861965173e-05,
      "loss": 0.7883,
      "step": 464
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9935127533649678e-05,
      "loss": 0.6671,
      "step": 465
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.993461015706739e-05,
      "loss": 0.7097,
      "step": 466
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9934090732324983e-05,
      "loss": 0.854,
      "step": 467
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9933569259529537e-05,
      "loss": 0.7603,
      "step": 468
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9933045738788564e-05,
      "loss": 0.8307,
      "step": 469
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9932520170209994e-05,
      "loss": 0.7364,
      "step": 470
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9931992553902183e-05,
      "loss": 0.6773,
      "step": 471
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.99314628899739e-05,
      "loss": 0.644,
      "step": 472
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9930931178534353e-05,
      "loss": 0.635,
      "step": 473
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.993039741969315e-05,
      "loss": 0.7279,
      "step": 474
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992986161356034e-05,
      "loss": 0.853,
      "step": 475
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9929323760246387e-05,
      "loss": 0.6575,
      "step": 476
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992878385986218e-05,
      "loss": 0.6652,
      "step": 477
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9928241912519018e-05,
      "loss": 0.6701,
      "step": 478
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992769791832864e-05,
      "loss": 0.7913,
      "step": 479
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992715187740319e-05,
      "loss": 0.6755,
      "step": 480
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9926603789855247e-05,
      "loss": 0.7537,
      "step": 481
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9926053655797807e-05,
      "loss": 0.6784,
      "step": 482
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992550147534429e-05,
      "loss": 0.6803,
      "step": 483
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9924947248608532e-05,
      "loss": 0.8158,
      "step": 484
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9924390975704792e-05,
      "loss": 0.6999,
      "step": 485
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992383265674776e-05,
      "loss": 0.7302,
      "step": 486
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9923272291852537e-05,
      "loss": 0.6877,
      "step": 487
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992270988113465e-05,
      "loss": 0.7095,
      "step": 488
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9922145424710055e-05,
      "loss": 0.775,
      "step": 489
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992157892269511e-05,
      "loss": 0.7061,
      "step": 490
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.992101037520662e-05,
      "loss": 0.7333,
      "step": 491
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9920439782361792e-05,
      "loss": 0.7881,
      "step": 492
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.991986714427826e-05,
      "loss": 0.6403,
      "step": 493
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.991929246107409e-05,
      "loss": 0.7254,
      "step": 494
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9918715732867753e-05,
      "loss": 0.8712,
      "step": 495
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9918136959778152e-05,
      "loss": 0.8043,
      "step": 496
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9917556141924616e-05,
      "loss": 0.7552,
      "step": 497
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9916973279426874e-05,
      "loss": 0.8024,
      "step": 498
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9916388372405105e-05,
      "loss": 0.7057,
      "step": 499
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.991580142097989e-05,
      "loss": 0.7205,
      "step": 500
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9915212425272236e-05,
      "loss": 0.6533,
      "step": 501
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9914621385403577e-05,
      "loss": 0.7333,
      "step": 502
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.991402830149576e-05,
      "loss": 0.7523,
      "step": 503
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9913433173671063e-05,
      "loss": 0.7065,
      "step": 504
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9912836002052173e-05,
      "loss": 0.7382,
      "step": 505
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.991223678676221e-05,
      "loss": 0.6474,
      "step": 506
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9911635527924713e-05,
      "loss": 0.7266,
      "step": 507
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.991103222566363e-05,
      "loss": 0.703,
      "step": 508
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9910426880103353e-05,
      "loss": 0.819,
      "step": 509
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9909819491368677e-05,
      "loss": 0.7911,
      "step": 510
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.990921005958482e-05,
      "loss": 0.7474,
      "step": 511
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9908598584877428e-05,
      "loss": 0.7993,
      "step": 512
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9907985067372566e-05,
      "loss": 0.7892,
      "step": 513
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9907369507196722e-05,
      "loss": 0.8536,
      "step": 514
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9906751904476794e-05,
      "loss": 0.6915,
      "step": 515
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.990613225934012e-05,
      "loss": 0.8231,
      "step": 516
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.990551057191444e-05,
      "loss": 0.8005,
      "step": 517
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9904886842327925e-05,
      "loss": 0.8265,
      "step": 518
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.990426107070917e-05,
      "loss": 0.8231,
      "step": 519
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9903633257187186e-05,
      "loss": 0.6636,
      "step": 520
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.99030034018914e-05,
      "loss": 0.8177,
      "step": 521
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9902371504951673e-05,
      "loss": 0.7089,
      "step": 522
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9901737566498275e-05,
      "loss": 0.7773,
      "step": 523
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9901101586661898e-05,
      "loss": 0.7001,
      "step": 524
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9900463565573666e-05,
      "loss": 0.7633,
      "step": 525
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9899823503365113e-05,
      "loss": 0.7273,
      "step": 526
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9899181400168196e-05,
      "loss": 0.7355,
      "step": 527
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9898537256115293e-05,
      "loss": 0.581,
      "step": 528
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9897891071339202e-05,
      "loss": 0.7184,
      "step": 529
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.989724284597315e-05,
      "loss": 0.5757,
      "step": 530
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9896592580150772e-05,
      "loss": 0.735,
      "step": 531
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.989594027400613e-05,
      "loss": 0.7524,
      "step": 532
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9895285927673704e-05,
      "loss": 0.6419,
      "step": 533
    },
    {
      "epoch": 0.07,
      "learning_rate": 1.9894629541288402e-05,
      "loss": 0.7984,
      "step": 534
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.989397111498555e-05,
      "loss": 0.7354,
      "step": 535
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.989331064890088e-05,
      "loss": 0.7602,
      "step": 536
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9892648143170565e-05,
      "loss": 0.7206,
      "step": 537
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.989198359793119e-05,
      "loss": 0.7133,
      "step": 538
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9891317013319756e-05,
      "loss": 0.7832,
      "step": 539
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9890648389473695e-05,
      "loss": 0.587,
      "step": 540
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9889977726530843e-05,
      "loss": 0.657,
      "step": 541
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.988930502462948e-05,
      "loss": 0.7009,
      "step": 542
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9888630283908283e-05,
      "loss": 0.5727,
      "step": 543
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9887953504506364e-05,
      "loss": 0.6356,
      "step": 544
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9887274686563247e-05,
      "loss": 0.8267,
      "step": 545
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9886593830218884e-05,
      "loss": 0.6372,
      "step": 546
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.988591093561364e-05,
      "loss": 0.7322,
      "step": 547
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9885226002888306e-05,
      "loss": 0.7374,
      "step": 548
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9884539032184087e-05,
      "loss": 0.7075,
      "step": 549
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9883850023642615e-05,
      "loss": 0.7074,
      "step": 550
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9883158977405936e-05,
      "loss": 0.7489,
      "step": 551
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9882465893616523e-05,
      "loss": 0.6763,
      "step": 552
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9881770772417264e-05,
      "loss": 0.8352,
      "step": 553
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9881073613951464e-05,
      "loss": 0.738,
      "step": 554
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9880374418362853e-05,
      "loss": 0.6422,
      "step": 555
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9879673185795584e-05,
      "loss": 0.7551,
      "step": 556
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9878969916394225e-05,
      "loss": 0.8022,
      "step": 557
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9878264610303763e-05,
      "loss": 0.6393,
      "step": 558
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9877557267669604e-05,
      "loss": 0.6654,
      "step": 559
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9876847888637584e-05,
      "loss": 0.7485,
      "step": 560
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9876136473353947e-05,
      "loss": 0.7248,
      "step": 561
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9875423021965362e-05,
      "loss": 0.7261,
      "step": 562
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9874707534618916e-05,
      "loss": 0.6903,
      "step": 563
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.987399001146212e-05,
      "loss": 0.7734,
      "step": 564
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9873270452642894e-05,
      "loss": 0.6017,
      "step": 565
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9872548858309596e-05,
      "loss": 0.6411,
      "step": 566
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9871825228610987e-05,
      "loss": 0.779,
      "step": 567
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9871099563696253e-05,
      "loss": 0.7953,
      "step": 568
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9870371863715e-05,
      "loss": 0.7743,
      "step": 569
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9869642128817254e-05,
      "loss": 0.7002,
      "step": 570
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.986891035915346e-05,
      "loss": 0.7975,
      "step": 571
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9868176554874487e-05,
      "loss": 0.7451,
      "step": 572
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9867440716131613e-05,
      "loss": 0.7066,
      "step": 573
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9866702843076547e-05,
      "loss": 0.7826,
      "step": 574
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9865962935861406e-05,
      "loss": 0.6743,
      "step": 575
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9865220994638737e-05,
      "loss": 0.771,
      "step": 576
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9864477019561497e-05,
      "loss": 0.7694,
      "step": 577
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.986373101078307e-05,
      "loss": 0.8005,
      "step": 578
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9862982968457262e-05,
      "loss": 0.6632,
      "step": 579
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.986223289273828e-05,
      "loss": 0.8139,
      "step": 580
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9861480783780774e-05,
      "loss": 0.7868,
      "step": 581
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9860726641739797e-05,
      "loss": 0.7619,
      "step": 582
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9859970466770822e-05,
      "loss": 0.7032,
      "step": 583
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.985921225902975e-05,
      "loss": 0.7782,
      "step": 584
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.98584520186729e-05,
      "loss": 0.6777,
      "step": 585
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9857689745857e-05,
      "loss": 0.7803,
      "step": 586
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9856925440739206e-05,
      "loss": 0.696,
      "step": 587
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9856159103477085e-05,
      "loss": 0.8318,
      "step": 588
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9855390734228636e-05,
      "loss": 0.6984,
      "step": 589
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9854620333152267e-05,
      "loss": 0.6951,
      "step": 590
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9853847900406805e-05,
      "loss": 0.6746,
      "step": 591
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.98530734361515e-05,
      "loss": 0.7568,
      "step": 592
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9852296940546014e-05,
      "loss": 0.7288,
      "step": 593
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.985151841375044e-05,
      "loss": 0.6787,
      "step": 594
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9850737855925276e-05,
      "loss": 0.7925,
      "step": 595
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.984995526723145e-05,
      "loss": 0.6212,
      "step": 596
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9849170647830298e-05,
      "loss": 0.6833,
      "step": 597
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9848383997883584e-05,
      "loss": 0.795,
      "step": 598
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9847595317553488e-05,
      "loss": 0.632,
      "step": 599
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9846804607002606e-05,
      "loss": 0.6838,
      "step": 600
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9846011866393955e-05,
      "loss": 0.8101,
      "step": 601
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9845217095890968e-05,
      "loss": 0.6831,
      "step": 602
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.9844420295657498e-05,
      "loss": 0.7023,
      "step": 603
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.984362146585782e-05,
      "loss": 0.6884,
      "step": 604
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.984282060665662e-05,
      "loss": 0.8122,
      "step": 605
    },
    {
      "epoch": 0.08,
      "learning_rate": 1.984201771821901e-05,
      "loss": 0.6884,
      "step": 606
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.984121280071051e-05,
      "loss": 0.7553,
      "step": 607
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9840405854297072e-05,
      "loss": 0.7767,
      "step": 608
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.983959687914506e-05,
      "loss": 0.6626,
      "step": 609
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9838785875421253e-05,
      "loss": 0.7005,
      "step": 610
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.983797284329285e-05,
      "loss": 0.6616,
      "step": 611
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.983715778292747e-05,
      "loss": 0.5906,
      "step": 612
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9836340694493147e-05,
      "loss": 0.7771,
      "step": 613
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9835521578158345e-05,
      "loss": 0.7353,
      "step": 614
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.983470043409192e-05,
      "loss": 0.7931,
      "step": 615
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9833877262463174e-05,
      "loss": 0.6074,
      "step": 616
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9833052063441816e-05,
      "loss": 0.6434,
      "step": 617
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9832224837197965e-05,
      "loss": 0.7114,
      "step": 618
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9831395583902173e-05,
      "loss": 0.6943,
      "step": 619
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9830564303725396e-05,
      "loss": 0.7295,
      "step": 620
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.982973099683902e-05,
      "loss": 0.7101,
      "step": 621
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9828895663414838e-05,
      "loss": 0.7278,
      "step": 622
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9828058303625068e-05,
      "loss": 0.6603,
      "step": 623
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9827218917642344e-05,
      "loss": 0.6549,
      "step": 624
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9826377505639717e-05,
      "loss": 0.741,
      "step": 625
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9825534067790654e-05,
      "loss": 0.8534,
      "step": 626
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9824688604269043e-05,
      "loss": 0.8343,
      "step": 627
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.982384111524919e-05,
      "loss": 0.7148,
      "step": 628
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9822991600905812e-05,
      "loss": 0.7419,
      "step": 629
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9822140061414057e-05,
      "loss": 0.8039,
      "step": 630
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.982128649694947e-05,
      "loss": 0.7149,
      "step": 631
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9820430907688038e-05,
      "loss": 0.8066,
      "step": 632
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9819573293806146e-05,
      "loss": 0.6187,
      "step": 633
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.98187136554806e-05,
      "loss": 0.6389,
      "step": 634
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9817851992888634e-05,
      "loss": 0.7393,
      "step": 635
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9816988306207886e-05,
      "loss": 0.6997,
      "step": 636
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.981612259561642e-05,
      "loss": 0.7066,
      "step": 637
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9815254861292714e-05,
      "loss": 0.7133,
      "step": 638
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9814385103415662e-05,
      "loss": 0.6801,
      "step": 639
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9813513322164582e-05,
      "loss": 0.7227,
      "step": 640
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.98126395177192e-05,
      "loss": 0.8487,
      "step": 641
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.981176369025966e-05,
      "loss": 0.5461,
      "step": 642
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.981088583996653e-05,
      "loss": 0.6826,
      "step": 643
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9810005967020797e-05,
      "loss": 0.7904,
      "step": 644
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9809124071603848e-05,
      "loss": 0.7406,
      "step": 645
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9808240153897508e-05,
      "loss": 0.6557,
      "step": 646
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9807354214084e-05,
      "loss": 0.7746,
      "step": 647
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9806466252345983e-05,
      "loss": 0.6284,
      "step": 648
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9805576268866513e-05,
      "loss": 0.6149,
      "step": 649
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9804684263829076e-05,
      "loss": 0.7962,
      "step": 650
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9803790237417576e-05,
      "loss": 0.7856,
      "step": 651
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9802894189816326e-05,
      "loss": 0.6926,
      "step": 652
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9801996121210056e-05,
      "loss": 0.8111,
      "step": 653
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.980109603178392e-05,
      "loss": 0.6301,
      "step": 654
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.980019392172348e-05,
      "loss": 0.7709,
      "step": 655
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9799289791214725e-05,
      "loss": 0.5936,
      "step": 656
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9798383640444044e-05,
      "loss": 0.6661,
      "step": 657
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9797475469598267e-05,
      "loss": 0.8216,
      "step": 658
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9796565278864612e-05,
      "loss": 0.7949,
      "step": 659
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9795653068430737e-05,
      "loss": 0.7861,
      "step": 660
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.97947388384847e-05,
      "loss": 0.6918,
      "step": 661
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9793822589214994e-05,
      "loss": 0.7698,
      "step": 662
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9792904320810506e-05,
      "loss": 0.7417,
      "step": 663
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.979198403346055e-05,
      "loss": 0.6908,
      "step": 664
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.979106172735486e-05,
      "loss": 0.7267,
      "step": 665
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9790137402683583e-05,
      "loss": 0.7518,
      "step": 666
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.978921105963728e-05,
      "loss": 0.7677,
      "step": 667
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.978828269840693e-05,
      "loss": 0.7504,
      "step": 668
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9787352319183927e-05,
      "loss": 0.8146,
      "step": 669
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9786419922160083e-05,
      "loss": 0.7193,
      "step": 670
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9785485507527625e-05,
      "loss": 0.6841,
      "step": 671
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9784549075479198e-05,
      "loss": 0.6818,
      "step": 672
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9783610626207855e-05,
      "loss": 0.7036,
      "step": 673
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9782670159907075e-05,
      "loss": 0.6606,
      "step": 674
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.9781727676770744e-05,
      "loss": 0.72,
      "step": 675
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.978078317699317e-05,
      "loss": 0.8072,
      "step": 676
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.977983666076908e-05,
      "loss": 0.8155,
      "step": 677
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9778888128293604e-05,
      "loss": 0.6002,
      "step": 678
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9777937579762303e-05,
      "loss": 0.7294,
      "step": 679
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.977698501537114e-05,
      "loss": 0.7481,
      "step": 680
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9776030435316504e-05,
      "loss": 0.7141,
      "step": 681
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.977507383979519e-05,
      "loss": 0.707,
      "step": 682
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9774115229004416e-05,
      "loss": 0.7521,
      "step": 683
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9773154603141814e-05,
      "loss": 0.7995,
      "step": 684
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.977219196240543e-05,
      "loss": 0.6814,
      "step": 685
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9771227306993727e-05,
      "loss": 0.7734,
      "step": 686
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9770260637105582e-05,
      "loss": 0.6818,
      "step": 687
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9769291952940288e-05,
      "loss": 0.7609,
      "step": 688
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.976832125469755e-05,
      "loss": 0.7422,
      "step": 689
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9767348542577496e-05,
      "loss": 0.7756,
      "step": 690
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.976637381678066e-05,
      "loss": 0.7637,
      "step": 691
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9765397077507998e-05,
      "loss": 0.7351,
      "step": 692
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9764418324960876e-05,
      "loss": 0.7141,
      "step": 693
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.976343755934108e-05,
      "loss": 0.7441,
      "step": 694
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9762454780850807e-05,
      "loss": 0.7413,
      "step": 695
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.976146998969267e-05,
      "loss": 0.6832,
      "step": 696
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.97604831860697e-05,
      "loss": 0.7523,
      "step": 697
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9759494370185344e-05,
      "loss": 0.76,
      "step": 698
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.975850354224345e-05,
      "loss": 0.7616,
      "step": 699
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9757510702448302e-05,
      "loss": 0.7419,
      "step": 700
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.975651585100458e-05,
      "loss": 0.6605,
      "step": 701
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.975551898811739e-05,
      "loss": 0.735,
      "step": 702
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9754520113992254e-05,
      "loss": 0.7232,
      "step": 703
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9753519228835097e-05,
      "loss": 0.7451,
      "step": 704
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9752516332852264e-05,
      "loss": 0.8186,
      "step": 705
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9751511426250522e-05,
      "loss": 0.7289,
      "step": 706
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9750504509237046e-05,
      "loss": 0.6893,
      "step": 707
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9749495582019422e-05,
      "loss": 0.6869,
      "step": 708
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9748484644805663e-05,
      "loss": 0.6587,
      "step": 709
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9747471697804178e-05,
      "loss": 0.7977,
      "step": 710
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9746456741223805e-05,
      "loss": 0.7513,
      "step": 711
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.974543977527379e-05,
      "loss": 0.6936,
      "step": 712
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9744420800163797e-05,
      "loss": 0.6682,
      "step": 713
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9743399816103904e-05,
      "loss": 0.7831,
      "step": 714
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9742376823304593e-05,
      "loss": 0.7183,
      "step": 715
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.974135182197678e-05,
      "loss": 0.7215,
      "step": 716
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9740324812331776e-05,
      "loss": 0.7492,
      "step": 717
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9739295794581315e-05,
      "loss": 0.7499,
      "step": 718
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.973826476893754e-05,
      "loss": 0.8347,
      "step": 719
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.973723173561302e-05,
      "loss": 0.7616,
      "step": 720
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9736196694820718e-05,
      "loss": 0.7086,
      "step": 721
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9735159646774035e-05,
      "loss": 0.6549,
      "step": 722
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9734120591686764e-05,
      "loss": 0.747,
      "step": 723
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9733079529773123e-05,
      "loss": 0.5775,
      "step": 724
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9732036461247745e-05,
      "loss": 0.6889,
      "step": 725
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.973099138632567e-05,
      "loss": 0.7401,
      "step": 726
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9729944305222355e-05,
      "loss": 0.7376,
      "step": 727
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.972889521815367e-05,
      "loss": 0.7883,
      "step": 728
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9727844125335904e-05,
      "loss": 0.7659,
      "step": 729
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9726791026985746e-05,
      "loss": 0.7188,
      "step": 730
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.972573592332031e-05,
      "loss": 0.7502,
      "step": 731
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.972467881455713e-05,
      "loss": 0.6269,
      "step": 732
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.972361970091413e-05,
      "loss": 0.6874,
      "step": 733
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9722558582609673e-05,
      "loss": 0.6738,
      "step": 734
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9721495459862516e-05,
      "loss": 0.7542,
      "step": 735
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9720430332891836e-05,
      "loss": 0.8009,
      "step": 736
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.971936320191723e-05,
      "loss": 0.72,
      "step": 737
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9718294067158695e-05,
      "loss": 0.6368,
      "step": 738
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9717222928836657e-05,
      "loss": 0.7644,
      "step": 739
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.971614978717194e-05,
      "loss": 0.8039,
      "step": 740
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9715074642385785e-05,
      "loss": 0.827,
      "step": 741
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9713997494699855e-05,
      "loss": 0.7618,
      "step": 742
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9712918344336215e-05,
      "loss": 0.6763,
      "step": 743
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9711837191517352e-05,
      "loss": 0.7553,
      "step": 744
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9710754036466153e-05,
      "loss": 0.7659,
      "step": 745
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.970966887940593e-05,
      "loss": 0.7837,
      "step": 746
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.9708581720560406e-05,
      "loss": 0.7649,
      "step": 747
    },
    {
      "epoch": 0.1,
      "learning_rate": 1.970749256015371e-05,
      "loss": 0.6977,
      "step": 748
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9706401398410388e-05,
      "loss": 0.7239,
      "step": 749
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.97053082355554e-05,
      "loss": 0.7102,
      "step": 750
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.970421307181412e-05,
      "loss": 0.6709,
      "step": 751
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9703115907412324e-05,
      "loss": 0.8122,
      "step": 752
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9702016742576213e-05,
      "loss": 0.6417,
      "step": 753
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9700915577532397e-05,
      "loss": 0.8497,
      "step": 754
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.969981241250789e-05,
      "loss": 0.7386,
      "step": 755
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9698707247730134e-05,
      "loss": 0.8355,
      "step": 756
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9697600083426964e-05,
      "loss": 0.7012,
      "step": 757
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9696490919826647e-05,
      "loss": 0.7128,
      "step": 758
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9695379757157846e-05,
      "loss": 0.8504,
      "step": 759
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9694266595649648e-05,
      "loss": 0.6454,
      "step": 760
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9693151435531544e-05,
      "loss": 0.6693,
      "step": 761
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9692034277033442e-05,
      "loss": 0.8101,
      "step": 762
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9690915120385655e-05,
      "loss": 0.7559,
      "step": 763
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9689793965818916e-05,
      "loss": 0.7257,
      "step": 764
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9688670813564373e-05,
      "loss": 0.6787,
      "step": 765
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.968754566385357e-05,
      "loss": 0.776,
      "step": 766
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9686418516918476e-05,
      "loss": 0.8943,
      "step": 767
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.968528937299147e-05,
      "loss": 0.7827,
      "step": 768
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.968415823230534e-05,
      "loss": 0.8577,
      "step": 769
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9683025095093285e-05,
      "loss": 0.6913,
      "step": 770
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.968188996158892e-05,
      "loss": 0.6416,
      "step": 771
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9680752832026266e-05,
      "loss": 0.7116,
      "step": 772
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.967961370663976e-05,
      "loss": 0.6476,
      "step": 773
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9678472585664246e-05,
      "loss": 0.7006,
      "step": 774
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.967732946933499e-05,
      "loss": 0.7592,
      "step": 775
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9676184357887652e-05,
      "loss": 0.6582,
      "step": 776
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.967503725155832e-05,
      "loss": 0.7314,
      "step": 777
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9673888150583483e-05,
      "loss": 0.6698,
      "step": 778
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9672737055200043e-05,
      "loss": 0.8271,
      "step": 779
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.967158396564532e-05,
      "loss": 0.6508,
      "step": 780
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9670428882157032e-05,
      "loss": 0.7388,
      "step": 781
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.966927180497332e-05,
      "loss": 0.7873,
      "step": 782
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9668112734332732e-05,
      "loss": 0.7692,
      "step": 783
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9666951670474224e-05,
      "loss": 0.6702,
      "step": 784
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.966578861363717e-05,
      "loss": 0.6948,
      "step": 785
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9664623564061348e-05,
      "loss": 0.7007,
      "step": 786
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9663456521986953e-05,
      "loss": 0.6427,
      "step": 787
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9662287487654582e-05,
      "loss": 0.7697,
      "step": 788
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.966111646130525e-05,
      "loss": 0.7232,
      "step": 789
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.965994344318038e-05,
      "loss": 0.7501,
      "step": 790
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9658768433521808e-05,
      "loss": 0.7525,
      "step": 791
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.965759143257178e-05,
      "loss": 0.8423,
      "step": 792
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9656412440572946e-05,
      "loss": 0.7838,
      "step": 793
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9655231457768374e-05,
      "loss": 0.7807,
      "step": 794
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9654048484401544e-05,
      "loss": 0.7102,
      "step": 795
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9652863520716335e-05,
      "loss": 0.6724,
      "step": 796
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9651676566957056e-05,
      "loss": 0.7661,
      "step": 797
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9650487623368404e-05,
      "loss": 0.7526,
      "step": 798
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9649296690195497e-05,
      "loss": 0.6353,
      "step": 799
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9648103767683867e-05,
      "loss": 0.6152,
      "step": 800
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9646908856079454e-05,
      "loss": 0.6956,
      "step": 801
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.96457119556286e-05,
      "loss": 0.7887,
      "step": 802
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9644513066578064e-05,
      "loss": 0.7788,
      "step": 803
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9643312189175015e-05,
      "loss": 0.7839,
      "step": 804
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.964210932366703e-05,
      "loss": 0.7268,
      "step": 805
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.96409044703021e-05,
      "loss": 0.7595,
      "step": 806
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9639697629328617e-05,
      "loss": 0.7807,
      "step": 807
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.963848880099539e-05,
      "loss": 0.616,
      "step": 808
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9637277985551643e-05,
      "loss": 0.7005,
      "step": 809
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9636065183246993e-05,
      "loss": 0.7859,
      "step": 810
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.963485039433148e-05,
      "loss": 0.7876,
      "step": 811
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9633633619055552e-05,
      "loss": 0.7138,
      "step": 812
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.963241485767006e-05,
      "loss": 0.8097,
      "step": 813
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9631194110426275e-05,
      "loss": 0.6761,
      "step": 814
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9629971377575864e-05,
      "loss": 0.7922,
      "step": 815
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9628746659370917e-05,
      "loss": 0.7527,
      "step": 816
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9627519956063926e-05,
      "loss": 0.713,
      "step": 817
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9626291267907787e-05,
      "loss": 0.6344,
      "step": 818
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.962506059515582e-05,
      "loss": 0.7671,
      "step": 819
    },
    {
      "epoch": 0.11,
      "learning_rate": 1.9623827938061736e-05,
      "loss": 0.7646,
      "step": 820
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9622593296879676e-05,
      "loss": 0.7644,
      "step": 821
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.962135667186417e-05,
      "loss": 0.6932,
      "step": 822
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9620118063270167e-05,
      "loss": 0.8374,
      "step": 823
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.961887747135303e-05,
      "loss": 0.6239,
      "step": 824
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9617634896368516e-05,
      "loss": 0.7554,
      "step": 825
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9616390338572805e-05,
      "loss": 0.7616,
      "step": 826
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9615143798222476e-05,
      "loss": 0.703,
      "step": 827
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9613895275574527e-05,
      "loss": 0.7597,
      "step": 828
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.961264477088635e-05,
      "loss": 0.782,
      "step": 829
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9611392284415762e-05,
      "loss": 0.76,
      "step": 830
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9610137816420975e-05,
      "loss": 0.649,
      "step": 831
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.960888136716062e-05,
      "loss": 0.7483,
      "step": 832
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.960762293689373e-05,
      "loss": 0.7244,
      "step": 833
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9606362525879747e-05,
      "loss": 0.7106,
      "step": 834
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9605100134378524e-05,
      "loss": 0.7396,
      "step": 835
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.960383576265032e-05,
      "loss": 0.7086,
      "step": 836
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.96025694109558e-05,
      "loss": 0.7465,
      "step": 837
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.960130107955605e-05,
      "loss": 0.7232,
      "step": 838
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9600030768712545e-05,
      "loss": 0.763,
      "step": 839
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.959875847868718e-05,
      "loss": 0.8087,
      "step": 840
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9597484209742257e-05,
      "loss": 0.6691,
      "step": 841
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9596207962140483e-05,
      "loss": 0.7403,
      "step": 842
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9594929736144978e-05,
      "loss": 0.6923,
      "step": 843
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.959364953201926e-05,
      "loss": 0.7673,
      "step": 844
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9592367350027264e-05,
      "loss": 0.7885,
      "step": 845
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.959108319043333e-05,
      "loss": 0.7047,
      "step": 846
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9589797053502208e-05,
      "loss": 0.7052,
      "step": 847
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.958850893949905e-05,
      "loss": 0.6378,
      "step": 848
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9587218848689426e-05,
      "loss": 0.8196,
      "step": 849
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9585926781339294e-05,
      "loss": 0.6701,
      "step": 850
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.958463273771504e-05,
      "loss": 0.7743,
      "step": 851
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9583336718083448e-05,
      "loss": 0.6237,
      "step": 852
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9582038722711713e-05,
      "loss": 0.7508,
      "step": 853
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.958073875186743e-05,
      "loss": 0.763,
      "step": 854
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.957943680581861e-05,
      "loss": 0.7408,
      "step": 855
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.957813288483367e-05,
      "loss": 0.7361,
      "step": 856
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9576826989181423e-05,
      "loss": 0.732,
      "step": 857
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9575519119131106e-05,
      "loss": 0.7253,
      "step": 858
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.957420927495235e-05,
      "loss": 0.703,
      "step": 859
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.95728974569152e-05,
      "loss": 0.7251,
      "step": 860
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.957158366529011e-05,
      "loss": 0.6826,
      "step": 861
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.957026790034793e-05,
      "loss": 0.7114,
      "step": 862
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9568950162359924e-05,
      "loss": 0.755,
      "step": 863
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.956763045159777e-05,
      "loss": 0.7574,
      "step": 864
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9566308768333532e-05,
      "loss": 0.7054,
      "step": 865
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.956498511283971e-05,
      "loss": 0.6203,
      "step": 866
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9563659485389176e-05,
      "loss": 0.6893,
      "step": 867
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.956233188625524e-05,
      "loss": 0.69,
      "step": 868
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9561002315711602e-05,
      "loss": 0.7969,
      "step": 869
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9559670774032368e-05,
      "loss": 0.8489,
      "step": 870
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.955833726149206e-05,
      "loss": 0.6704,
      "step": 871
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9557001778365598e-05,
      "loss": 0.665,
      "step": 872
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9555664324928308e-05,
      "loss": 0.6911,
      "step": 873
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9554324901455928e-05,
      "loss": 0.8369,
      "step": 874
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9552983508224597e-05,
      "loss": 0.7022,
      "step": 875
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9551640145510865e-05,
      "loss": 0.6394,
      "step": 876
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9550294813591685e-05,
      "loss": 0.7167,
      "step": 877
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9548947512744415e-05,
      "loss": 0.6235,
      "step": 878
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9547598243246816e-05,
      "loss": 0.7832,
      "step": 879
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9546247005377065e-05,
      "loss": 0.6586,
      "step": 880
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9544893799413738e-05,
      "loss": 0.7231,
      "step": 881
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9543538625635815e-05,
      "loss": 0.6779,
      "step": 882
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9542181484322684e-05,
      "loss": 0.6955,
      "step": 883
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.954082237575414e-05,
      "loss": 0.6598,
      "step": 884
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9539461300210382e-05,
      "loss": 0.7276,
      "step": 885
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.953809825797202e-05,
      "loss": 0.705,
      "step": 886
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9536733249320058e-05,
      "loss": 0.7111,
      "step": 887
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.953536627453591e-05,
      "loss": 0.6699,
      "step": 888
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9533997333901406e-05,
      "loss": 0.6804,
      "step": 889
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.953262642769876e-05,
      "loss": 0.6759,
      "step": 890
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9531253556210617e-05,
      "loss": 0.7688,
      "step": 891
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9529878719720006e-05,
      "loss": 0.718,
      "step": 892
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9528501918510372e-05,
      "loss": 0.8155,
      "step": 893
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9527123152865562e-05,
      "loss": 0.7238,
      "step": 894
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9525742423069823e-05,
      "loss": 0.7347,
      "step": 895
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9524359729407816e-05,
      "loss": 0.7049,
      "step": 896
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9522975072164603e-05,
      "loss": 0.7197,
      "step": 897
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9521588451625652e-05,
      "loss": 0.6601,
      "step": 898
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.952019986807683e-05,
      "loss": 0.7673,
      "step": 899
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9518809321804417e-05,
      "loss": 0.8204,
      "step": 900
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9517416813095093e-05,
      "loss": 0.7274,
      "step": 901
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9516022342235942e-05,
      "loss": 0.6706,
      "step": 902
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9514625909514454e-05,
      "loss": 0.762,
      "step": 903
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9513227515218526e-05,
      "loss": 0.7516,
      "step": 904
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9511827159636453e-05,
      "loss": 0.7718,
      "step": 905
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9510424843056935e-05,
      "loss": 0.7557,
      "step": 906
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.950902056576909e-05,
      "loss": 0.7077,
      "step": 907
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9507614328062424e-05,
      "loss": 0.7564,
      "step": 908
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.950620613022685e-05,
      "loss": 0.5927,
      "step": 909
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.950479597255269e-05,
      "loss": 0.7214,
      "step": 910
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.950338385533067e-05,
      "loss": 0.6803,
      "step": 911
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9501969778851914e-05,
      "loss": 0.6686,
      "step": 912
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.950055374340796e-05,
      "loss": 0.7359,
      "step": 913
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9499135749290732e-05,
      "loss": 0.6767,
      "step": 914
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9497715796792583e-05,
      "loss": 0.65,
      "step": 915
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9496293886206245e-05,
      "loss": 0.6798,
      "step": 916
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9494870017824877e-05,
      "loss": 0.7028,
      "step": 917
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9493444191942015e-05,
      "loss": 0.6947,
      "step": 918
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.949201640885163e-05,
      "loss": 0.7167,
      "step": 919
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9490586668848065e-05,
      "loss": 0.597,
      "step": 920
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9489154972226084e-05,
      "loss": 0.7638,
      "step": 921
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.948772131928086e-05,
      "loss": 0.7611,
      "step": 922
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9486285710307954e-05,
      "loss": 0.7181,
      "step": 923
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9484848145603335e-05,
      "loss": 0.6812,
      "step": 924
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.948340862546338e-05,
      "loss": 0.7967,
      "step": 925
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.948196715018487e-05,
      "loss": 0.6434,
      "step": 926
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9480523720064982e-05,
      "loss": 0.7598,
      "step": 927
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9479078335401297e-05,
      "loss": 0.7555,
      "step": 928
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9477630996491806e-05,
      "loss": 0.6963,
      "step": 929
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9476181703634897e-05,
      "loss": 0.6532,
      "step": 930
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9474730457129357e-05,
      "loss": 0.7561,
      "step": 931
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.947327725727439e-05,
      "loss": 0.838,
      "step": 932
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.947182210436959e-05,
      "loss": 0.7251,
      "step": 933
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9470364998714953e-05,
      "loss": 0.7647,
      "step": 934
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9468905940610887e-05,
      "loss": 0.6641,
      "step": 935
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9467444930358197e-05,
      "loss": 0.8279,
      "step": 936
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9465981968258084e-05,
      "loss": 0.7812,
      "step": 937
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.946451705461217e-05,
      "loss": 0.7894,
      "step": 938
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.946305018972246e-05,
      "loss": 0.6938,
      "step": 939
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9461581373891373e-05,
      "loss": 0.7174,
      "step": 940
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.946011060742172e-05,
      "loss": 0.8325,
      "step": 941
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9458637890616724e-05,
      "loss": 0.724,
      "step": 942
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.945716322378001e-05,
      "loss": 0.642,
      "step": 943
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9455686607215595e-05,
      "loss": 0.7371,
      "step": 944
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9454208041227905e-05,
      "loss": 0.663,
      "step": 945
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9452727526121774e-05,
      "loss": 0.8141,
      "step": 946
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.945124506220242e-05,
      "loss": 0.6257,
      "step": 947
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9449760649775486e-05,
      "loss": 0.605,
      "step": 948
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9448274289146996e-05,
      "loss": 0.792,
      "step": 949
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.944678598062339e-05,
      "loss": 0.7337,
      "step": 950
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9445295724511496e-05,
      "loss": 0.6649,
      "step": 951
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.944380352111856e-05,
      "loss": 0.7372,
      "step": 952
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9442309370752216e-05,
      "loss": 0.6804,
      "step": 953
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9440813273720504e-05,
      "loss": 0.7484,
      "step": 954
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9439315230331867e-05,
      "loss": 0.6878,
      "step": 955
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.943781524089515e-05,
      "loss": 0.7594,
      "step": 956
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9436313305719593e-05,
      "loss": 0.8076,
      "step": 957
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9434809425114842e-05,
      "loss": 0.8147,
      "step": 958
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9433303599390943e-05,
      "loss": 0.6236,
      "step": 959
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9431795828858346e-05,
      "loss": 0.55,
      "step": 960
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9430286113827893e-05,
      "loss": 0.6743,
      "step": 961
    },
    {
      "epoch": 0.13,
      "learning_rate": 1.9428774454610845e-05,
      "loss": 0.6841,
      "step": 962
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9427260851518837e-05,
      "loss": 0.7591,
      "step": 963
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.942574530486393e-05,
      "loss": 0.7392,
      "step": 964
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.942422781495857e-05,
      "loss": 0.7202,
      "step": 965
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9422708382115612e-05,
      "loss": 0.7695,
      "step": 966
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.942118700664831e-05,
      "loss": 0.7883,
      "step": 967
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9419663688870316e-05,
      "loss": 0.7474,
      "step": 968
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.941813842909568e-05,
      "loss": 0.7685,
      "step": 969
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9416611227638854e-05,
      "loss": 0.653,
      "step": 970
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.94150820848147e-05,
      "loss": 0.7126,
      "step": 971
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9413551000938468e-05,
      "loss": 0.6903,
      "step": 972
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9412017976325814e-05,
      "loss": 0.7568,
      "step": 973
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.941048301129279e-05,
      "loss": 0.7944,
      "step": 974
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9408946106155853e-05,
      "loss": 0.7542,
      "step": 975
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9407407261231855e-05,
      "loss": 0.7871,
      "step": 976
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.940586647683806e-05,
      "loss": 0.6909,
      "step": 977
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.940432375329211e-05,
      "loss": 0.7634,
      "step": 978
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.940277909091206e-05,
      "loss": 0.6668,
      "step": 979
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9401232490016374e-05,
      "loss": 0.6388,
      "step": 980
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.93996839509239e-05,
      "loss": 0.7645,
      "step": 981
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.939813347395389e-05,
      "loss": 0.7692,
      "step": 982
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9396581059426e-05,
      "loss": 0.7594,
      "step": 983
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9395026707660277e-05,
      "loss": 0.7191,
      "step": 984
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9393470418977174e-05,
      "loss": 0.6939,
      "step": 985
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9391912193697545e-05,
      "loss": 0.6845,
      "step": 986
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9390352032142642e-05,
      "loss": 0.661,
      "step": 987
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9388789934634107e-05,
      "loss": 0.6907,
      "step": 988
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9387225901493996e-05,
      "loss": 0.628,
      "step": 989
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.938565993304475e-05,
      "loss": 0.8005,
      "step": 990
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.938409202960922e-05,
      "loss": 0.6979,
      "step": 991
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.938252219151065e-05,
      "loss": 0.7301,
      "step": 992
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.938095041907268e-05,
      "loss": 0.691,
      "step": 993
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9379376712619363e-05,
      "loss": 0.785,
      "step": 994
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9377801072475133e-05,
      "loss": 0.7705,
      "step": 995
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.937622349896483e-05,
      "loss": 0.6859,
      "step": 996
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9374643992413698e-05,
      "loss": 0.8002,
      "step": 997
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.937306255314737e-05,
      "loss": 0.7029,
      "step": 998
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9371479181491888e-05,
      "loss": 0.8288,
      "step": 999
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.936989387777368e-05,
      "loss": 0.7038,
      "step": 1000
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.936830664231958e-05,
      "loss": 0.7571,
      "step": 1001
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9366717475456824e-05,
      "loss": 0.8144,
      "step": 1002
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9365126377513037e-05,
      "loss": 0.7445,
      "step": 1003
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.936353334881624e-05,
      "loss": 0.7567,
      "step": 1004
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.936193838969487e-05,
      "loss": 0.7457,
      "step": 1005
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9360341500477745e-05,
      "loss": 0.6846,
      "step": 1006
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.935874268149409e-05,
      "loss": 0.7526,
      "step": 1007
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9357141933073514e-05,
      "loss": 0.7564,
      "step": 1008
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9355539255546047e-05,
      "loss": 0.6771,
      "step": 1009
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9353934649242095e-05,
      "loss": 0.7092,
      "step": 1010
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9352328114492472e-05,
      "loss": 0.6777,
      "step": 1011
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.935071965162839e-05,
      "loss": 0.705,
      "step": 1012
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9349109260981455e-05,
      "loss": 0.7903,
      "step": 1013
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9347496942883666e-05,
      "loss": 0.6144,
      "step": 1014
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9345882697667436e-05,
      "loss": 0.6952,
      "step": 1015
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9344266525665558e-05,
      "loss": 0.7325,
      "step": 1016
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.934264842721123e-05,
      "loss": 0.6796,
      "step": 1017
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9341028402638043e-05,
      "loss": 0.7512,
      "step": 1018
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.933940645227999e-05,
      "loss": 0.7898,
      "step": 1019
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.933778257647146e-05,
      "loss": 0.7503,
      "step": 1020
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9336156775547242e-05,
      "loss": 0.72,
      "step": 1021
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9334529049842507e-05,
      "loss": 0.6261,
      "step": 1022
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9332899399692845e-05,
      "loss": 0.7765,
      "step": 1023
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9331267825434223e-05,
      "loss": 0.8053,
      "step": 1024
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9329634327403017e-05,
      "loss": 0.8015,
      "step": 1025
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9327998905935998e-05,
      "loss": 0.5917,
      "step": 1026
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9326361561370325e-05,
      "loss": 0.814,
      "step": 1027
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.932472229404356e-05,
      "loss": 0.637,
      "step": 1028
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9323081104293665e-05,
      "loss": 0.7515,
      "step": 1029
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9321437992458996e-05,
      "loss": 0.694,
      "step": 1030
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.93197929588783e-05,
      "loss": 0.6951,
      "step": 1031
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9318146003890727e-05,
      "loss": 0.7123,
      "step": 1032
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9316497127835814e-05,
      "loss": 0.7886,
      "step": 1033
    },
    {
      "epoch": 0.14,
      "learning_rate": 1.9314846331053506e-05,
      "loss": 0.7301,
      "step": 1034
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9313193613884134e-05,
      "loss": 0.6647,
      "step": 1035
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9311538976668433e-05,
      "loss": 0.7576,
      "step": 1036
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.930988241974753e-05,
      "loss": 0.7823,
      "step": 1037
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9308223943462944e-05,
      "loss": 0.7977,
      "step": 1038
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9306563548156594e-05,
      "loss": 0.6842,
      "step": 1039
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9304901234170795e-05,
      "loss": 0.7409,
      "step": 1040
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9303237001848253e-05,
      "loss": 0.6111,
      "step": 1041
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.930157085153208e-05,
      "loss": 0.6583,
      "step": 1042
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9299902783565775e-05,
      "loss": 0.632,
      "step": 1043
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9298232798293227e-05,
      "loss": 0.7949,
      "step": 1044
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.929656089605873e-05,
      "loss": 0.7497,
      "step": 1045
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9294887077206977e-05,
      "loss": 0.7089,
      "step": 1046
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.929321134208304e-05,
      "loss": 0.7816,
      "step": 1047
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.92915336910324e-05,
      "loss": 0.7758,
      "step": 1048
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9289854124400928e-05,
      "loss": 0.7344,
      "step": 1049
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9288172642534894e-05,
      "loss": 0.7292,
      "step": 1050
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.928648924578095e-05,
      "loss": 0.7135,
      "step": 1051
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9284803934486162e-05,
      "loss": 0.748,
      "step": 1052
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9283116708997973e-05,
      "loss": 0.701,
      "step": 1053
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.928142756966423e-05,
      "loss": 0.7081,
      "step": 1054
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.927973651683318e-05,
      "loss": 0.7496,
      "step": 1055
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.927804355085345e-05,
      "loss": 0.7215,
      "step": 1056
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.927634867207407e-05,
      "loss": 0.636,
      "step": 1057
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9274651880844462e-05,
      "loss": 0.6829,
      "step": 1058
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9272953177514448e-05,
      "loss": 0.8155,
      "step": 1059
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9271252562434236e-05,
      "loss": 0.6375,
      "step": 1060
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9269550035954434e-05,
      "loss": 0.6591,
      "step": 1061
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.926784559842604e-05,
      "loss": 0.7024,
      "step": 1062
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.926613925020045e-05,
      "loss": 0.7431,
      "step": 1063
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9264430991629447e-05,
      "loss": 0.6744,
      "step": 1064
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9262720823065217e-05,
      "loss": 0.7685,
      "step": 1065
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9261008744860336e-05,
      "loss": 0.747,
      "step": 1066
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.925929475736777e-05,
      "loss": 0.7504,
      "step": 1067
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9257578860940886e-05,
      "loss": 0.6886,
      "step": 1068
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9255861055933434e-05,
      "loss": 0.7476,
      "step": 1069
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.925414134269957e-05,
      "loss": 0.8199,
      "step": 1070
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.925241972159383e-05,
      "loss": 0.7354,
      "step": 1071
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9250696192971162e-05,
      "loss": 0.7175,
      "step": 1072
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.924897075718688e-05,
      "loss": 0.7367,
      "step": 1073
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.924724341459672e-05,
      "loss": 0.6322,
      "step": 1074
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9245514165556797e-05,
      "loss": 0.7732,
      "step": 1075
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.924378301042361e-05,
      "loss": 0.7642,
      "step": 1076
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9242049949554072e-05,
      "loss": 0.6165,
      "step": 1077
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9240314983305476e-05,
      "loss": 0.7716,
      "step": 1078
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9238578112035502e-05,
      "loss": 0.7817,
      "step": 1079
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.923683933610224e-05,
      "loss": 0.7587,
      "step": 1080
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9235098655864156e-05,
      "loss": 0.6394,
      "step": 1081
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.923335607168012e-05,
      "loss": 0.7849,
      "step": 1082
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.923161158390939e-05,
      "loss": 0.7312,
      "step": 1083
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9229865192911616e-05,
      "loss": 0.6896,
      "step": 1084
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9228116899046842e-05,
      "loss": 0.7396,
      "step": 1085
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9226366702675504e-05,
      "loss": 0.7511,
      "step": 1086
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9224614604158427e-05,
      "loss": 0.6683,
      "step": 1087
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.922286060385683e-05,
      "loss": 0.8369,
      "step": 1088
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9221104702132328e-05,
      "loss": 0.769,
      "step": 1089
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.921934689934693e-05,
      "loss": 0.6906,
      "step": 1090
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9217587195863018e-05,
      "loss": 0.689,
      "step": 1091
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9215825592043394e-05,
      "loss": 0.7143,
      "step": 1092
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.921406208825123e-05,
      "loss": 0.8101,
      "step": 1093
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9212296684850097e-05,
      "loss": 0.7744,
      "step": 1094
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9210529382203957e-05,
      "loss": 0.721,
      "step": 1095
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.920876018067717e-05,
      "loss": 0.7943,
      "step": 1096
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9206989080634478e-05,
      "loss": 0.6184,
      "step": 1097
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.920521608244102e-05,
      "loss": 0.8349,
      "step": 1098
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9203441186462318e-05,
      "loss": 0.7048,
      "step": 1099
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9201664393064302e-05,
      "loss": 0.8001,
      "step": 1100
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9199885702613275e-05,
      "loss": 0.6789,
      "step": 1101
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9198105115475946e-05,
      "loss": 0.8076,
      "step": 1102
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9196322632019405e-05,
      "loss": 0.6934,
      "step": 1103
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9194538252611132e-05,
      "loss": 0.59,
      "step": 1104
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.919275197761901e-05,
      "loss": 0.6607,
      "step": 1105
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.91909638074113e-05,
      "loss": 0.7715,
      "step": 1106
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9189173742356655e-05,
      "loss": 0.7242,
      "step": 1107
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.918738178282413e-05,
      "loss": 0.7124,
      "step": 1108
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9185587929183155e-05,
      "loss": 0.621,
      "step": 1109
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9183792181803566e-05,
      "loss": 0.7191,
      "step": 1110
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9181994541055577e-05,
      "loss": 0.7075,
      "step": 1111
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9180195007309802e-05,
      "loss": 0.7034,
      "step": 1112
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9178393580937232e-05,
      "loss": 0.6678,
      "step": 1113
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.917659026230926e-05,
      "loss": 0.7932,
      "step": 1114
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9174785051797668e-05,
      "loss": 0.8074,
      "step": 1115
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9172977949774623e-05,
      "loss": 0.6019,
      "step": 1116
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9171168956612684e-05,
      "loss": 0.7766,
      "step": 1117
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9169358072684803e-05,
      "loss": 0.6152,
      "step": 1118
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.916754529836432e-05,
      "loss": 0.6445,
      "step": 1119
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.916573063402496e-05,
      "loss": 0.6658,
      "step": 1120
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.916391408004085e-05,
      "loss": 0.7165,
      "step": 1121
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9162095636786485e-05,
      "loss": 0.6813,
      "step": 1122
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9160275304636773e-05,
      "loss": 0.7222,
      "step": 1123
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9158453083967e-05,
      "loss": 0.6106,
      "step": 1124
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9156628975152836e-05,
      "loss": 0.8066,
      "step": 1125
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9154802978570354e-05,
      "loss": 0.6835,
      "step": 1126
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9152975094596005e-05,
      "loss": 0.6945,
      "step": 1127
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9151145323606637e-05,
      "loss": 0.8271,
      "step": 1128
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9149313665979477e-05,
      "loss": 0.6948,
      "step": 1129
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9147480122092154e-05,
      "loss": 0.7004,
      "step": 1130
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9145644692322676e-05,
      "loss": 0.7732,
      "step": 1131
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9143807377049443e-05,
      "loss": 0.8177,
      "step": 1132
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.914196817665124e-05,
      "loss": 0.6096,
      "step": 1133
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9140127091507247e-05,
      "loss": 0.7573,
      "step": 1134
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.913828412199703e-05,
      "loss": 0.7772,
      "step": 1135
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9136439268500546e-05,
      "loss": 0.7117,
      "step": 1136
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9134592531398133e-05,
      "loss": 0.6669,
      "step": 1137
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.913274391107052e-05,
      "loss": 0.6352,
      "step": 1138
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9130893407898834e-05,
      "loss": 0.752,
      "step": 1139
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9129041022264574e-05,
      "loss": 0.6332,
      "step": 1140
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9127186754549642e-05,
      "loss": 0.6474,
      "step": 1141
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.912533060513632e-05,
      "loss": 0.7039,
      "step": 1142
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9123472574407276e-05,
      "loss": 0.6498,
      "step": 1143
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.912161266274557e-05,
      "loss": 0.6869,
      "step": 1144
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9119750870534655e-05,
      "loss": 0.7412,
      "step": 1145
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9117887198158357e-05,
      "loss": 0.6306,
      "step": 1146
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9116021646000904e-05,
      "loss": 0.6703,
      "step": 1147
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9114154214446907e-05,
      "loss": 0.7339,
      "step": 1148
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.911228490388136e-05,
      "loss": 0.8629,
      "step": 1149
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9110413714689648e-05,
      "loss": 0.657,
      "step": 1150
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9108540647257544e-05,
      "loss": 0.7082,
      "step": 1151
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.91066657019712e-05,
      "loss": 0.7091,
      "step": 1152
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.910478887921718e-05,
      "loss": 0.67,
      "step": 1153
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9102910179382402e-05,
      "loss": 0.7643,
      "step": 1154
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9101029602854194e-05,
      "loss": 0.7665,
      "step": 1155
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.909914715002026e-05,
      "loss": 0.6986,
      "step": 1156
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9097262821268696e-05,
      "loss": 0.7411,
      "step": 1157
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.909537661698798e-05,
      "loss": 0.7016,
      "step": 1158
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9093488537566983e-05,
      "loss": 0.6854,
      "step": 1159
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9091598583394955e-05,
      "loss": 0.668,
      "step": 1160
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9089706754861544e-05,
      "loss": 0.8323,
      "step": 1161
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9087813052356773e-05,
      "loss": 0.8014,
      "step": 1162
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.908591747627105e-05,
      "loss": 0.7718,
      "step": 1163
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.908402002699518e-05,
      "loss": 0.615,
      "step": 1164
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9082120704920358e-05,
      "loss": 0.7537,
      "step": 1165
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9080219510438137e-05,
      "loss": 0.6482,
      "step": 1166
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.907831644394049e-05,
      "loss": 0.7311,
      "step": 1167
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9076411505819757e-05,
      "loss": 0.7637,
      "step": 1168
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9074504696468666e-05,
      "loss": 0.7066,
      "step": 1169
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9072596016280336e-05,
      "loss": 0.7118,
      "step": 1170
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9070685465648264e-05,
      "loss": 0.7164,
      "step": 1171
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.906877304496634e-05,
      "loss": 0.6835,
      "step": 1172
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9066858754628833e-05,
      "loss": 0.6953,
      "step": 1173
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9064942595030406e-05,
      "loss": 0.6014,
      "step": 1174
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.90630245665661e-05,
      "loss": 0.6842,
      "step": 1175
    },
    {
      "epoch": 0.16,
      "learning_rate": 1.9061104669631343e-05,
      "loss": 0.8175,
      "step": 1176
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.905918290462195e-05,
      "loss": 0.7224,
      "step": 1177
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.905725927193412e-05,
      "loss": 0.852,
      "step": 1178
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9055333771964433e-05,
      "loss": 0.7832,
      "step": 1179
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9053406405109864e-05,
      "loss": 0.6328,
      "step": 1180
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9051477171767768e-05,
      "loss": 0.7492,
      "step": 1181
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9049546072335875e-05,
      "loss": 0.8845,
      "step": 1182
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9047613107212314e-05,
      "loss": 0.6811,
      "step": 1183
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9045678276795594e-05,
      "loss": 0.6911,
      "step": 1184
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9043741581484606e-05,
      "loss": 0.6932,
      "step": 1185
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9041803021678625e-05,
      "loss": 0.7095,
      "step": 1186
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9039862597777317e-05,
      "loss": 0.7756,
      "step": 1187
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9037920310180725e-05,
      "loss": 0.8224,
      "step": 1188
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.903597615928928e-05,
      "loss": 0.7387,
      "step": 1189
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9034030145503794e-05,
      "loss": 0.7839,
      "step": 1190
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.903208226922547e-05,
      "loss": 0.7501,
      "step": 1191
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9030132530855884e-05,
      "loss": 0.7762,
      "step": 1192
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9028180930797005e-05,
      "loss": 0.7461,
      "step": 1193
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9026227469451184e-05,
      "loss": 0.7884,
      "step": 1194
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9024272147221154e-05,
      "loss": 0.7184,
      "step": 1195
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.902231496451003e-05,
      "loss": 0.7584,
      "step": 1196
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9020355921721316e-05,
      "loss": 0.7175,
      "step": 1197
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9018395019258897e-05,
      "loss": 0.811,
      "step": 1198
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9016432257527036e-05,
      "loss": 0.6883,
      "step": 1199
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9014467636930387e-05,
      "loss": 0.6322,
      "step": 1200
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9012501157873986e-05,
      "loss": 0.7536,
      "step": 1201
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9010532820763248e-05,
      "loss": 0.7827,
      "step": 1202
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.900856262600397e-05,
      "loss": 0.7521,
      "step": 1203
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9006590574002347e-05,
      "loss": 0.7698,
      "step": 1204
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9004616665164932e-05,
      "loss": 0.6,
      "step": 1205
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9002640899898682e-05,
      "loss": 0.7069,
      "step": 1206
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.9000663278610923e-05,
      "loss": 0.7468,
      "step": 1207
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.899868380170938e-05,
      "loss": 0.8082,
      "step": 1208
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8996702469602143e-05,
      "loss": 0.7543,
      "step": 1209
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8994719282697688e-05,
      "loss": 0.6891,
      "step": 1210
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8992734241404883e-05,
      "loss": 0.7857,
      "step": 1211
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.899074734613297e-05,
      "loss": 0.6839,
      "step": 1212
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8988758597291577e-05,
      "loss": 0.7711,
      "step": 1213
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.898676799529071e-05,
      "loss": 0.7234,
      "step": 1214
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8984775540540763e-05,
      "loss": 0.6573,
      "step": 1215
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8982781233452504e-05,
      "loss": 0.7718,
      "step": 1216
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8980785074437095e-05,
      "loss": 0.6298,
      "step": 1217
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.897878706390606e-05,
      "loss": 0.7398,
      "step": 1218
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.897678720227133e-05,
      "loss": 0.6601,
      "step": 1219
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.89747854899452e-05,
      "loss": 0.7702,
      "step": 1220
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.897278192734035e-05,
      "loss": 0.6742,
      "step": 1221
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8970776514869847e-05,
      "loss": 0.8019,
      "step": 1222
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8968769252947127e-05,
      "loss": 0.8522,
      "step": 1223
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8966760141986022e-05,
      "loss": 0.7603,
      "step": 1224
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8964749182400738e-05,
      "loss": 0.7112,
      "step": 1225
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.896273637460586e-05,
      "loss": 0.7055,
      "step": 1226
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.896072171901636e-05,
      "loss": 0.7184,
      "step": 1227
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.895870521604758e-05,
      "loss": 0.7939,
      "step": 1228
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.895668686611526e-05,
      "loss": 0.7264,
      "step": 1229
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.895466666963551e-05,
      "loss": 0.6362,
      "step": 1230
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8952644627024815e-05,
      "loss": 0.7118,
      "step": 1231
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8950620738700055e-05,
      "loss": 0.6412,
      "step": 1232
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.894859500507848e-05,
      "loss": 0.6365,
      "step": 1233
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8946567426577724e-05,
      "loss": 0.7055,
      "step": 1234
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8944538003615803e-05,
      "loss": 0.6128,
      "step": 1235
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8942506736611107e-05,
      "loss": 0.7149,
      "step": 1236
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8940473625982412e-05,
      "loss": 0.7241,
      "step": 1237
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8938438672148872e-05,
      "loss": 0.7066,
      "step": 1238
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8936401875530026e-05,
      "loss": 0.7603,
      "step": 1239
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8934363236545784e-05,
      "loss": 0.6254,
      "step": 1240
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.893232275561644e-05,
      "loss": 0.7569,
      "step": 1241
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.893028043316267e-05,
      "loss": 0.6975,
      "step": 1242
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8928236269605523e-05,
      "loss": 0.611,
      "step": 1243
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8926190265366438e-05,
      "loss": 0.7621,
      "step": 1244
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8924142420867228e-05,
      "loss": 0.6651,
      "step": 1245
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8922092736530077e-05,
      "loss": 0.6708,
      "step": 1246
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.8920041212777564e-05,
      "loss": 0.7066,
      "step": 1247
    },
    {
      "epoch": 0.17,
      "learning_rate": 1.891798785003264e-05,
      "loss": 0.6616,
      "step": 1248
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.891593264871863e-05,
      "loss": 0.6474,
      "step": 1249
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8913875609259246e-05,
      "loss": 0.7705,
      "step": 1250
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8911816732078577e-05,
      "loss": 0.7003,
      "step": 1251
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8909756017601083e-05,
      "loss": 0.7779,
      "step": 1252
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8907693466251613e-05,
      "loss": 0.6878,
      "step": 1253
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8905629078455393e-05,
      "loss": 0.693,
      "step": 1254
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8903562854638025e-05,
      "loss": 0.6648,
      "step": 1255
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.890149479522549e-05,
      "loss": 0.7516,
      "step": 1256
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8899424900644146e-05,
      "loss": 0.6494,
      "step": 1257
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8897353171320733e-05,
      "loss": 0.7267,
      "step": 1258
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8895279607682363e-05,
      "loss": 0.7524,
      "step": 1259
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8893204210156536e-05,
      "loss": 0.7618,
      "step": 1260
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8891126979171124e-05,
      "loss": 0.7495,
      "step": 1261
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8889047915154376e-05,
      "loss": 0.7469,
      "step": 1262
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8886967018534918e-05,
      "loss": 0.7596,
      "step": 1263
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.888488428974176e-05,
      "loss": 0.8129,
      "step": 1264
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8882799729204287e-05,
      "loss": 0.753,
      "step": 1265
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8880713337352253e-05,
      "loss": 0.7895,
      "step": 1266
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8878625114615807e-05,
      "loss": 0.7542,
      "step": 1267
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8876535061425454e-05,
      "loss": 0.5667,
      "step": 1268
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8874443178212098e-05,
      "loss": 0.6939,
      "step": 1269
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8872349465407006e-05,
      "loss": 0.8068,
      "step": 1270
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.887025392344183e-05,
      "loss": 0.652,
      "step": 1271
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.886815655274859e-05,
      "loss": 0.6909,
      "step": 1272
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8866057353759693e-05,
      "loss": 0.6976,
      "step": 1273
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8863956326907918e-05,
      "loss": 0.7124,
      "step": 1274
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.886185347262642e-05,
      "loss": 0.6966,
      "step": 1275
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.885974879134873e-05,
      "loss": 0.7383,
      "step": 1276
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.885764228350876e-05,
      "loss": 0.629,
      "step": 1277
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.88555339495408e-05,
      "loss": 0.7484,
      "step": 1278
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8853423789879505e-05,
      "loss": 0.7451,
      "step": 1279
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8851311804959923e-05,
      "loss": 0.6159,
      "step": 1280
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8849197995217462e-05,
      "loss": 0.7309,
      "step": 1281
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.884708236108792e-05,
      "loss": 0.6646,
      "step": 1282
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8844964903007458e-05,
      "loss": 0.5905,
      "step": 1283
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8842845621412625e-05,
      "loss": 0.7806,
      "step": 1284
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.884072451674034e-05,
      "loss": 0.5867,
      "step": 1285
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8838601589427896e-05,
      "loss": 0.7824,
      "step": 1286
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8836476839912967e-05,
      "loss": 0.8323,
      "step": 1287
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8834350268633603e-05,
      "loss": 0.7685,
      "step": 1288
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.883222187602822e-05,
      "loss": 0.6542,
      "step": 1289
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8830091662535615e-05,
      "loss": 0.7296,
      "step": 1290
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8827959628594973e-05,
      "loss": 0.6163,
      "step": 1291
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.882582577464583e-05,
      "loss": 0.5676,
      "step": 1292
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.882369010112812e-05,
      "loss": 0.7156,
      "step": 1293
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.882155260848214e-05,
      "loss": 0.6256,
      "step": 1294
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8819413297148557e-05,
      "loss": 0.7353,
      "step": 1295
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.881727216756843e-05,
      "loss": 0.6911,
      "step": 1296
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8815129220183174e-05,
      "loss": 0.6241,
      "step": 1297
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8812984455434597e-05,
      "loss": 0.7122,
      "step": 1298
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8810837873764867e-05,
      "loss": 0.6604,
      "step": 1299
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8808689475616533e-05,
      "loss": 0.7895,
      "step": 1300
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8806539261432518e-05,
      "loss": 0.6951,
      "step": 1301
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.880438723165612e-05,
      "loss": 0.7482,
      "step": 1302
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.880223338673101e-05,
      "loss": 0.6498,
      "step": 1303
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8800077727101227e-05,
      "loss": 0.6849,
      "step": 1304
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8797920253211202e-05,
      "loss": 0.7637,
      "step": 1305
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8795760965505722e-05,
      "loss": 0.7641,
      "step": 1306
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8793599864429953e-05,
      "loss": 0.6784,
      "step": 1307
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8791436950429442e-05,
      "loss": 0.7403,
      "step": 1308
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.87892722239501e-05,
      "loss": 0.7028,
      "step": 1309
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.878710568543822e-05,
      "loss": 0.6146,
      "step": 1310
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8784937335340457e-05,
      "loss": 0.6418,
      "step": 1311
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8782767174103857e-05,
      "loss": 0.7812,
      "step": 1312
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.878059520217582e-05,
      "loss": 0.7218,
      "step": 1313
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8778421420004137e-05,
      "loss": 0.7145,
      "step": 1314
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8776245828036957e-05,
      "loss": 0.7392,
      "step": 1315
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8774068426722815e-05,
      "loss": 0.7597,
      "step": 1316
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8771889216510605e-05,
      "loss": 0.6718,
      "step": 1317
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.876970819784961e-05,
      "loss": 0.7004,
      "step": 1318
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.8767525371189473e-05,
      "loss": 0.8359,
      "step": 1319
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.876534073698022e-05,
      "loss": 0.7474,
      "step": 1320
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8763154295672237e-05,
      "loss": 0.684,
      "step": 1321
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8760966047716292e-05,
      "loss": 0.7663,
      "step": 1322
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8758775993563527e-05,
      "loss": 0.782,
      "step": 1323
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8756584133665447e-05,
      "loss": 0.6638,
      "step": 1324
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8754390468473937e-05,
      "loss": 0.7136,
      "step": 1325
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.875219499844126e-05,
      "loss": 0.6513,
      "step": 1326
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.874999772402003e-05,
      "loss": 0.6841,
      "step": 1327
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8747798645663253e-05,
      "loss": 0.6984,
      "step": 1328
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8745597763824297e-05,
      "loss": 0.6446,
      "step": 1329
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8743395078956905e-05,
      "loss": 0.618,
      "step": 1330
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8741190591515198e-05,
      "loss": 0.7147,
      "step": 1331
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8738984301953657e-05,
      "loss": 0.7577,
      "step": 1332
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.873677621072714e-05,
      "loss": 0.6104,
      "step": 1333
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8734566318290877e-05,
      "loss": 0.8072,
      "step": 1334
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8732354625100467e-05,
      "loss": 0.6678,
      "step": 1335
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8730141131611882e-05,
      "loss": 0.7064,
      "step": 1336
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.872792583828147e-05,
      "loss": 0.7845,
      "step": 1337
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8725708745565937e-05,
      "loss": 0.7033,
      "step": 1338
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8723489853922372e-05,
      "loss": 0.7841,
      "step": 1339
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8721269163808232e-05,
      "loss": 0.763,
      "step": 1340
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.871904667568134e-05,
      "loss": 0.7456,
      "step": 1341
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.87168223899999e-05,
      "loss": 0.7066,
      "step": 1342
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8714596307222473e-05,
      "loss": 0.7667,
      "step": 1343
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8712368427807996e-05,
      "loss": 0.7334,
      "step": 1344
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8710138752215784e-05,
      "loss": 0.7013,
      "step": 1345
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8707907280905514e-05,
      "loss": 0.7424,
      "step": 1346
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8705674014337237e-05,
      "loss": 0.7365,
      "step": 1347
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.870343895297137e-05,
      "loss": 0.6065,
      "step": 1348
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8701202097268702e-05,
      "loss": 0.7064,
      "step": 1349
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.869896344769039e-05,
      "loss": 0.6277,
      "step": 1350
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8696723004697973e-05,
      "loss": 0.7084,
      "step": 1351
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.869448076875334e-05,
      "loss": 0.6623,
      "step": 1352
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.869223674031876e-05,
      "loss": 0.6896,
      "step": 1353
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8689990919856878e-05,
      "loss": 0.745,
      "step": 1354
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8687743307830697e-05,
      "loss": 0.7241,
      "step": 1355
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8685493904703596e-05,
      "loss": 0.6372,
      "step": 1356
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.868324271093932e-05,
      "loss": 0.7316,
      "step": 1357
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.868098972700198e-05,
      "loss": 0.841,
      "step": 1358
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8678734953356068e-05,
      "loss": 0.8076,
      "step": 1359
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8676478390466434e-05,
      "loss": 0.5815,
      "step": 1360
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.86742200387983e-05,
      "loss": 0.7182,
      "step": 1361
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8671959898817256e-05,
      "loss": 0.7492,
      "step": 1362
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8669697970989264e-05,
      "loss": 0.7891,
      "step": 1363
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8667434255780653e-05,
      "loss": 0.6395,
      "step": 1364
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8665168753658117e-05,
      "loss": 0.636,
      "step": 1365
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8662901465088722e-05,
      "loss": 0.7008,
      "step": 1366
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8660632390539905e-05,
      "loss": 0.6978,
      "step": 1367
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8658361530479463e-05,
      "loss": 0.7328,
      "step": 1368
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.865608888537557e-05,
      "loss": 0.7522,
      "step": 1369
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.865381445569676e-05,
      "loss": 0.7535,
      "step": 1370
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.865153824191194e-05,
      "loss": 0.6995,
      "step": 1371
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8649260244490383e-05,
      "loss": 0.7816,
      "step": 1372
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8646980463901732e-05,
      "loss": 0.7724,
      "step": 1373
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8644698900616e-05,
      "loss": 0.7147,
      "step": 1374
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.864241555510355e-05,
      "loss": 0.755,
      "step": 1375
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8640130427835142e-05,
      "loss": 0.7509,
      "step": 1376
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.863784351928188e-05,
      "loss": 0.7303,
      "step": 1377
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.863555482991524e-05,
      "loss": 0.7693,
      "step": 1378
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.863326436020707e-05,
      "loss": 0.736,
      "step": 1379
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8630972110629582e-05,
      "loss": 0.6689,
      "step": 1380
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.862867808165536e-05,
      "loss": 0.6881,
      "step": 1381
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8626382273757344e-05,
      "loss": 0.7374,
      "step": 1382
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.862408468740885e-05,
      "loss": 0.6843,
      "step": 1383
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8621785323083558e-05,
      "loss": 0.7327,
      "step": 1384
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8619484181255513e-05,
      "loss": 0.7993,
      "step": 1385
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.861718126239913e-05,
      "loss": 0.6421,
      "step": 1386
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.861487656698919e-05,
      "loss": 0.6686,
      "step": 1387
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8612570095500834e-05,
      "loss": 0.7385,
      "step": 1388
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8610261848409576e-05,
      "loss": 0.6942,
      "step": 1389
    },
    {
      "epoch": 0.19,
      "learning_rate": 1.8607951826191293e-05,
      "loss": 0.6948,
      "step": 1390
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.860564002932223e-05,
      "loss": 0.8321,
      "step": 1391
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8603326458278993e-05,
      "loss": 0.7722,
      "step": 1392
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8601011113538563e-05,
      "loss": 0.7739,
      "step": 1393
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8598693995578277e-05,
      "loss": 0.6841,
      "step": 1394
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.859637510487584e-05,
      "loss": 0.71,
      "step": 1395
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.859405444190933e-05,
      "loss": 0.6845,
      "step": 1396
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.859173200715718e-05,
      "loss": 0.68,
      "step": 1397
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8589407801098192e-05,
      "loss": 0.6346,
      "step": 1398
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8587081824211533e-05,
      "loss": 0.8499,
      "step": 1399
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8584754076976744e-05,
      "loss": 0.8094,
      "step": 1400
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8582424559873714e-05,
      "loss": 0.6767,
      "step": 1401
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8580093273382712e-05,
      "loss": 0.8,
      "step": 1402
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.857776021798436e-05,
      "loss": 0.8417,
      "step": 1403
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8575425394159653e-05,
      "loss": 0.7371,
      "step": 1404
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.857308880238995e-05,
      "loss": 0.701,
      "step": 1405
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.857075044315697e-05,
      "loss": 0.8069,
      "step": 1406
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8568410316942802e-05,
      "loss": 0.6961,
      "step": 1407
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.856606842422989e-05,
      "loss": 0.6969,
      "step": 1408
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.856372476550105e-05,
      "loss": 0.7777,
      "step": 1409
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8561379341239468e-05,
      "loss": 0.6714,
      "step": 1410
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.855903215192867e-05,
      "loss": 0.7165,
      "step": 1411
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.855668319805258e-05,
      "loss": 0.781,
      "step": 1412
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.855433248009546e-05,
      "loss": 0.7026,
      "step": 1413
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8551979998541944e-05,
      "loss": 0.7526,
      "step": 1414
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.854962575387703e-05,
      "loss": 0.7563,
      "step": 1415
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8547269746586078e-05,
      "loss": 0.7185,
      "step": 1416
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.854491197715481e-05,
      "loss": 0.7521,
      "step": 1417
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8542552446069315e-05,
      "loss": 0.7018,
      "step": 1418
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8540191153816045e-05,
      "loss": 0.7328,
      "step": 1419
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8537828100881814e-05,
      "loss": 0.7072,
      "step": 1420
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8535463287753797e-05,
      "loss": 0.6657,
      "step": 1421
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8533096714919537e-05,
      "loss": 0.7387,
      "step": 1422
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.853072838286693e-05,
      "loss": 0.6442,
      "step": 1423
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8528358292084247e-05,
      "loss": 0.7327,
      "step": 1424
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8525986443060112e-05,
      "loss": 0.6297,
      "step": 1425
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8523612836283523e-05,
      "loss": 0.7475,
      "step": 1426
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.852123747224382e-05,
      "loss": 0.7269,
      "step": 1427
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8518860351430724e-05,
      "loss": 0.6755,
      "step": 1428
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8516481474334313e-05,
      "loss": 0.6679,
      "step": 1429
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.851410084144503e-05,
      "loss": 0.8616,
      "step": 1430
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8511718453253666e-05,
      "loss": 0.7755,
      "step": 1431
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.850933431025139e-05,
      "loss": 0.6948,
      "step": 1432
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8506948412929726e-05,
      "loss": 0.7135,
      "step": 1433
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8504560761780565e-05,
      "loss": 0.6677,
      "step": 1434
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8502171357296144e-05,
      "loss": 0.6639,
      "step": 1435
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.849978019996908e-05,
      "loss": 0.6391,
      "step": 1436
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8497387290292345e-05,
      "loss": 0.8564,
      "step": 1437
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.849499262875927e-05,
      "loss": 0.6903,
      "step": 1438
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.849259621586354e-05,
      "loss": 0.7191,
      "step": 1439
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.849019805209922e-05,
      "loss": 0.6898,
      "step": 1440
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8487798137960726e-05,
      "loss": 0.5726,
      "step": 1441
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.848539647394283e-05,
      "loss": 0.7021,
      "step": 1442
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.848299306054066e-05,
      "loss": 0.7345,
      "step": 1443
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.848058789824973e-05,
      "loss": 0.7094,
      "step": 1444
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8478180987565892e-05,
      "loss": 0.8234,
      "step": 1445
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.847577232898536e-05,
      "loss": 0.7169,
      "step": 1446
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8473361923004716e-05,
      "loss": 0.6349,
      "step": 1447
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.84709497701209e-05,
      "loss": 0.69,
      "step": 1448
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.846853587083121e-05,
      "loss": 0.6927,
      "step": 1449
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8466120225633305e-05,
      "loss": 0.7699,
      "step": 1450
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8463702835025208e-05,
      "loss": 0.7229,
      "step": 1451
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8461283699505296e-05,
      "loss": 0.6881,
      "step": 1452
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8458862819572305e-05,
      "loss": 0.777,
      "step": 1453
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8456440195725337e-05,
      "loss": 0.7427,
      "step": 1454
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.845401582846385e-05,
      "loss": 0.7002,
      "step": 1455
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8451589718287664e-05,
      "loss": 0.6705,
      "step": 1456
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.844916186569695e-05,
      "loss": 0.7079,
      "step": 1457
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8446732271192247e-05,
      "loss": 0.6131,
      "step": 1458
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.844430093527445e-05,
      "loss": 0.7367,
      "step": 1459
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.8441867858444812e-05,
      "loss": 0.707,
      "step": 1460
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.843943304120495e-05,
      "loss": 0.6989,
      "step": 1461
    },
    {
      "epoch": 0.2,
      "learning_rate": 1.843699648405683e-05,
      "loss": 0.6903,
      "step": 1462
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8434558187502787e-05,
      "loss": 0.7843,
      "step": 1463
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8432118152045513e-05,
      "loss": 0.6747,
      "step": 1464
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.842967637818805e-05,
      "loss": 0.6494,
      "step": 1465
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8427232866433803e-05,
      "loss": 0.7343,
      "step": 1466
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.842478761728654e-05,
      "loss": 0.7069,
      "step": 1467
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8422340631250387e-05,
      "loss": 0.6693,
      "step": 1468
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.841989190882982e-05,
      "loss": 0.7211,
      "step": 1469
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8417441450529675e-05,
      "loss": 0.7535,
      "step": 1470
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8414989256855154e-05,
      "loss": 0.7438,
      "step": 1471
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8412535328311813e-05,
      "loss": 0.659,
      "step": 1472
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8410079665405557e-05,
      "loss": 0.8155,
      "step": 1473
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.840762226864266e-05,
      "loss": 0.7676,
      "step": 1474
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8405163138529748e-05,
      "loss": 0.7296,
      "step": 1475
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.840270227557381e-05,
      "loss": 0.7409,
      "step": 1476
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8400239680282176e-05,
      "loss": 0.7144,
      "step": 1477
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8397775353162558e-05,
      "loss": 0.8054,
      "step": 1478
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8395309294723e-05,
      "loss": 0.743,
      "step": 1479
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8392841505471922e-05,
      "loss": 0.7472,
      "step": 1480
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8390371985918097e-05,
      "loss": 0.7636,
      "step": 1481
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.838790073657064e-05,
      "loss": 0.6939,
      "step": 1482
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8385427757939046e-05,
      "loss": 0.6842,
      "step": 1483
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8382953050533147e-05,
      "loss": 0.7458,
      "step": 1484
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.838047661486314e-05,
      "loss": 0.7089,
      "step": 1485
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8377998451439576e-05,
      "loss": 0.7028,
      "step": 1486
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8375518560773368e-05,
      "loss": 0.5969,
      "step": 1487
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8373036943375776e-05,
      "loss": 0.6473,
      "step": 1488
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8370553599758424e-05,
      "loss": 0.727,
      "step": 1489
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8368068530433282e-05,
      "loss": 0.7032,
      "step": 1490
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.836558173591269e-05,
      "loss": 0.7974,
      "step": 1491
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8363093216709335e-05,
      "loss": 0.6394,
      "step": 1492
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8360602973336257e-05,
      "loss": 0.7252,
      "step": 1493
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8358111006306855e-05,
      "loss": 0.6734,
      "step": 1494
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.835561731613488e-05,
      "loss": 0.6874,
      "step": 1495
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8353121903334448e-05,
      "loss": 0.7227,
      "step": 1496
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8350624768420022e-05,
      "loss": 0.6121,
      "step": 1497
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8348125911906418e-05,
      "loss": 0.6682,
      "step": 1498
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8345625334308815e-05,
      "loss": 0.6828,
      "step": 1499
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.834312303614274e-05,
      "loss": 0.6358,
      "step": 1500
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8340619017924078e-05,
      "loss": 0.6613,
      "step": 1501
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8338113280169065e-05,
      "loss": 0.7282,
      "step": 1502
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8335605823394295e-05,
      "loss": 0.6414,
      "step": 1503
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.833309664811672e-05,
      "loss": 0.693,
      "step": 1504
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.833058575485364e-05,
      "loss": 0.729,
      "step": 1505
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8328073144122708e-05,
      "loss": 0.7432,
      "step": 1506
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8325558816441937e-05,
      "loss": 0.7539,
      "step": 1507
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.832304277232969e-05,
      "loss": 0.6985,
      "step": 1508
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8320525012304685e-05,
      "loss": 0.6156,
      "step": 1509
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8318005536885996e-05,
      "loss": 0.6751,
      "step": 1510
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.831548434659304e-05,
      "loss": 0.7451,
      "step": 1511
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.831296144194561e-05,
      "loss": 0.5718,
      "step": 1512
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8310436823463827e-05,
      "loss": 0.7871,
      "step": 1513
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.830791049166818e-05,
      "loss": 0.7056,
      "step": 1514
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.830538244707951e-05,
      "loss": 0.6665,
      "step": 1515
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.830285269021901e-05,
      "loss": 0.7784,
      "step": 1516
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8300321221608216e-05,
      "loss": 0.7354,
      "step": 1517
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.829778804176904e-05,
      "loss": 0.6318,
      "step": 1518
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8295253151223722e-05,
      "loss": 0.7491,
      "step": 1519
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.829271655049487e-05,
      "loss": 0.7075,
      "step": 1520
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8290178240105437e-05,
      "loss": 0.6676,
      "step": 1521
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8287638220578735e-05,
      "loss": 0.7976,
      "step": 1522
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8285096492438424e-05,
      "loss": 0.6781,
      "step": 1523
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8282553056208515e-05,
      "loss": 0.6944,
      "step": 1524
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8280007912413374e-05,
      "loss": 0.7196,
      "step": 1525
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8277461061577722e-05,
      "loss": 0.735,
      "step": 1526
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8274912504226624e-05,
      "loss": 0.6199,
      "step": 1527
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8272362240885502e-05,
      "loss": 0.7369,
      "step": 1528
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.826981027208013e-05,
      "loss": 0.7274,
      "step": 1529
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.826725659833663e-05,
      "loss": 0.7228,
      "step": 1530
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8264701220181482e-05,
      "loss": 0.7701,
      "step": 1531
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.826214413814151e-05,
      "loss": 0.7522,
      "step": 1532
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.8259585352743892e-05,
      "loss": 0.798,
      "step": 1533
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8257024864516162e-05,
      "loss": 0.7198,
      "step": 1534
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.82544626739862e-05,
      "loss": 0.7786,
      "step": 1535
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8251898781682226e-05,
      "loss": 0.783,
      "step": 1536
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.824933318813284e-05,
      "loss": 0.7149,
      "step": 1537
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8246765893866968e-05,
      "loss": 0.7757,
      "step": 1538
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8244196899413888e-05,
      "loss": 0.5738,
      "step": 1539
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8241626205303245e-05,
      "loss": 0.7409,
      "step": 1540
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8239053812065016e-05,
      "loss": 0.6899,
      "step": 1541
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.823647972022954e-05,
      "loss": 0.67,
      "step": 1542
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.82339039303275e-05,
      "loss": 0.7393,
      "step": 1543
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8231326442889937e-05,
      "loss": 0.7105,
      "step": 1544
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8228747258448227e-05,
      "loss": 0.7474,
      "step": 1545
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8226166377534113e-05,
      "loss": 0.646,
      "step": 1546
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.822358380067968e-05,
      "loss": 0.6845,
      "step": 1547
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8220999528417355e-05,
      "loss": 0.682,
      "step": 1548
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8218413561279932e-05,
      "loss": 0.6331,
      "step": 1549
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8215825899800536e-05,
      "loss": 0.6626,
      "step": 1550
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.821323654451266e-05,
      "loss": 0.6979,
      "step": 1551
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8210645495950125e-05,
      "loss": 0.6983,
      "step": 1552
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.820805275464712e-05,
      "loss": 0.7118,
      "step": 1553
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8205458321138172e-05,
      "loss": 0.6701,
      "step": 1554
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.820286219595816e-05,
      "loss": 0.7851,
      "step": 1555
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8200264379642312e-05,
      "loss": 0.7462,
      "step": 1556
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8197664872726206e-05,
      "loss": 0.6537,
      "step": 1557
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.819506367574577e-05,
      "loss": 0.7223,
      "step": 1558
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8192460789237266e-05,
      "loss": 0.6463,
      "step": 1559
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.818985621373733e-05,
      "loss": 0.6541,
      "step": 1560
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8187249949782924e-05,
      "loss": 0.7,
      "step": 1561
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8184641997911363e-05,
      "loss": 0.7126,
      "step": 1562
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8182032358660324e-05,
      "loss": 0.6886,
      "step": 1563
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.817942103256781e-05,
      "loss": 0.6763,
      "step": 1564
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8176808020172188e-05,
      "loss": 0.55,
      "step": 1565
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.817419332201217e-05,
      "loss": 0.692,
      "step": 1566
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8171576938626806e-05,
      "loss": 0.6312,
      "step": 1567
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8168958870555506e-05,
      "loss": 0.7186,
      "step": 1568
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.816633911833802e-05,
      "loss": 0.7834,
      "step": 1569
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8163717682514446e-05,
      "loss": 0.6227,
      "step": 1570
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.816109456362523e-05,
      "loss": 0.6615,
      "step": 1571
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8158469762211164e-05,
      "loss": 0.7512,
      "step": 1572
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.815584327881339e-05,
      "loss": 0.7045,
      "step": 1573
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8153215113973398e-05,
      "loss": 0.6971,
      "step": 1574
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8150585268233014e-05,
      "loss": 0.7411,
      "step": 1575
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8147953742134423e-05,
      "loss": 0.7199,
      "step": 1576
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.814532053622015e-05,
      "loss": 0.7458,
      "step": 1577
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8142685651033064e-05,
      "loss": 0.6425,
      "step": 1578
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8140049087116386e-05,
      "loss": 0.6054,
      "step": 1579
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8137410845013686e-05,
      "loss": 0.6443,
      "step": 1580
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8134770925268867e-05,
      "loss": 0.671,
      "step": 1581
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.813212932842619e-05,
      "loss": 0.677,
      "step": 1582
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8129486055030255e-05,
      "loss": 0.6477,
      "step": 1583
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8126841105626018e-05,
      "loss": 0.6663,
      "step": 1584
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8124194480758762e-05,
      "loss": 0.7237,
      "step": 1585
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.812154618097413e-05,
      "loss": 0.7,
      "step": 1586
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.811889620681811e-05,
      "loss": 0.7312,
      "step": 1587
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8116244558837026e-05,
      "loss": 0.6837,
      "step": 1588
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8113591237577557e-05,
      "loss": 0.7518,
      "step": 1589
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8110936243586718e-05,
      "loss": 0.6085,
      "step": 1590
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.810827957741188e-05,
      "loss": 0.7562,
      "step": 1591
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8105621239600744e-05,
      "loss": 0.6918,
      "step": 1592
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8102961230701376e-05,
      "loss": 0.7309,
      "step": 1593
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8100299551262158e-05,
      "loss": 0.7801,
      "step": 1594
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8097636201831847e-05,
      "loss": 0.7515,
      "step": 1595
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8094971182959523e-05,
      "loss": 0.7374,
      "step": 1596
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8092304495194618e-05,
      "loss": 0.8074,
      "step": 1597
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8089636139086912e-05,
      "loss": 0.7881,
      "step": 1598
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8086966115186518e-05,
      "loss": 0.7044,
      "step": 1599
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.80842944240439e-05,
      "loss": 0.6836,
      "step": 1600
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8081621066209866e-05,
      "loss": 0.6869,
      "step": 1601
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8078946042235573e-05,
      "loss": 0.6886,
      "step": 1602
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.8076269352672505e-05,
      "loss": 0.7124,
      "step": 1603
    },
    {
      "epoch": 0.22,
      "learning_rate": 1.80735909980725e-05,
      "loss": 0.7336,
      "step": 1604
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.807091097898775e-05,
      "loss": 0.6672,
      "step": 1605
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8068229295970764e-05,
      "loss": 0.7495,
      "step": 1606
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8065545949574415e-05,
      "loss": 0.7411,
      "step": 1607
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8062860940351916e-05,
      "loss": 0.5992,
      "step": 1608
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8060174268856815e-05,
      "loss": 0.7371,
      "step": 1609
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8057485935643012e-05,
      "loss": 0.7998,
      "step": 1610
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.805479594126474e-05,
      "loss": 0.7252,
      "step": 1611
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.805210428627658e-05,
      "loss": 0.6379,
      "step": 1612
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8049410971233457e-05,
      "loss": 0.5813,
      "step": 1613
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8046715996690634e-05,
      "loss": 0.7034,
      "step": 1614
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.804401936320372e-05,
      "loss": 0.7484,
      "step": 1615
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8041321071328665e-05,
      "loss": 0.6912,
      "step": 1616
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8038621121621752e-05,
      "loss": 0.7157,
      "step": 1617
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8035919514639624e-05,
      "loss": 0.637,
      "step": 1618
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8033216250939246e-05,
      "loss": 0.6639,
      "step": 1619
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8030511331077945e-05,
      "loss": 0.7025,
      "step": 1620
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.802780475561337e-05,
      "loss": 0.8124,
      "step": 1621
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.802509652510352e-05,
      "loss": 0.6824,
      "step": 1622
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8022386640106743e-05,
      "loss": 0.7261,
      "step": 1623
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.801967510118171e-05,
      "loss": 0.7739,
      "step": 1624
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8016961908887444e-05,
      "loss": 0.7453,
      "step": 1625
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8014247063783315e-05,
      "loss": 0.688,
      "step": 1626
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8011530566429022e-05,
      "loss": 0.7555,
      "step": 1627
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8008812417384608e-05,
      "loss": 0.7368,
      "step": 1628
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.800609261721046e-05,
      "loss": 0.71,
      "step": 1629
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8003371166467306e-05,
      "loss": 0.7842,
      "step": 1630
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.8000648065716207e-05,
      "loss": 0.7674,
      "step": 1631
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.799792331551857e-05,
      "loss": 0.7368,
      "step": 1632
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7995196916436136e-05,
      "loss": 0.5502,
      "step": 1633
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7992468869031003e-05,
      "loss": 0.7969,
      "step": 1634
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7989739173865586e-05,
      "loss": 0.7103,
      "step": 1635
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.798700783150265e-05,
      "loss": 0.6853,
      "step": 1636
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7984274842505308e-05,
      "loss": 0.6936,
      "step": 1637
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7981540207436997e-05,
      "loss": 0.6909,
      "step": 1638
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7978803926861503e-05,
      "loss": 0.6116,
      "step": 1639
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7976066001342946e-05,
      "loss": 0.5877,
      "step": 1640
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7973326431445794e-05,
      "loss": 0.7485,
      "step": 1641
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7970585217734843e-05,
      "loss": 0.6828,
      "step": 1642
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7967842360775235e-05,
      "loss": 0.5973,
      "step": 1643
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7965097861132448e-05,
      "loss": 0.7767,
      "step": 1644
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.79623517193723e-05,
      "loss": 0.7016,
      "step": 1645
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7959603936060946e-05,
      "loss": 0.8035,
      "step": 1646
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.795685451176488e-05,
      "loss": 0.6423,
      "step": 1647
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7954103447050938e-05,
      "loss": 0.6756,
      "step": 1648
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7951350742486285e-05,
      "loss": 0.7266,
      "step": 1649
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7948596398638437e-05,
      "loss": 0.684,
      "step": 1650
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7945840416075235e-05,
      "loss": 0.7323,
      "step": 1651
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7943082795364864e-05,
      "loss": 0.6745,
      "step": 1652
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7940323537075848e-05,
      "loss": 0.6172,
      "step": 1653
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.793756264177705e-05,
      "loss": 0.6266,
      "step": 1654
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7934800110037664e-05,
      "loss": 0.6553,
      "step": 1655
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7932035942427224e-05,
      "loss": 0.7564,
      "step": 1656
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7929270139515606e-05,
      "loss": 0.753,
      "step": 1657
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7926502701873015e-05,
      "loss": 0.6804,
      "step": 1658
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.792373363007e-05,
      "loss": 0.6398,
      "step": 1659
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.792096292467744e-05,
      "loss": 0.7142,
      "step": 1660
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7918190586266567e-05,
      "loss": 0.7813,
      "step": 1661
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7915416615408923e-05,
      "loss": 0.7023,
      "step": 1662
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.791264101267641e-05,
      "loss": 0.5867,
      "step": 1663
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7909863778641256e-05,
      "loss": 0.6244,
      "step": 1664
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7907084913876027e-05,
      "loss": 0.8432,
      "step": 1665
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7904304418953624e-05,
      "loss": 0.6528,
      "step": 1666
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7901522294447285e-05,
      "loss": 0.8272,
      "step": 1667
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7898738540930584e-05,
      "loss": 0.6654,
      "step": 1668
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7895953158977436e-05,
      "loss": 0.7541,
      "step": 1669
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.789316614916208e-05,
      "loss": 0.7324,
      "step": 1670
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7890377512059102e-05,
      "loss": 0.6471,
      "step": 1671
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.788758724824341e-05,
      "loss": 0.7152,
      "step": 1672
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7884795358290273e-05,
      "loss": 0.7854,
      "step": 1673
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7882001842775264e-05,
      "loss": 0.6978,
      "step": 1674
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.787920670227431e-05,
      "loss": 0.7585,
      "step": 1675
    },
    {
      "epoch": 0.23,
      "learning_rate": 1.7876409937363677e-05,
      "loss": 0.6677,
      "step": 1676
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.787361154861994e-05,
      "loss": 0.6794,
      "step": 1677
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7870811536620043e-05,
      "loss": 0.6838,
      "step": 1678
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7868009901941242e-05,
      "loss": 0.8172,
      "step": 1679
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.786520664516113e-05,
      "loss": 0.6315,
      "step": 1680
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.786240176685764e-05,
      "loss": 0.7667,
      "step": 1681
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.785959526760904e-05,
      "loss": 0.7211,
      "step": 1682
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7856787147993924e-05,
      "loss": 0.6761,
      "step": 1683
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7853977408591234e-05,
      "loss": 0.7125,
      "step": 1684
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.785116604998023e-05,
      "loss": 0.6602,
      "step": 1685
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7848353072740518e-05,
      "loss": 0.6756,
      "step": 1686
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7845538477452026e-05,
      "loss": 0.7856,
      "step": 1687
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.784272226469503e-05,
      "loss": 0.7339,
      "step": 1688
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.783990443505013e-05,
      "loss": 0.7581,
      "step": 1689
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.783708498909826e-05,
      "loss": 0.6254,
      "step": 1690
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.783426392742069e-05,
      "loss": 0.7623,
      "step": 1691
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7831441250599016e-05,
      "loss": 0.81,
      "step": 1692
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7828616959215185e-05,
      "loss": 0.699,
      "step": 1693
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.782579105385145e-05,
      "loss": 0.6898,
      "step": 1694
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7822963535090422e-05,
      "loss": 0.6783,
      "step": 1695
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.782013440351503e-05,
      "loss": 0.717,
      "step": 1696
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7817303659708543e-05,
      "loss": 0.651,
      "step": 1697
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.781447130425455e-05,
      "loss": 0.6549,
      "step": 1698
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7811637337736988e-05,
      "loss": 0.682,
      "step": 1699
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.780880176074012e-05,
      "loss": 0.7446,
      "step": 1700
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.780596457384854e-05,
      "loss": 0.6868,
      "step": 1701
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7803125777647167e-05,
      "loss": 0.6379,
      "step": 1702
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.780028537272126e-05,
      "loss": 0.7394,
      "step": 1703
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.779744335965642e-05,
      "loss": 0.6459,
      "step": 1704
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7794599739038562e-05,
      "loss": 0.6803,
      "step": 1705
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7791754511453932e-05,
      "loss": 0.8184,
      "step": 1706
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7788907677489122e-05,
      "loss": 0.5915,
      "step": 1707
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7786059237731042e-05,
      "loss": 0.7834,
      "step": 1708
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7783209192766942e-05,
      "loss": 0.7184,
      "step": 1709
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7780357543184396e-05,
      "loss": 0.6513,
      "step": 1710
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7777504289571313e-05,
      "loss": 0.6234,
      "step": 1711
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7774649432515933e-05,
      "loss": 0.7323,
      "step": 1712
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.777179297260682e-05,
      "loss": 0.7302,
      "step": 1713
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7768934910432884e-05,
      "loss": 0.6468,
      "step": 1714
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.776607524658334e-05,
      "loss": 0.5819,
      "step": 1715
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7763213981647762e-05,
      "loss": 0.744,
      "step": 1716
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.776035111621603e-05,
      "loss": 0.6565,
      "step": 1717
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.775748665087837e-05,
      "loss": 0.6254,
      "step": 1718
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.775462058622533e-05,
      "loss": 0.6065,
      "step": 1719
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.775175292284779e-05,
      "loss": 0.5953,
      "step": 1720
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.774888366133696e-05,
      "loss": 0.6738,
      "step": 1721
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7746012802284375e-05,
      "loss": 0.7122,
      "step": 1722
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.774314034628191e-05,
      "loss": 0.7487,
      "step": 1723
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7740266293921758e-05,
      "loss": 0.7759,
      "step": 1724
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7737390645796445e-05,
      "loss": 0.7425,
      "step": 1725
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7734513402498825e-05,
      "loss": 0.5593,
      "step": 1726
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7731634564622087e-05,
      "loss": 0.6948,
      "step": 1727
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7728754132759742e-05,
      "loss": 0.6038,
      "step": 1728
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.772587210750563e-05,
      "loss": 0.6767,
      "step": 1729
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7722988489453926e-05,
      "loss": 0.6871,
      "step": 1730
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.772010327919912e-05,
      "loss": 0.7852,
      "step": 1731
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.771721647733605e-05,
      "loss": 0.7669,
      "step": 1732
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7714328084459858e-05,
      "loss": 0.7189,
      "step": 1733
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.771143810116604e-05,
      "loss": 0.7041,
      "step": 1734
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.77085465280504e-05,
      "loss": 0.7787,
      "step": 1735
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7705653365709074e-05,
      "loss": 0.706,
      "step": 1736
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7702758614738533e-05,
      "loss": 0.68,
      "step": 1737
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.769986227573557e-05,
      "loss": 0.7582,
      "step": 1738
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7696964349297307e-05,
      "loss": 0.7264,
      "step": 1739
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.769406483602119e-05,
      "loss": 0.6815,
      "step": 1740
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7691163736504993e-05,
      "loss": 0.6235,
      "step": 1741
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7688261051346827e-05,
      "loss": 0.677,
      "step": 1742
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7685356781145112e-05,
      "loss": 0.7046,
      "step": 1743
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.768245092649861e-05,
      "loss": 0.6896,
      "step": 1744
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7679543488006398e-05,
      "loss": 0.7321,
      "step": 1745
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7676634466267893e-05,
      "loss": 0.6762,
      "step": 1746
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.7673723861882827e-05,
      "loss": 0.6841,
      "step": 1747
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7670811675451262e-05,
      "loss": 0.6444,
      "step": 1748
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7667897907573586e-05,
      "loss": 0.694,
      "step": 1749
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7664982558850518e-05,
      "loss": 0.7104,
      "step": 1750
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.766206562988309e-05,
      "loss": 0.7038,
      "step": 1751
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7659147121272675e-05,
      "loss": 0.6684,
      "step": 1752
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7656227033620963e-05,
      "loss": 0.6212,
      "step": 1753
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.765330536752997e-05,
      "loss": 0.7588,
      "step": 1754
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.765038212360204e-05,
      "loss": 0.7006,
      "step": 1755
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.764745730243984e-05,
      "loss": 0.6645,
      "step": 1756
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7644530904646365e-05,
      "loss": 0.6648,
      "step": 1757
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.764160293082493e-05,
      "loss": 0.7393,
      "step": 1758
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7638673381579182e-05,
      "loss": 0.7783,
      "step": 1759
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7635742257513082e-05,
      "loss": 0.7311,
      "step": 1760
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.763280955923093e-05,
      "loss": 0.7774,
      "step": 1761
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7629875287337347e-05,
      "loss": 0.6678,
      "step": 1762
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.762693944243726e-05,
      "loss": 0.7333,
      "step": 1763
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7624002025135945e-05,
      "loss": 0.6578,
      "step": 1764
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7621063036038994e-05,
      "loss": 0.7235,
      "step": 1765
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.761812247575231e-05,
      "loss": 0.7099,
      "step": 1766
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7615180344882142e-05,
      "loss": 0.671,
      "step": 1767
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.761223664403505e-05,
      "loss": 0.7069,
      "step": 1768
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.760929137381792e-05,
      "loss": 0.8296,
      "step": 1769
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7606344534837953e-05,
      "loss": 0.6778,
      "step": 1770
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.760339612770269e-05,
      "loss": 0.6762,
      "step": 1771
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7600446153019982e-05,
      "loss": 0.6456,
      "step": 1772
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.759749461139801e-05,
      "loss": 0.7315,
      "step": 1773
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7594541503445275e-05,
      "loss": 0.7273,
      "step": 1774
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7591586829770603e-05,
      "loss": 0.6877,
      "step": 1775
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7588630590983143e-05,
      "loss": 0.692,
      "step": 1776
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.758567278769236e-05,
      "loss": 0.7345,
      "step": 1777
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7582713420508052e-05,
      "loss": 0.7376,
      "step": 1778
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7579752490040337e-05,
      "loss": 0.7906,
      "step": 1779
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7576789996899646e-05,
      "loss": 0.7007,
      "step": 1780
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.757382594169674e-05,
      "loss": 0.7429,
      "step": 1781
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7570860325042702e-05,
      "loss": 0.6342,
      "step": 1782
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7567893147548937e-05,
      "loss": 0.7254,
      "step": 1783
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7564924409827165e-05,
      "loss": 0.7954,
      "step": 1784
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7561954112489445e-05,
      "loss": 0.7357,
      "step": 1785
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.755898225614813e-05,
      "loss": 0.7078,
      "step": 1786
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7556008841415924e-05,
      "loss": 0.7368,
      "step": 1787
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.755303386890583e-05,
      "loss": 0.7883,
      "step": 1788
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7550057339231185e-05,
      "loss": 0.7041,
      "step": 1789
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.754707925300564e-05,
      "loss": 0.7361,
      "step": 1790
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7544099610843174e-05,
      "loss": 0.6846,
      "step": 1791
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7541118413358075e-05,
      "loss": 0.7062,
      "step": 1792
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7538135661164967e-05,
      "loss": 0.7541,
      "step": 1793
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7535151354878775e-05,
      "loss": 0.6483,
      "step": 1794
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7532165495114765e-05,
      "loss": 0.6819,
      "step": 1795
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7529178082488515e-05,
      "loss": 0.6257,
      "step": 1796
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.752618911761592e-05,
      "loss": 0.71,
      "step": 1797
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7523198601113197e-05,
      "loss": 0.6132,
      "step": 1798
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.752020653359688e-05,
      "loss": 0.6546,
      "step": 1799
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.751721291568383e-05,
      "loss": 0.7614,
      "step": 1800
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7514217747991223e-05,
      "loss": 0.6407,
      "step": 1801
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7511221031136555e-05,
      "loss": 0.7139,
      "step": 1802
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.750822276573764e-05,
      "loss": 0.6526,
      "step": 1803
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7505222952412614e-05,
      "loss": 0.7078,
      "step": 1804
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7502221591779932e-05,
      "loss": 0.7578,
      "step": 1805
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7499218684458362e-05,
      "loss": 0.5863,
      "step": 1806
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7496214231067002e-05,
      "loss": 0.6716,
      "step": 1807
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7493208232225262e-05,
      "loss": 0.7129,
      "step": 1808
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7490200688552867e-05,
      "loss": 0.7139,
      "step": 1809
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7487191600669863e-05,
      "loss": 0.7833,
      "step": 1810
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7484180969196626e-05,
      "loss": 0.6967,
      "step": 1811
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.748116879475383e-05,
      "loss": 0.689,
      "step": 1812
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.747815507796248e-05,
      "loss": 0.6464,
      "step": 1813
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.74751398194439e-05,
      "loss": 0.6597,
      "step": 1814
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.747212301981972e-05,
      "loss": 0.6395,
      "step": 1815
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7469104679711905e-05,
      "loss": 0.7176,
      "step": 1816
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7466084799742723e-05,
      "loss": 0.7314,
      "step": 1817
    },
    {
      "epoch": 0.25,
      "learning_rate": 1.7463063380534767e-05,
      "loss": 0.7222,
      "step": 1818
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7460040422710944e-05,
      "loss": 0.7214,
      "step": 1819
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7457015926894483e-05,
      "loss": 0.6219,
      "step": 1820
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7453989893708924e-05,
      "loss": 0.766,
      "step": 1821
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.745096232377812e-05,
      "loss": 0.7904,
      "step": 1822
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7447933217726254e-05,
      "loss": 0.6957,
      "step": 1823
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7444902576177823e-05,
      "loss": 0.7557,
      "step": 1824
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.744187039975763e-05,
      "loss": 0.6602,
      "step": 1825
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.74388366890908e-05,
      "loss": 0.7088,
      "step": 1826
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7435801444802784e-05,
      "loss": 0.802,
      "step": 1827
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.743276466751933e-05,
      "loss": 0.7263,
      "step": 1828
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7429726357866516e-05,
      "loss": 0.6935,
      "step": 1829
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7426686516470735e-05,
      "loss": 0.7412,
      "step": 1830
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.742364514395869e-05,
      "loss": 0.7417,
      "step": 1831
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7420602240957407e-05,
      "loss": 0.6539,
      "step": 1832
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7417557808094222e-05,
      "loss": 0.7313,
      "step": 1833
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7414511845996783e-05,
      "loss": 0.6931,
      "step": 1834
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7411464355293065e-05,
      "loss": 0.6882,
      "step": 1835
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7408415336611346e-05,
      "loss": 0.7519,
      "step": 1836
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7405364790580227e-05,
      "loss": 0.7329,
      "step": 1837
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.740231271782862e-05,
      "loss": 0.7052,
      "step": 1838
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7399259118985753e-05,
      "loss": 0.7054,
      "step": 1839
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.739620399468117e-05,
      "loss": 0.7257,
      "step": 1840
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.739314734554473e-05,
      "loss": 0.6739,
      "step": 1841
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7390089172206594e-05,
      "loss": 0.7568,
      "step": 1842
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7387029475297255e-05,
      "loss": 0.7646,
      "step": 1843
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7383968255447516e-05,
      "loss": 0.7377,
      "step": 1844
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7380905513288487e-05,
      "loss": 0.6958,
      "step": 1845
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7377841249451596e-05,
      "loss": 0.6988,
      "step": 1846
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7374775464568583e-05,
      "loss": 0.6639,
      "step": 1847
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7371708159271502e-05,
      "loss": 0.6994,
      "step": 1848
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7368639334192728e-05,
      "loss": 0.6755,
      "step": 1849
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7365568989964933e-05,
      "loss": 0.7025,
      "step": 1850
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.736249712722112e-05,
      "loss": 0.6937,
      "step": 1851
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.735942374659459e-05,
      "loss": 0.7396,
      "step": 1852
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.735634884871897e-05,
      "loss": 0.682,
      "step": 1853
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7353272434228187e-05,
      "loss": 0.6085,
      "step": 1854
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7350194503756493e-05,
      "loss": 0.7124,
      "step": 1855
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7347115057938446e-05,
      "loss": 0.7245,
      "step": 1856
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7344034097408916e-05,
      "loss": 0.6984,
      "step": 1857
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7340951622803084e-05,
      "loss": 0.6877,
      "step": 1858
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.733786763475645e-05,
      "loss": 0.6852,
      "step": 1859
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7334782133904823e-05,
      "loss": 0.7052,
      "step": 1860
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7331695120884312e-05,
      "loss": 0.6867,
      "step": 1861
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.732860659633136e-05,
      "loss": 0.6572,
      "step": 1862
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7325516560882706e-05,
      "loss": 0.6653,
      "step": 1863
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7322425015175402e-05,
      "loss": 0.726,
      "step": 1864
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.731933195984682e-05,
      "loss": 0.7649,
      "step": 1865
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7316237395534628e-05,
      "loss": 0.714,
      "step": 1866
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7313141322876824e-05,
      "loss": 0.7241,
      "step": 1867
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7310043742511697e-05,
      "loss": 0.6085,
      "step": 1868
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7306944655077865e-05,
      "loss": 0.7396,
      "step": 1869
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7303844061214247e-05,
      "loss": 0.7225,
      "step": 1870
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7300741961560073e-05,
      "loss": 0.7115,
      "step": 1871
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.729763835675488e-05,
      "loss": 0.688,
      "step": 1872
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7294533247438526e-05,
      "loss": 0.7121,
      "step": 1873
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7291426634251172e-05,
      "loss": 0.605,
      "step": 1874
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7288318517833292e-05,
      "loss": 0.7391,
      "step": 1875
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7285208898825665e-05,
      "loss": 0.6617,
      "step": 1876
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7282097777869384e-05,
      "loss": 0.6375,
      "step": 1877
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.727898515560585e-05,
      "loss": 0.7701,
      "step": 1878
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.727587103267677e-05,
      "loss": 0.6871,
      "step": 1879
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.727275540972417e-05,
      "loss": 0.6913,
      "step": 1880
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.726963828739038e-05,
      "loss": 0.6921,
      "step": 1881
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7266519666318034e-05,
      "loss": 0.6488,
      "step": 1882
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.726339954715009e-05,
      "loss": 0.6878,
      "step": 1883
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.726027793052979e-05,
      "loss": 0.6158,
      "step": 1884
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7257154817100706e-05,
      "loss": 0.5582,
      "step": 1885
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.725403020750672e-05,
      "loss": 0.6686,
      "step": 1886
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7250904102392004e-05,
      "loss": 0.7683,
      "step": 1887
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.724777650240105e-05,
      "loss": 0.6655,
      "step": 1888
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7244647408178658e-05,
      "loss": 0.6722,
      "step": 1889
    },
    {
      "epoch": 0.26,
      "learning_rate": 1.7241516820369937e-05,
      "loss": 0.6503,
      "step": 1890
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.72383847396203e-05,
      "loss": 0.7271,
      "step": 1891
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.723525116657547e-05,
      "loss": 0.7197,
      "step": 1892
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7232116101881476e-05,
      "loss": 0.787,
      "step": 1893
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.722897954618466e-05,
      "loss": 0.5451,
      "step": 1894
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7225841500131663e-05,
      "loss": 0.7386,
      "step": 1895
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7222701964369436e-05,
      "loss": 0.6439,
      "step": 1896
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7219560939545246e-05,
      "loss": 0.663,
      "step": 1897
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7216418426306654e-05,
      "loss": 0.6569,
      "step": 1898
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7213274425301533e-05,
      "loss": 0.7545,
      "step": 1899
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7210128937178066e-05,
      "loss": 0.7641,
      "step": 1900
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.720698196258474e-05,
      "loss": 0.8015,
      "step": 1901
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7203833502170347e-05,
      "loss": 0.6247,
      "step": 1902
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7200683556583984e-05,
      "loss": 0.6904,
      "step": 1903
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7197532126475057e-05,
      "loss": 0.6656,
      "step": 1904
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.719437921249328e-05,
      "loss": 0.6396,
      "step": 1905
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7191224815288678e-05,
      "loss": 0.7707,
      "step": 1906
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.718806893551156e-05,
      "loss": 0.7401,
      "step": 1907
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7184911573812565e-05,
      "loss": 0.6382,
      "step": 1908
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7181752730842623e-05,
      "loss": 0.7774,
      "step": 1909
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.717859240725298e-05,
      "loss": 0.7105,
      "step": 1910
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7175430603695174e-05,
      "loss": 0.7779,
      "step": 1911
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7172267320821062e-05,
      "loss": 0.6889,
      "step": 1912
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7169102559282794e-05,
      "loss": 0.7138,
      "step": 1913
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7165936319732833e-05,
      "loss": 0.7201,
      "step": 1914
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7162768602823943e-05,
      "loss": 0.8566,
      "step": 1915
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7159599409209194e-05,
      "loss": 0.7485,
      "step": 1916
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7156428739541963e-05,
      "loss": 0.7994,
      "step": 1917
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7153256594475922e-05,
      "loss": 0.691,
      "step": 1918
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7150082974665055e-05,
      "loss": 0.7652,
      "step": 1919
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7146907880763652e-05,
      "loss": 0.665,
      "step": 1920
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7143731313426305e-05,
      "loss": 0.6921,
      "step": 1921
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7140553273307904e-05,
      "loss": 0.74,
      "step": 1922
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7137373761063646e-05,
      "loss": 0.761,
      "step": 1923
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.713419277734903e-05,
      "loss": 0.7052,
      "step": 1924
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7131010322819875e-05,
      "loss": 0.7299,
      "step": 1925
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7127826398132272e-05,
      "loss": 0.7373,
      "step": 1926
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7124641003942638e-05,
      "loss": 0.6468,
      "step": 1927
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.712145414090769e-05,
      "loss": 0.7207,
      "step": 1928
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7118265809684445e-05,
      "loss": 0.6647,
      "step": 1929
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7115076010930217e-05,
      "loss": 0.7342,
      "step": 1930
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.711188474530263e-05,
      "loss": 0.7857,
      "step": 1931
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.710869201345961e-05,
      "loss": 0.7078,
      "step": 1932
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7105497816059388e-05,
      "loss": 0.6978,
      "step": 1933
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7102302153760484e-05,
      "loss": 0.6391,
      "step": 1934
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7099105027221732e-05,
      "loss": 0.669,
      "step": 1935
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.709590643710227e-05,
      "loss": 0.676,
      "step": 1936
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7092706384061526e-05,
      "loss": 0.6704,
      "step": 1937
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7089504868759238e-05,
      "loss": 0.6719,
      "step": 1938
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7086301891855443e-05,
      "loss": 0.7369,
      "step": 1939
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7083097454010484e-05,
      "loss": 0.6151,
      "step": 1940
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7079891555884997e-05,
      "loss": 0.6837,
      "step": 1941
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.707668419813992e-05,
      "loss": 0.7204,
      "step": 1942
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7073475381436504e-05,
      "loss": 0.6821,
      "step": 1943
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.707026510643629e-05,
      "loss": 0.6868,
      "step": 1944
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.706705337380111e-05,
      "loss": 0.7229,
      "step": 1945
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7063840184193122e-05,
      "loss": 0.7529,
      "step": 1946
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7060625538274766e-05,
      "loss": 0.7148,
      "step": 1947
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7057409436708783e-05,
      "loss": 0.6756,
      "step": 1948
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7054191880158223e-05,
      "loss": 0.7079,
      "step": 1949
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7050972869286424e-05,
      "loss": 0.6332,
      "step": 1950
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7047752404757037e-05,
      "loss": 0.6246,
      "step": 1951
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7044530487234007e-05,
      "loss": 0.7638,
      "step": 1952
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.704130711738157e-05,
      "loss": 0.6365,
      "step": 1953
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7038082295864275e-05,
      "loss": 0.6727,
      "step": 1954
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7034856023346964e-05,
      "loss": 0.6647,
      "step": 1955
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.703162830049478e-05,
      "loss": 0.6659,
      "step": 1956
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7028399127973158e-05,
      "loss": 0.6648,
      "step": 1957
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7025168506447843e-05,
      "loss": 0.6051,
      "step": 1958
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.702193643658487e-05,
      "loss": 0.6508,
      "step": 1959
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7018702919050578e-05,
      "loss": 0.7033,
      "step": 1960
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.7015467954511602e-05,
      "loss": 0.7816,
      "step": 1961
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.701223154363487e-05,
      "loss": 0.7188,
      "step": 1962
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.7008993687087628e-05,
      "loss": 0.6197,
      "step": 1963
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.700575438553739e-05,
      "loss": 1.1089,
      "step": 1964
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.700251363965199e-05,
      "loss": 0.7153,
      "step": 1965
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6999271450099558e-05,
      "loss": 0.7628,
      "step": 1966
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.699602781754851e-05,
      "loss": 0.6391,
      "step": 1967
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6992782742667573e-05,
      "loss": 0.7439,
      "step": 1968
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6989536226125758e-05,
      "loss": 0.664,
      "step": 1969
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6986288268592387e-05,
      "loss": 0.7207,
      "step": 1970
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6983038870737067e-05,
      "loss": 0.8017,
      "step": 1971
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6979788033229713e-05,
      "loss": 0.6621,
      "step": 1972
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.697653575674052e-05,
      "loss": 0.6986,
      "step": 1973
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6973282041940006e-05,
      "loss": 0.7147,
      "step": 1974
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6970026889498957e-05,
      "loss": 0.7806,
      "step": 1975
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.696677030008848e-05,
      "loss": 0.7318,
      "step": 1976
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6963512274379952e-05,
      "loss": 0.7395,
      "step": 1977
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6960252813045076e-05,
      "loss": 0.6693,
      "step": 1978
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.695699191675583e-05,
      "loss": 0.68,
      "step": 1979
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6953729586184492e-05,
      "loss": 0.688,
      "step": 1980
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6950465822003643e-05,
      "loss": 0.7558,
      "step": 1981
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6947200624886145e-05,
      "loss": 0.7399,
      "step": 1982
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.694393399550517e-05,
      "loss": 0.6508,
      "step": 1983
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.694066593453418e-05,
      "loss": 0.6848,
      "step": 1984
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6937396442646937e-05,
      "loss": 0.7597,
      "step": 1985
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.693412552051748e-05,
      "loss": 0.7216,
      "step": 1986
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6930853168820167e-05,
      "loss": 0.7867,
      "step": 1987
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6927579388229633e-05,
      "loss": 0.7557,
      "step": 1988
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6924304179420817e-05,
      "loss": 0.7231,
      "step": 1989
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.692102754306895e-05,
      "loss": 0.6822,
      "step": 1990
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6917749479849558e-05,
      "loss": 0.798,
      "step": 1991
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6914469990438455e-05,
      "loss": 0.6681,
      "step": 1992
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.691118907551176e-05,
      "loss": 0.7284,
      "step": 1993
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6907906735745877e-05,
      "loss": 0.7481,
      "step": 1994
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.69046229718175e-05,
      "loss": 0.7217,
      "step": 1995
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6901337784403638e-05,
      "loss": 0.6835,
      "step": 1996
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6898051174181564e-05,
      "loss": 0.7452,
      "step": 1997
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6894763141828872e-05,
      "loss": 0.7727,
      "step": 1998
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6891473688023425e-05,
      "loss": 0.6063,
      "step": 1999
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6888182813443398e-05,
      "loss": 0.7195,
      "step": 2000
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.688489051876725e-05,
      "loss": 0.7118,
      "step": 2001
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.688159680467373e-05,
      "loss": 0.7386,
      "step": 2002
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.687830167184189e-05,
      "loss": 0.7233,
      "step": 2003
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.687500512095106e-05,
      "loss": 0.757,
      "step": 2004
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6871707152680876e-05,
      "loss": 0.7342,
      "step": 2005
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6868407767711258e-05,
      "loss": 0.7062,
      "step": 2006
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6865106966722428e-05,
      "loss": 0.6914,
      "step": 2007
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6861804750394883e-05,
      "loss": 0.7281,
      "step": 2008
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6858501119409427e-05,
      "loss": 0.6893,
      "step": 2009
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.685519607444715e-05,
      "loss": 0.6976,
      "step": 2010
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.685188961618943e-05,
      "loss": 0.7105,
      "step": 2011
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6848581745317946e-05,
      "loss": 0.7023,
      "step": 2012
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6845272462514653e-05,
      "loss": 0.6253,
      "step": 2013
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6841961768461818e-05,
      "loss": 0.6965,
      "step": 2014
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.683864966384198e-05,
      "loss": 0.7572,
      "step": 2015
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6835336149337976e-05,
      "loss": 0.6789,
      "step": 2016
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6832021225632936e-05,
      "loss": 0.6549,
      "step": 2017
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.682870489341028e-05,
      "loss": 0.5909,
      "step": 2018
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.682538715335371e-05,
      "loss": 0.7333,
      "step": 2019
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6822068006147235e-05,
      "loss": 0.7405,
      "step": 2020
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6818747452475135e-05,
      "loss": 0.689,
      "step": 2021
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.681542549302199e-05,
      "loss": 0.6499,
      "step": 2022
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6812102128472675e-05,
      "loss": 0.6781,
      "step": 2023
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6808777359512344e-05,
      "loss": 0.7779,
      "step": 2024
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.680545118682645e-05,
      "loss": 0.653,
      "step": 2025
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.680212361110072e-05,
      "loss": 0.8058,
      "step": 2026
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6798794633021192e-05,
      "loss": 0.6869,
      "step": 2027
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.679546425327417e-05,
      "loss": 0.7471,
      "step": 2028
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6792132472546273e-05,
      "loss": 0.7238,
      "step": 2029
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6788799291524385e-05,
      "loss": 0.7718,
      "step": 2030
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.678546471089569e-05,
      "loss": 0.7434,
      "step": 2031
    },
    {
      "epoch": 0.28,
      "learning_rate": 1.6782128731347657e-05,
      "loss": 0.7008,
      "step": 2032
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.677879135356805e-05,
      "loss": 0.7058,
      "step": 2033
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6775452578244918e-05,
      "loss": 0.7012,
      "step": 2034
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.677211240606659e-05,
      "loss": 0.7101,
      "step": 2035
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.676877083772169e-05,
      "loss": 0.7712,
      "step": 2036
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6765427873899132e-05,
      "loss": 0.7117,
      "step": 2037
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.676208351528812e-05,
      "loss": 0.6963,
      "step": 2038
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6758737762578135e-05,
      "loss": 0.693,
      "step": 2039
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.675539061645895e-05,
      "loss": 0.7257,
      "step": 2040
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.675204207762063e-05,
      "loss": 0.6744,
      "step": 2041
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.674869214675352e-05,
      "loss": 0.7961,
      "step": 2042
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.674534082454826e-05,
      "loss": 0.6423,
      "step": 2043
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6741988111695765e-05,
      "loss": 0.6788,
      "step": 2044
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.673863400888726e-05,
      "loss": 0.6768,
      "step": 2045
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.673527851681422e-05,
      "loss": 0.7079,
      "step": 2046
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.673192163616844e-05,
      "loss": 0.769,
      "step": 2047
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6728563367641982e-05,
      "loss": 0.6497,
      "step": 2048
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.672520371192721e-05,
      "loss": 0.6783,
      "step": 2049
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6721842669716752e-05,
      "loss": 0.7647,
      "step": 2050
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6718480241703546e-05,
      "loss": 0.7436,
      "step": 2051
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6715116428580795e-05,
      "loss": 0.6808,
      "step": 2052
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6711751231042e-05,
      "loss": 0.6449,
      "step": 2053
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6708384649780943e-05,
      "loss": 0.6873,
      "step": 2054
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6705016685491696e-05,
      "loss": 0.7289,
      "step": 2055
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.670164733886861e-05,
      "loss": 0.6321,
      "step": 2056
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.669827661060632e-05,
      "loss": 0.6251,
      "step": 2057
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.669490450139975e-05,
      "loss": 0.558,
      "step": 2058
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6691531011944112e-05,
      "loss": 0.6764,
      "step": 2059
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.66881561429349e-05,
      "loss": 0.706,
      "step": 2060
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6684779895067887e-05,
      "loss": 0.7271,
      "step": 2061
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6681402269039133e-05,
      "loss": 0.6094,
      "step": 2062
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6678023265544983e-05,
      "loss": 0.7234,
      "step": 2063
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.667464288528207e-05,
      "loss": 0.707,
      "step": 2064
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6671261128947306e-05,
      "loss": 0.6778,
      "step": 2065
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6667877997237883e-05,
      "loss": 0.6901,
      "step": 2066
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.666449349085129e-05,
      "loss": 0.7055,
      "step": 2067
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6661107610485283e-05,
      "loss": 0.711,
      "step": 2068
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6657720356837918e-05,
      "loss": 0.682,
      "step": 2069
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6654331730607512e-05,
      "loss": 0.6696,
      "step": 2070
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6650941732492685e-05,
      "loss": 0.723,
      "step": 2071
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.664755036319234e-05,
      "loss": 0.7539,
      "step": 2072
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6644157623405646e-05,
      "loss": 0.6915,
      "step": 2073
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6640763513832067e-05,
      "loss": 0.6595,
      "step": 2074
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6637368035171346e-05,
      "loss": 0.6874,
      "step": 2075
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.663397118812351e-05,
      "loss": 0.669,
      "step": 2076
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.663057297338887e-05,
      "loss": 0.5952,
      "step": 2077
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.662717339166801e-05,
      "loss": 0.6548,
      "step": 2078
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6623772443661806e-05,
      "loss": 0.6655,
      "step": 2079
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6620370130071405e-05,
      "loss": 0.7375,
      "step": 2080
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6616966451598252e-05,
      "loss": 0.693,
      "step": 2081
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6613561408944057e-05,
      "loss": 0.6329,
      "step": 2082
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.661015500281082e-05,
      "loss": 0.7706,
      "step": 2083
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6606747233900816e-05,
      "loss": 0.817,
      "step": 2084
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.660333810291661e-05,
      "loss": 0.635,
      "step": 2085
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6599927610561034e-05,
      "loss": 0.6437,
      "step": 2086
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.659651575753722e-05,
      "loss": 0.7202,
      "step": 2087
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6593102544548562e-05,
      "loss": 0.6324,
      "step": 2088
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6589687972298748e-05,
      "loss": 0.6481,
      "step": 2089
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6586272041491734e-05,
      "loss": 0.6652,
      "step": 2090
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6582854752831765e-05,
      "loss": 0.7333,
      "step": 2091
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6579436107023366e-05,
      "loss": 0.6349,
      "step": 2092
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6576016104771334e-05,
      "loss": 0.7292,
      "step": 2093
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.657259474678075e-05,
      "loss": 0.6799,
      "step": 2094
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6569172033756988e-05,
      "loss": 0.7086,
      "step": 2095
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.656574796640567e-05,
      "loss": 0.5939,
      "step": 2096
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.656232254543273e-05,
      "loss": 0.6691,
      "step": 2097
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.655889577154436e-05,
      "loss": 0.7104,
      "step": 2098
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6555467645447038e-05,
      "loss": 0.6022,
      "step": 2099
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6552038167847528e-05,
      "loss": 0.7454,
      "step": 2100
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6548607339452853e-05,
      "loss": 0.6662,
      "step": 2101
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6545175160970335e-05,
      "loss": 0.7062,
      "step": 2102
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.6541741633107563e-05,
      "loss": 0.632,
      "step": 2103
    },
    {
      "epoch": 0.29,
      "learning_rate": 1.653830675657241e-05,
      "loss": 0.7666,
      "step": 2104
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6534870532073024e-05,
      "loss": 0.6387,
      "step": 2105
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6531432960317827e-05,
      "loss": 0.7315,
      "step": 2106
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6527994042015533e-05,
      "loss": 0.659,
      "step": 2107
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.652455377787511e-05,
      "loss": 0.6227,
      "step": 2108
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.652111216860582e-05,
      "loss": 0.7404,
      "step": 2109
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.651766921491721e-05,
      "loss": 0.5999,
      "step": 2110
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6514224917519083e-05,
      "loss": 0.7808,
      "step": 2111
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6510779277121534e-05,
      "loss": 0.721,
      "step": 2112
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.650733229443493e-05,
      "loss": 0.7156,
      "step": 2113
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.650388397016991e-05,
      "loss": 0.7287,
      "step": 2114
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6500434305037403e-05,
      "loss": 0.7803,
      "step": 2115
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.64969832997486e-05,
      "loss": 0.7172,
      "step": 2116
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6493530955014977e-05,
      "loss": 0.6689,
      "step": 2117
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6490077271548287e-05,
      "loss": 0.6453,
      "step": 2118
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6486622250060547e-05,
      "loss": 0.7457,
      "step": 2119
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6483165891264065e-05,
      "loss": 0.6987,
      "step": 2120
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.647970819587142e-05,
      "loss": 0.767,
      "step": 2121
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6476249164595456e-05,
      "loss": 0.7126,
      "step": 2122
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6472788798149307e-05,
      "loss": 0.7397,
      "step": 2123
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6469327097246378e-05,
      "loss": 0.7427,
      "step": 2124
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6465864062600342e-05,
      "loss": 0.708,
      "step": 2125
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.646239969492516e-05,
      "loss": 0.7699,
      "step": 2126
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6458933994935057e-05,
      "loss": 0.6742,
      "step": 2127
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.645546696334453e-05,
      "loss": 0.6598,
      "step": 2128
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6451998600868363e-05,
      "loss": 0.5612,
      "step": 2129
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6448528908221605e-05,
      "loss": 0.6219,
      "step": 2130
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6445057886119586e-05,
      "loss": 0.7965,
      "step": 2131
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6441585535277905e-05,
      "loss": 0.5918,
      "step": 2132
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.643811185641243e-05,
      "loss": 0.674,
      "step": 2133
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6434636850239315e-05,
      "loss": 0.709,
      "step": 2134
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6431160517474986e-05,
      "loss": 0.7406,
      "step": 2135
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6427682858836124e-05,
      "loss": 0.6781,
      "step": 2136
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.642420387503971e-05,
      "loss": 0.6305,
      "step": 2137
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6420723566802982e-05,
      "loss": 0.633,
      "step": 2138
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6417241934843455e-05,
      "loss": 0.7531,
      "step": 2139
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6413758979878912e-05,
      "loss": 0.6664,
      "step": 2140
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.641027470262742e-05,
      "loss": 0.6573,
      "step": 2141
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6406789103807306e-05,
      "loss": 0.6835,
      "step": 2142
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6403302184137185e-05,
      "loss": 0.7006,
      "step": 2143
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6399813944335922e-05,
      "loss": 0.6154,
      "step": 2144
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6396324385122676e-05,
      "loss": 0.6796,
      "step": 2145
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6392833507216865e-05,
      "loss": 0.6637,
      "step": 2146
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.638934131133818e-05,
      "loss": 0.6614,
      "step": 2147
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6385847798206597e-05,
      "loss": 0.6325,
      "step": 2148
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.638235296854234e-05,
      "loss": 0.6134,
      "step": 2149
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6378856823065926e-05,
      "loss": 0.7029,
      "step": 2150
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.637535936249813e-05,
      "loss": 0.7707,
      "step": 2151
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.637186058756001e-05,
      "loss": 0.6209,
      "step": 2152
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.636836049897288e-05,
      "loss": 0.723,
      "step": 2153
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6364859097458338e-05,
      "loss": 0.5934,
      "step": 2154
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.636135638373824e-05,
      "loss": 0.6841,
      "step": 2155
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.635785235853473e-05,
      "loss": 0.6947,
      "step": 2156
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.63543470225702e-05,
      "loss": 0.6972,
      "step": 2157
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6350840376567344e-05,
      "loss": 0.7074,
      "step": 2158
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6347332421249084e-05,
      "loss": 0.6563,
      "step": 2159
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.634382315733865e-05,
      "loss": 0.7424,
      "step": 2160
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.634031258555952e-05,
      "loss": 0.7924,
      "step": 2161
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6336800706635446e-05,
      "loss": 0.7065,
      "step": 2162
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.633328752129046e-05,
      "loss": 0.6745,
      "step": 2163
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6329773030248844e-05,
      "loss": 0.6963,
      "step": 2164
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6326257234235166e-05,
      "loss": 0.7623,
      "step": 2165
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6322740133974258e-05,
      "loss": 0.7332,
      "step": 2166
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6319221730191215e-05,
      "loss": 0.6291,
      "step": 2167
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6315702023611412e-05,
      "loss": 0.6761,
      "step": 2168
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6312181014960483e-05,
      "loss": 0.789,
      "step": 2169
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.630865870496433e-05,
      "loss": 0.7058,
      "step": 2170
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6305135094349133e-05,
      "loss": 0.6074,
      "step": 2171
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6301610183841333e-05,
      "loss": 0.766,
      "step": 2172
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6298083974167635e-05,
      "loss": 0.7565,
      "step": 2173
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6294556466055018e-05,
      "loss": 0.8,
      "step": 2174
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.6291027660230735e-05,
      "loss": 0.7384,
      "step": 2175
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.628749755742229e-05,
      "loss": 0.59,
      "step": 2176
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6283966158357474e-05,
      "loss": 0.7006,
      "step": 2177
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.628043346376432e-05,
      "loss": 0.6521,
      "step": 2178
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6276899474371157e-05,
      "loss": 0.7824,
      "step": 2179
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.627336419090656e-05,
      "loss": 0.7508,
      "step": 2180
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.626982761409938e-05,
      "loss": 0.7543,
      "step": 2181
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6266289744678726e-05,
      "loss": 0.6972,
      "step": 2182
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.626275058337399e-05,
      "loss": 0.7502,
      "step": 2183
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.625921013091481e-05,
      "loss": 0.722,
      "step": 2184
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6255668388031106e-05,
      "loss": 0.7178,
      "step": 2185
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6252125355453058e-05,
      "loss": 0.7372,
      "step": 2186
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6248581033911113e-05,
      "loss": 0.7166,
      "step": 2187
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6245035424135984e-05,
      "loss": 0.7117,
      "step": 2188
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6241488526858638e-05,
      "loss": 0.6311,
      "step": 2189
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.623794034281033e-05,
      "loss": 0.616,
      "step": 2190
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6234390872722563e-05,
      "loss": 0.7444,
      "step": 2191
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6230840117327114e-05,
      "loss": 0.7554,
      "step": 2192
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6227288077356016e-05,
      "loss": 0.7103,
      "step": 2193
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6223734753541575e-05,
      "loss": 0.7945,
      "step": 2194
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6220180146616358e-05,
      "loss": 0.687,
      "step": 2195
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.62166242573132e-05,
      "loss": 0.6835,
      "step": 2196
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6213067086365196e-05,
      "loss": 0.7507,
      "step": 2197
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6209508634505703e-05,
      "loss": 0.7407,
      "step": 2198
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6205948902468355e-05,
      "loss": 0.7038,
      "step": 2199
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6202387890987036e-05,
      "loss": 0.6904,
      "step": 2200
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6198825600795895e-05,
      "loss": 0.7429,
      "step": 2201
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6195262032629352e-05,
      "loss": 0.7475,
      "step": 2202
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.619169718722209e-05,
      "loss": 0.6307,
      "step": 2203
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.618813106530905e-05,
      "loss": 0.7806,
      "step": 2204
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6184563667625433e-05,
      "loss": 0.6479,
      "step": 2205
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6180994994906716e-05,
      "loss": 0.6242,
      "step": 2206
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6177425047888628e-05,
      "loss": 0.752,
      "step": 2207
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6173853827307165e-05,
      "loss": 0.5851,
      "step": 2208
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6170281333898583e-05,
      "loss": 0.7363,
      "step": 2209
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.61667075683994e-05,
      "loss": 0.7286,
      "step": 2210
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6163132531546407e-05,
      "loss": 0.6339,
      "step": 2211
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6159556224076637e-05,
      "loss": 0.7834,
      "step": 2212
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6155978646727405e-05,
      "loss": 0.7464,
      "step": 2213
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6152399800236276e-05,
      "loss": 0.6866,
      "step": 2214
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.614881968534108e-05,
      "loss": 0.6608,
      "step": 2215
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6145238302779902e-05,
      "loss": 0.5907,
      "step": 2216
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6141655653291103e-05,
      "loss": 0.6717,
      "step": 2217
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6138071737613293e-05,
      "loss": 0.7278,
      "step": 2218
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.613448655648535e-05,
      "loss": 0.7637,
      "step": 2219
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6130900110646404e-05,
      "loss": 0.708,
      "step": 2220
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.612731240083586e-05,
      "loss": 0.6095,
      "step": 2221
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6123723427793366e-05,
      "loss": 0.5706,
      "step": 2222
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6120133192258846e-05,
      "loss": 0.6651,
      "step": 2223
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.611654169497247e-05,
      "loss": 0.5748,
      "step": 2224
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6112948936674685e-05,
      "loss": 0.6562,
      "step": 2225
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6109354918106187e-05,
      "loss": 0.6656,
      "step": 2226
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6105759640007926e-05,
      "loss": 0.7495,
      "step": 2227
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6102163103121127e-05,
      "loss": 0.6775,
      "step": 2228
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6098565308187262e-05,
      "loss": 0.8074,
      "step": 2229
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6094966255948076e-05,
      "loss": 0.6793,
      "step": 2230
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6091365947145554e-05,
      "loss": 0.7308,
      "step": 2231
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6087764382521953e-05,
      "loss": 0.7759,
      "step": 2232
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.608416156281979e-05,
      "loss": 0.6388,
      "step": 2233
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6080557488781838e-05,
      "loss": 0.7349,
      "step": 2234
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6076952161151123e-05,
      "loss": 0.7062,
      "step": 2235
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6073345580670935e-05,
      "loss": 0.6744,
      "step": 2236
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6069737748084823e-05,
      "loss": 0.7039,
      "step": 2237
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6066128664136594e-05,
      "loss": 0.7777,
      "step": 2238
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6062518329570308e-05,
      "loss": 0.6416,
      "step": 2239
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.605890674513029e-05,
      "loss": 0.753,
      "step": 2240
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6055293911561113e-05,
      "loss": 0.647,
      "step": 2241
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6051679829607623e-05,
      "loss": 0.5938,
      "step": 2242
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6048064500014907e-05,
      "loss": 0.6485,
      "step": 2243
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.604444792352832e-05,
      "loss": 0.736,
      "step": 2244
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6040830100893465e-05,
      "loss": 0.6415,
      "step": 2245
    },
    {
      "epoch": 0.31,
      "learning_rate": 1.6037211032856215e-05,
      "loss": 0.694,
      "step": 2246
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6033590720162683e-05,
      "loss": 0.631,
      "step": 2247
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6029969163559256e-05,
      "loss": 0.7232,
      "step": 2248
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6026346363792565e-05,
      "loss": 0.7283,
      "step": 2249
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6022722321609504e-05,
      "loss": 0.6613,
      "step": 2250
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6019097037757214e-05,
      "loss": 0.7603,
      "step": 2251
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6015470512983103e-05,
      "loss": 0.6824,
      "step": 2252
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.601184274803483e-05,
      "loss": 0.7069,
      "step": 2253
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.600821374366031e-05,
      "loss": 0.7015,
      "step": 2254
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6004583500607713e-05,
      "loss": 0.6929,
      "step": 2255
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.6000952019625466e-05,
      "loss": 0.6085,
      "step": 2256
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.599731930146225e-05,
      "loss": 0.634,
      "step": 2257
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5993685346867e-05,
      "loss": 0.7147,
      "step": 2258
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5990050156588905e-05,
      "loss": 0.7463,
      "step": 2259
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5986413731377414e-05,
      "loss": 0.7071,
      "step": 2260
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.598277607198223e-05,
      "loss": 0.6152,
      "step": 2261
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5979137179153298e-05,
      "loss": 0.6979,
      "step": 2262
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.597549705364084e-05,
      "loss": 0.7492,
      "step": 2263
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5971855696195308e-05,
      "loss": 0.6436,
      "step": 2264
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5968213107567424e-05,
      "loss": 0.6865,
      "step": 2265
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.596456928850816e-05,
      "loss": 0.6201,
      "step": 2266
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5960924239768743e-05,
      "loss": 0.6479,
      "step": 2267
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.595727796210065e-05,
      "loss": 0.761,
      "step": 2268
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5953630456255603e-05,
      "loss": 0.7358,
      "step": 2269
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.59499817229856e-05,
      "loss": 0.7265,
      "step": 2270
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.594633176304287e-05,
      "loss": 0.6403,
      "step": 2271
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5942680577179906e-05,
      "loss": 0.6908,
      "step": 2272
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5939028166149454e-05,
      "loss": 0.7301,
      "step": 2273
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.593537453070451e-05,
      "loss": 0.6632,
      "step": 2274
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5931719671598323e-05,
      "loss": 0.6398,
      "step": 2275
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5928063589584387e-05,
      "loss": 0.7049,
      "step": 2276
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5924406285416462e-05,
      "loss": 0.6587,
      "step": 2277
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5920747759848554e-05,
      "loss": 0.6976,
      "step": 2278
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5917088013634914e-05,
      "loss": 0.6278,
      "step": 2279
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.591342704753005e-05,
      "loss": 0.8092,
      "step": 2280
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.590976486228873e-05,
      "loss": 0.6902,
      "step": 2281
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5906101458665955e-05,
      "loss": 0.6683,
      "step": 2282
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5902436837416996e-05,
      "loss": 0.7345,
      "step": 2283
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.589877099929736e-05,
      "loss": 0.648,
      "step": 2284
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5895103945062816e-05,
      "loss": 0.6823,
      "step": 2285
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5891435675469376e-05,
      "loss": 0.6923,
      "step": 2286
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5887766191273305e-05,
      "loss": 0.7071,
      "step": 2287
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5884095493231123e-05,
      "loss": 0.7137,
      "step": 2288
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5880423582099592e-05,
      "loss": 0.6216,
      "step": 2289
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5876750458635734e-05,
      "loss": 0.7098,
      "step": 2290
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5873076123596805e-05,
      "loss": 0.6172,
      "step": 2291
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.586940057774033e-05,
      "loss": 0.6771,
      "step": 2292
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5865723821824074e-05,
      "loss": 0.7675,
      "step": 2293
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5862045856606047e-05,
      "loss": 0.6522,
      "step": 2294
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.585836668284452e-05,
      "loss": 0.6215,
      "step": 2295
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5854686301298e-05,
      "loss": 0.6225,
      "step": 2296
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5851004712725254e-05,
      "loss": 0.7503,
      "step": 2297
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.584732191788529e-05,
      "loss": 0.7299,
      "step": 2298
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5843637917537374e-05,
      "loss": 0.656,
      "step": 2299
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5839952712441007e-05,
      "loss": 0.6792,
      "step": 2300
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5836266303355953e-05,
      "loss": 0.6695,
      "step": 2301
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5832578691042212e-05,
      "loss": 0.7145,
      "step": 2302
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5828889876260043e-05,
      "loss": 0.6702,
      "step": 2303
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.582519985976994e-05,
      "loss": 0.7586,
      "step": 2304
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.582150864233266e-05,
      "loss": 0.5727,
      "step": 2305
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.581781622470919e-05,
      "loss": 0.6982,
      "step": 2306
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5814122607660784e-05,
      "loss": 0.7143,
      "step": 2307
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5810427791948932e-05,
      "loss": 0.5883,
      "step": 2308
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5806731778335364e-05,
      "loss": 0.8073,
      "step": 2309
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.580303456758207e-05,
      "loss": 0.5739,
      "step": 2310
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5799336160451284e-05,
      "loss": 0.7125,
      "step": 2311
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5795636557705486e-05,
      "loss": 0.6686,
      "step": 2312
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5791935760107393e-05,
      "loss": 0.6724,
      "step": 2313
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5788233768419988e-05,
      "loss": 0.8126,
      "step": 2314
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.578453058340648e-05,
      "loss": 0.7657,
      "step": 2315
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.578082620583034e-05,
      "loss": 0.7278,
      "step": 2316
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.577712063645527e-05,
      "loss": 0.6892,
      "step": 2317
    },
    {
      "epoch": 0.32,
      "learning_rate": 1.5773413876045235e-05,
      "loss": 0.6632,
      "step": 2318
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5769705925364426e-05,
      "loss": 0.7543,
      "step": 2319
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5765996785177292e-05,
      "loss": 0.7063,
      "step": 2320
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5762286456248532e-05,
      "loss": 0.7309,
      "step": 2321
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5758574939343073e-05,
      "loss": 0.621,
      "step": 2322
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.57548622352261e-05,
      "loss": 0.7563,
      "step": 2323
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5751148344663043e-05,
      "loss": 0.5869,
      "step": 2324
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.574743326841957e-05,
      "loss": 0.6829,
      "step": 2325
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.57437170072616e-05,
      "loss": 0.6793,
      "step": 2326
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5739999561955283e-05,
      "loss": 0.6776,
      "step": 2327
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5736280933267033e-05,
      "loss": 0.7401,
      "step": 2328
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.573256112196349e-05,
      "loss": 0.6958,
      "step": 2329
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.572884012881155e-05,
      "loss": 0.6297,
      "step": 2330
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5725117954578348e-05,
      "loss": 0.6629,
      "step": 2331
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5721394600031267e-05,
      "loss": 0.7069,
      "step": 2332
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.571767006593792e-05,
      "loss": 0.7496,
      "step": 2333
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5713944353066178e-05,
      "loss": 0.6348,
      "step": 2334
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.571021746218415e-05,
      "loss": 0.7731,
      "step": 2335
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5706489394060177e-05,
      "loss": 0.6304,
      "step": 2336
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.570276014946287e-05,
      "loss": 0.7188,
      "step": 2337
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.569902972916105e-05,
      "loss": 0.7778,
      "step": 2338
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.569529813392381e-05,
      "loss": 0.6097,
      "step": 2339
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5691565364520458e-05,
      "loss": 0.6331,
      "step": 2340
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5687831421720564e-05,
      "loss": 0.7815,
      "step": 2341
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.568409630629393e-05,
      "loss": 0.7825,
      "step": 2342
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5680360019010608e-05,
      "loss": 0.7327,
      "step": 2343
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.567662256064088e-05,
      "loss": 0.652,
      "step": 2344
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.567288393195528e-05,
      "loss": 0.6349,
      "step": 2345
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5669144133724574e-05,
      "loss": 0.7143,
      "step": 2346
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5665403166719783e-05,
      "loss": 0.6028,
      "step": 2347
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.566166103171215e-05,
      "loss": 0.7648,
      "step": 2348
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5657917729473175e-05,
      "loss": 0.7066,
      "step": 2349
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5654173260774593e-05,
      "loss": 0.6853,
      "step": 2350
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5650427626388375e-05,
      "loss": 0.685,
      "step": 2351
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5646680827086743e-05,
      "loss": 0.6844,
      "step": 2352
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5642932863642145e-05,
      "loss": 0.7859,
      "step": 2353
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.563918373682728e-05,
      "loss": 0.7038,
      "step": 2354
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5635433447415088e-05,
      "loss": 0.7842,
      "step": 2355
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5631681996178735e-05,
      "loss": 0.8096,
      "step": 2356
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.562792938389164e-05,
      "loss": 0.6998,
      "step": 2357
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.562417561132746e-05,
      "loss": 0.7013,
      "step": 2358
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5620420679260086e-05,
      "loss": 0.6886,
      "step": 2359
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.561666458846365e-05,
      "loss": 0.7413,
      "step": 2360
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.561290733971252e-05,
      "loss": 0.7411,
      "step": 2361
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5609148933781305e-05,
      "loss": 0.7132,
      "step": 2362
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5605389371444864e-05,
      "loss": 0.7038,
      "step": 2363
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5601628653478275e-05,
      "loss": 0.6651,
      "step": 2364
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5597866780656863e-05,
      "loss": 0.7236,
      "step": 2365
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5594103753756197e-05,
      "loss": 0.6709,
      "step": 2366
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5590339573552072e-05,
      "loss": 0.7135,
      "step": 2367
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.558657424082053e-05,
      "loss": 0.6644,
      "step": 2368
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5582807756337845e-05,
      "loss": 0.6457,
      "step": 2369
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5579040120880537e-05,
      "loss": 0.7064,
      "step": 2370
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5575271335225348e-05,
      "loss": 0.6966,
      "step": 2371
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.557150140014927e-05,
      "loss": 0.7259,
      "step": 2372
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5567730316429536e-05,
      "loss": 0.6747,
      "step": 2373
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5563958084843598e-05,
      "loss": 0.7215,
      "step": 2374
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5560184706169156e-05,
      "loss": 0.6586,
      "step": 2375
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5556410181184152e-05,
      "loss": 0.7173,
      "step": 2376
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5552634510666752e-05,
      "loss": 0.7526,
      "step": 2377
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5548857695395366e-05,
      "loss": 0.6704,
      "step": 2378
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5545079736148637e-05,
      "loss": 0.772,
      "step": 2379
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5541300633705443e-05,
      "loss": 0.7205,
      "step": 2380
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.55375203888449e-05,
      "loss": 0.7026,
      "step": 2381
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5533739002346363e-05,
      "loss": 0.6171,
      "step": 2382
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5529956474989414e-05,
      "loss": 0.7072,
      "step": 2383
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5526172807553877e-05,
      "loss": 0.6885,
      "step": 2384
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5522388000819802e-05,
      "loss": 0.6468,
      "step": 2385
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5518602055567492e-05,
      "loss": 0.7176,
      "step": 2386
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.551481497257746e-05,
      "loss": 0.6094,
      "step": 2387
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.5511026752630477e-05,
      "loss": 0.7286,
      "step": 2388
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.550723739650753e-05,
      "loss": 0.6364,
      "step": 2389
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5503446904989856e-05,
      "loss": 0.7548,
      "step": 2390
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5499655278858913e-05,
      "loss": 0.64,
      "step": 2391
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.54958625188964e-05,
      "loss": 0.68,
      "step": 2392
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5492068625884245e-05,
      "loss": 0.6478,
      "step": 2393
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5488273600604617e-05,
      "loss": 0.6727,
      "step": 2394
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5484477443839912e-05,
      "loss": 0.7482,
      "step": 2395
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5480680156372766e-05,
      "loss": 0.6665,
      "step": 2396
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5476881738986037e-05,
      "loss": 0.666,
      "step": 2397
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.547308219246282e-05,
      "loss": 0.6454,
      "step": 2398
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.546928151758645e-05,
      "loss": 0.7086,
      "step": 2399
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5465479715140494e-05,
      "loss": 0.6602,
      "step": 2400
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.546167678590874e-05,
      "loss": 0.7586,
      "step": 2401
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5457872730675218e-05,
      "loss": 0.7566,
      "step": 2402
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.545406755022419e-05,
      "loss": 0.7311,
      "step": 2403
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5450261245340146e-05,
      "loss": 0.6407,
      "step": 2404
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5446453816807806e-05,
      "loss": 0.7506,
      "step": 2405
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.544264526541213e-05,
      "loss": 0.7856,
      "step": 2406
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.54388355919383e-05,
      "loss": 0.7081,
      "step": 2407
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.543502479717174e-05,
      "loss": 0.6039,
      "step": 2408
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5431212881898092e-05,
      "loss": 0.763,
      "step": 2409
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5427399846903248e-05,
      "loss": 0.7125,
      "step": 2410
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.54235856929733e-05,
      "loss": 0.7208,
      "step": 2411
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5419770420894607e-05,
      "loss": 0.775,
      "step": 2412
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.541595403145374e-05,
      "loss": 0.7566,
      "step": 2413
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5412136525437488e-05,
      "loss": 0.7456,
      "step": 2414
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5408317903632894e-05,
      "loss": 0.7275,
      "step": 2415
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5404498166827217e-05,
      "loss": 0.711,
      "step": 2416
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5400677315807954e-05,
      "loss": 0.6861,
      "step": 2417
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5396855351362824e-05,
      "loss": 0.6157,
      "step": 2418
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5393032274279782e-05,
      "loss": 0.7613,
      "step": 2419
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5389208085347006e-05,
      "loss": 0.6576,
      "step": 2420
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.538538278535291e-05,
      "loss": 0.7657,
      "step": 2421
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.538155637508613e-05,
      "loss": 0.7156,
      "step": 2422
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5377728855335537e-05,
      "loss": 0.5655,
      "step": 2423
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.537390022689022e-05,
      "loss": 0.692,
      "step": 2424
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.537007049053952e-05,
      "loss": 0.703,
      "step": 2425
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.536623964707298e-05,
      "loss": 0.7158,
      "step": 2426
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5362407697280385e-05,
      "loss": 0.7084,
      "step": 2427
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.535857464195175e-05,
      "loss": 0.7073,
      "step": 2428
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5354740481877305e-05,
      "loss": 0.6042,
      "step": 2429
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5350905217847522e-05,
      "loss": 0.7405,
      "step": 2430
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5347068850653095e-05,
      "loss": 0.5511,
      "step": 2431
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.534323138108494e-05,
      "loss": 0.6889,
      "step": 2432
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.533939280993421e-05,
      "loss": 0.6907,
      "step": 2433
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5335553137992286e-05,
      "loss": 0.6335,
      "step": 2434
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.533171236605076e-05,
      "loss": 0.7092,
      "step": 2435
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5327870494901467e-05,
      "loss": 0.6423,
      "step": 2436
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5324027525336463e-05,
      "loss": 0.7288,
      "step": 2437
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5320183458148025e-05,
      "loss": 0.6853,
      "step": 2438
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.531633829412867e-05,
      "loss": 0.7582,
      "step": 2439
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5312492034071125e-05,
      "loss": 0.7942,
      "step": 2440
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.530864467876836e-05,
      "loss": 0.6614,
      "step": 2441
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5304796229013554e-05,
      "loss": 0.652,
      "step": 2442
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.530094668560012e-05,
      "loss": 0.6954,
      "step": 2443
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5297096049321697e-05,
      "loss": 0.6217,
      "step": 2444
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.529324432097215e-05,
      "loss": 0.7196,
      "step": 2445
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5289391501345566e-05,
      "loss": 0.6912,
      "step": 2446
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5285537591236257e-05,
      "loss": 0.6867,
      "step": 2447
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.528168259143876e-05,
      "loss": 0.7927,
      "step": 2448
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.527782650274784e-05,
      "loss": 0.6306,
      "step": 2449
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5273969325958483e-05,
      "loss": 0.7086,
      "step": 2450
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5270111061865902e-05,
      "loss": 0.6949,
      "step": 2451
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5266251711265532e-05,
      "loss": 0.6344,
      "step": 2452
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.526239127495303e-05,
      "loss": 0.7386,
      "step": 2453
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5258529753724283e-05,
      "loss": 0.7078,
      "step": 2454
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5254667148375394e-05,
      "loss": 0.6419,
      "step": 2455
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5250803459702698e-05,
      "loss": 0.6609,
      "step": 2456
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5246938688502746e-05,
      "loss": 0.7335,
      "step": 2457
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.5243072835572319e-05,
      "loss": 0.7524,
      "step": 2458
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.523920590170841e-05,
      "loss": 0.6752,
      "step": 2459
    },
    {
      "epoch": 0.34,
      "learning_rate": 1.523533788770825e-05,
      "loss": 0.6666,
      "step": 2460
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5231468794369283e-05,
      "loss": 0.6651,
      "step": 2461
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.522759862248917e-05,
      "loss": 0.9376,
      "step": 2462
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5223727372865806e-05,
      "loss": 0.7761,
      "step": 2463
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.521985504629731e-05,
      "loss": 0.7435,
      "step": 2464
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5215981643582009e-05,
      "loss": 0.747,
      "step": 2465
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5212107165518463e-05,
      "loss": 0.6084,
      "step": 2466
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5208231612905447e-05,
      "loss": 0.7687,
      "step": 2467
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5204354986541968e-05,
      "loss": 0.649,
      "step": 2468
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5200477287227236e-05,
      "loss": 0.6542,
      "step": 2469
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5196598515760703e-05,
      "loss": 0.7485,
      "step": 2470
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.519271867294203e-05,
      "loss": 0.6542,
      "step": 2471
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.51888377595711e-05,
      "loss": 0.7259,
      "step": 2472
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5184955776448021e-05,
      "loss": 0.6914,
      "step": 2473
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5181072724373115e-05,
      "loss": 0.6839,
      "step": 2474
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5177188604146929e-05,
      "loss": 0.7384,
      "step": 2475
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5173303416570232e-05,
      "loss": 0.7086,
      "step": 2476
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5169417162444005e-05,
      "loss": 0.7135,
      "step": 2477
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5165529842569458e-05,
      "loss": 0.6431,
      "step": 2478
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5161641457748015e-05,
      "loss": 0.7107,
      "step": 2479
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5157752008781324e-05,
      "loss": 0.5789,
      "step": 2480
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.515386149647125e-05,
      "loss": 0.7332,
      "step": 2481
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5149969921619874e-05,
      "loss": 0.6443,
      "step": 2482
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5146077285029496e-05,
      "loss": 0.7027,
      "step": 2483
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5142183587502647e-05,
      "loss": 0.7244,
      "step": 2484
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5138288829842062e-05,
      "loss": 0.6571,
      "step": 2485
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.51343930128507e-05,
      "loss": 0.6638,
      "step": 2486
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5130496137331743e-05,
      "loss": 0.7302,
      "step": 2487
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.512659820408858e-05,
      "loss": 0.6959,
      "step": 2488
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5122699213924833e-05,
      "loss": 0.6439,
      "step": 2489
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.511879916764433e-05,
      "loss": 0.6664,
      "step": 2490
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5114898066051119e-05,
      "loss": 0.6508,
      "step": 2491
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5110995909949465e-05,
      "loss": 0.6382,
      "step": 2492
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5107092700143857e-05,
      "loss": 0.7272,
      "step": 2493
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5103188437438995e-05,
      "loss": 0.7208,
      "step": 2494
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5099283122639805e-05,
      "loss": 0.5938,
      "step": 2495
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5095376756551413e-05,
      "loss": 0.8537,
      "step": 2496
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5091469339979172e-05,
      "loss": 0.6511,
      "step": 2497
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5087560873728658e-05,
      "loss": 0.7874,
      "step": 2498
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.508365135860565e-05,
      "loss": 0.7696,
      "step": 2499
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5079740795416154e-05,
      "loss": 0.7146,
      "step": 2500
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5075829184966386e-05,
      "loss": 0.7052,
      "step": 2501
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5071916528062778e-05,
      "loss": 0.6542,
      "step": 2502
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5068002825511982e-05,
      "loss": 0.7667,
      "step": 2503
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5064088078120864e-05,
      "loss": 0.716,
      "step": 2504
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5060172286696502e-05,
      "loss": 0.7454,
      "step": 2505
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5056255452046192e-05,
      "loss": 0.7453,
      "step": 2506
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5052337574977445e-05,
      "loss": 0.7711,
      "step": 2507
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.504841865629799e-05,
      "loss": 0.7924,
      "step": 2508
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.504449869681576e-05,
      "loss": 0.7341,
      "step": 2509
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5040577697338913e-05,
      "loss": 0.6726,
      "step": 2510
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5036655658675825e-05,
      "loss": 0.7263,
      "step": 2511
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5032732581635068e-05,
      "loss": 0.7132,
      "step": 2512
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.502880846702545e-05,
      "loss": 0.6541,
      "step": 2513
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5024883315655978e-05,
      "loss": 0.6556,
      "step": 2514
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5020957128335881e-05,
      "loss": 1.0687,
      "step": 2515
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.501702990587459e-05,
      "loss": 0.7074,
      "step": 2516
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5013101649081762e-05,
      "loss": 0.6944,
      "step": 2517
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5009172358767263e-05,
      "loss": 0.7031,
      "step": 2518
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5005242035741177e-05,
      "loss": 0.7571,
      "step": 2519
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.5001310680813784e-05,
      "loss": 0.6764,
      "step": 2520
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4997378294795597e-05,
      "loss": 0.6518,
      "step": 2521
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.499344487849733e-05,
      "loss": 0.7538,
      "step": 2522
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4989510432729912e-05,
      "loss": 0.6212,
      "step": 2523
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4985574958304486e-05,
      "loss": 0.7539,
      "step": 2524
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4981638456032403e-05,
      "loss": 0.663,
      "step": 2525
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4977700926725231e-05,
      "loss": 0.5762,
      "step": 2526
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4973762371194747e-05,
      "loss": 0.6131,
      "step": 2527
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.496982279025294e-05,
      "loss": 0.6758,
      "step": 2528
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4965882184712008e-05,
      "loss": 0.7668,
      "step": 2529
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4961940555384365e-05,
      "loss": 0.6204,
      "step": 2530
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4957997903082633e-05,
      "loss": 0.6805,
      "step": 2531
    },
    {
      "epoch": 0.35,
      "learning_rate": 1.4954054228619643e-05,
      "loss": 0.6474,
      "step": 2532
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4950109532808441e-05,
      "loss": 0.7357,
      "step": 2533
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4946163816462283e-05,
      "loss": 0.6634,
      "step": 2534
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4942217080394632e-05,
      "loss": 0.6018,
      "step": 2535
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4938269325419166e-05,
      "loss": 0.7304,
      "step": 2536
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4934320552349768e-05,
      "loss": 0.6172,
      "step": 2537
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4930370762000533e-05,
      "loss": 0.6699,
      "step": 2538
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4926419955185768e-05,
      "loss": 0.7373,
      "step": 2539
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4922468132719985e-05,
      "loss": 0.7462,
      "step": 2540
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.491851529541791e-05,
      "loss": 0.6447,
      "step": 2541
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.491456144409448e-05,
      "loss": 0.6625,
      "step": 2542
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4910606579564827e-05,
      "loss": 0.7723,
      "step": 2543
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4906650702644312e-05,
      "loss": 0.6723,
      "step": 2544
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.490269381414849e-05,
      "loss": 0.6719,
      "step": 2545
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4898735914893132e-05,
      "loss": 0.7084,
      "step": 2546
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4894777005694212e-05,
      "loss": 0.6309,
      "step": 2547
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4890817087367914e-05,
      "loss": 0.8029,
      "step": 2548
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4886856160730635e-05,
      "loss": 0.5744,
      "step": 2549
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4882894226598975e-05,
      "loss": 0.7224,
      "step": 2550
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4878931285789744e-05,
      "loss": 0.6792,
      "step": 2551
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4874967339119954e-05,
      "loss": 0.7275,
      "step": 2552
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4871002387406831e-05,
      "loss": 0.681,
      "step": 2553
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4867036431467808e-05,
      "loss": 0.6315,
      "step": 2554
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4863069472120515e-05,
      "loss": 0.7741,
      "step": 2555
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4859101510182804e-05,
      "loss": 0.7139,
      "step": 2556
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4855132546472725e-05,
      "loss": 0.6051,
      "step": 2557
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4851162581808536e-05,
      "loss": 0.7029,
      "step": 2558
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.48471916170087e-05,
      "loss": 0.7049,
      "step": 2559
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4843219652891889e-05,
      "loss": 0.6938,
      "step": 2560
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4839246690276979e-05,
      "loss": 0.729,
      "step": 2561
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.483527272998305e-05,
      "loss": 0.6632,
      "step": 2562
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.483129777282939e-05,
      "loss": 0.7828,
      "step": 2563
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4827321819635496e-05,
      "loss": 0.6298,
      "step": 2564
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4823344871221064e-05,
      "loss": 0.6743,
      "step": 2565
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4819366928406003e-05,
      "loss": 0.6565,
      "step": 2566
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4815387992010415e-05,
      "loss": 0.6604,
      "step": 2567
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4811408062854617e-05,
      "loss": 0.6371,
      "step": 2568
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.480742714175913e-05,
      "loss": 0.7165,
      "step": 2569
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4803445229544673e-05,
      "loss": 0.7122,
      "step": 2570
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4799462327032178e-05,
      "loss": 0.6789,
      "step": 2571
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.479547843504277e-05,
      "loss": 0.6448,
      "step": 2572
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4791493554397789e-05,
      "loss": 0.6768,
      "step": 2573
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4787507685918774e-05,
      "loss": 0.7317,
      "step": 2574
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.478352083042747e-05,
      "loss": 0.6896,
      "step": 2575
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4779532988745819e-05,
      "loss": 0.6701,
      "step": 2576
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4775544161695975e-05,
      "loss": 0.705,
      "step": 2577
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.477155435010029e-05,
      "loss": 0.6729,
      "step": 2578
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4767563554781316e-05,
      "loss": 0.7109,
      "step": 2579
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4763571776561818e-05,
      "loss": 0.7015,
      "step": 2580
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4759579016264753e-05,
      "loss": 0.6839,
      "step": 2581
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4755585274713289e-05,
      "loss": 0.7234,
      "step": 2582
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4751590552730786e-05,
      "loss": 0.6403,
      "step": 2583
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4747594851140816e-05,
      "loss": 0.6607,
      "step": 2584
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.474359817076715e-05,
      "loss": 0.6146,
      "step": 2585
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4739600512433761e-05,
      "loss": 0.7886,
      "step": 2586
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4735601876964818e-05,
      "loss": 0.6867,
      "step": 2587
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4731602265184701e-05,
      "loss": 0.6759,
      "step": 2588
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4727601677917985e-05,
      "loss": 0.6489,
      "step": 2589
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4723600115989447e-05,
      "loss": 0.675,
      "step": 2590
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4719597580224065e-05,
      "loss": 0.5811,
      "step": 2591
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4715594071447016e-05,
      "loss": 0.6563,
      "step": 2592
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4711589590483688e-05,
      "loss": 0.7065,
      "step": 2593
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4707584138159652e-05,
      "loss": 0.6945,
      "step": 2594
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4703577715300692e-05,
      "loss": 0.6913,
      "step": 2595
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.469957032273279e-05,
      "loss": 0.6065,
      "step": 2596
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4695561961282127e-05,
      "loss": 0.7905,
      "step": 2597
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.469155263177508e-05,
      "loss": 0.7327,
      "step": 2598
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4687542335038234e-05,
      "loss": 0.6806,
      "step": 2599
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4683531071898365e-05,
      "loss": 0.8039,
      "step": 2600
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4679518843182447e-05,
      "loss": 0.7762,
      "step": 2601
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.4675505649717665e-05,
      "loss": 0.7207,
      "step": 2602
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.467149149233139e-05,
      "loss": 0.736,
      "step": 2603
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4667476371851205e-05,
      "loss": 0.7503,
      "step": 2604
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4663460289104876e-05,
      "loss": 0.7171,
      "step": 2605
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4659443244920378e-05,
      "loss": 0.8198,
      "step": 2606
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.465542524012588e-05,
      "loss": 0.6818,
      "step": 2607
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4651406275549755e-05,
      "loss": 0.6395,
      "step": 2608
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.464738635202056e-05,
      "loss": 0.9578,
      "step": 2609
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.464336547036707e-05,
      "loss": 0.7545,
      "step": 2610
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4639343631418239e-05,
      "loss": 0.6849,
      "step": 2611
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4635320836003228e-05,
      "loss": 0.7082,
      "step": 2612
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4631297084951398e-05,
      "loss": 0.6552,
      "step": 2613
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.462727237909229e-05,
      "loss": 0.6883,
      "step": 2614
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4623246719255666e-05,
      "loss": 0.7753,
      "step": 2615
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4619220106271466e-05,
      "loss": 0.7296,
      "step": 2616
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4615192540969837e-05,
      "loss": 0.7319,
      "step": 2617
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4611164024181113e-05,
      "loss": 0.7842,
      "step": 2618
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4607134556735836e-05,
      "loss": 0.714,
      "step": 2619
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4603104139464734e-05,
      "loss": 0.5578,
      "step": 2620
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4599072773198734e-05,
      "loss": 0.6436,
      "step": 2621
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4595040458768961e-05,
      "loss": 0.6755,
      "step": 2622
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4591007197006732e-05,
      "loss": 0.7233,
      "step": 2623
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4586972988743565e-05,
      "loss": 0.6674,
      "step": 2624
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.458293783481116e-05,
      "loss": 0.7126,
      "step": 2625
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4578901736041429e-05,
      "loss": 0.6973,
      "step": 2626
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4574864693266467e-05,
      "loss": 0.6752,
      "step": 2627
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.457082670731857e-05,
      "loss": 0.7603,
      "step": 2628
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4566787779030225e-05,
      "loss": 0.6444,
      "step": 2629
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4562747909234111e-05,
      "loss": 0.6672,
      "step": 2630
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4558707098763109e-05,
      "loss": 0.7268,
      "step": 2631
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4554665348450285e-05,
      "loss": 0.7191,
      "step": 2632
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4550622659128906e-05,
      "loss": 0.6957,
      "step": 2633
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4546579031632427e-05,
      "loss": 0.6471,
      "step": 2634
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.45425344667945e-05,
      "loss": 0.6449,
      "step": 2635
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4538488965448968e-05,
      "loss": 0.6646,
      "step": 2636
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4534442528429874e-05,
      "loss": 0.6539,
      "step": 2637
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4530395156571437e-05,
      "loss": 0.6733,
      "step": 2638
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.452634685070809e-05,
      "loss": 0.646,
      "step": 2639
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4522297611674443e-05,
      "loss": 0.5761,
      "step": 2640
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4518247440305307e-05,
      "loss": 0.6845,
      "step": 2641
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.451419633743568e-05,
      "loss": 0.7223,
      "step": 2642
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4510144303900753e-05,
      "loss": 0.7044,
      "step": 2643
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4506091340535915e-05,
      "loss": 0.7426,
      "step": 2644
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4502037448176734e-05,
      "loss": 0.7003,
      "step": 2645
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4497982627658985e-05,
      "loss": 0.633,
      "step": 2646
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4493926879818618e-05,
      "loss": 0.6768,
      "step": 2647
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4489870205491792e-05,
      "loss": 0.5783,
      "step": 2648
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.448581260551484e-05,
      "loss": 0.6512,
      "step": 2649
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4481754080724295e-05,
      "loss": 0.7181,
      "step": 2650
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4477694631956885e-05,
      "loss": 0.8179,
      "step": 2651
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4473634260049516e-05,
      "loss": 0.6833,
      "step": 2652
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4469572965839294e-05,
      "loss": 0.7194,
      "step": 2653
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.446551075016351e-05,
      "loss": 0.5695,
      "step": 2654
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.446144761385965e-05,
      "loss": 0.727,
      "step": 2655
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4457383557765385e-05,
      "loss": 0.5929,
      "step": 2656
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4453318582718576e-05,
      "loss": 0.7693,
      "step": 2657
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.444925268955728e-05,
      "loss": 0.7311,
      "step": 2658
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4445185879119734e-05,
      "loss": 0.7603,
      "step": 2659
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4441118152244371e-05,
      "loss": 0.6628,
      "step": 2660
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4437049509769806e-05,
      "loss": 0.6109,
      "step": 2661
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4432979952534853e-05,
      "loss": 0.6763,
      "step": 2662
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4428909481378503e-05,
      "loss": 0.7343,
      "step": 2663
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4424838097139946e-05,
      "loss": 0.6572,
      "step": 2664
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.442076580065855e-05,
      "loss": 0.7426,
      "step": 2665
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4416692592773884e-05,
      "loss": 0.6749,
      "step": 2666
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.441261847432569e-05,
      "loss": 0.7639,
      "step": 2667
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.440854344615391e-05,
      "loss": 0.6845,
      "step": 2668
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4404467509098667e-05,
      "loss": 0.8173,
      "step": 2669
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.440039066400027e-05,
      "loss": 0.614,
      "step": 2670
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.439631291169922e-05,
      "loss": 0.6943,
      "step": 2671
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4392234253036204e-05,
      "loss": 0.6776,
      "step": 2672
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4388154688852097e-05,
      "loss": 0.6966,
      "step": 2673
    },
    {
      "epoch": 0.37,
      "learning_rate": 1.4384074219987954e-05,
      "loss": 0.6825,
      "step": 2674
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4379992847285027e-05,
      "loss": 0.6606,
      "step": 2675
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4375910571584741e-05,
      "loss": 0.5976,
      "step": 2676
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4371827393728723e-05,
      "loss": 0.662,
      "step": 2677
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4367743314558772e-05,
      "loss": 0.7134,
      "step": 2678
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4363658334916883e-05,
      "loss": 0.6782,
      "step": 2679
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4359572455645228e-05,
      "loss": 0.7088,
      "step": 2680
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4355485677586167e-05,
      "loss": 0.6626,
      "step": 2681
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4351398001582255e-05,
      "loss": 0.6742,
      "step": 2682
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.434730942847622e-05,
      "loss": 0.7363,
      "step": 2683
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4343219959110977e-05,
      "loss": 0.7082,
      "step": 2684
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4339129594329628e-05,
      "loss": 0.6514,
      "step": 2685
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4335038334975462e-05,
      "loss": 0.7165,
      "step": 2686
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.433094618189195e-05,
      "loss": 0.6388,
      "step": 2687
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4326853135922743e-05,
      "loss": 0.6598,
      "step": 2688
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4322759197911687e-05,
      "loss": 0.6233,
      "step": 2689
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4318664368702797e-05,
      "loss": 0.7365,
      "step": 2690
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4314568649140288e-05,
      "loss": 0.7129,
      "step": 2691
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4310472040068541e-05,
      "loss": 0.634,
      "step": 2692
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4306374542332141e-05,
      "loss": 0.6453,
      "step": 2693
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4302276156775835e-05,
      "loss": 0.679,
      "step": 2694
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.429817688424457e-05,
      "loss": 0.7073,
      "step": 2695
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4294076725583463e-05,
      "loss": 0.6345,
      "step": 2696
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4289975681637827e-05,
      "loss": 0.6628,
      "step": 2697
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4285873753253143e-05,
      "loss": 0.7567,
      "step": 2698
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4281770941275086e-05,
      "loss": 0.6817,
      "step": 2699
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4277667246549507e-05,
      "loss": 0.6598,
      "step": 2700
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4273562669922438e-05,
      "loss": 0.7139,
      "step": 2701
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4269457212240099e-05,
      "loss": 0.6729,
      "step": 2702
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4265350874348886e-05,
      "loss": 0.6452,
      "step": 2703
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4261243657095381e-05,
      "loss": 0.7155,
      "step": 2704
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4257135561326342e-05,
      "loss": 0.6845,
      "step": 2705
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4253026587888714e-05,
      "loss": 0.6726,
      "step": 2706
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4248916737629618e-05,
      "loss": 0.7309,
      "step": 2707
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4244806011396357e-05,
      "loss": 0.6886,
      "step": 2708
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4240694410036418e-05,
      "loss": 0.6376,
      "step": 2709
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.423658193439746e-05,
      "loss": 0.6381,
      "step": 2710
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4232468585327333e-05,
      "loss": 0.6899,
      "step": 2711
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.422835436367406e-05,
      "loss": 0.7338,
      "step": 2712
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4224239270285847e-05,
      "loss": 0.6565,
      "step": 2713
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4220123306011078e-05,
      "loss": 0.5597,
      "step": 2714
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4216006471698319e-05,
      "loss": 0.63,
      "step": 2715
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4211888768196307e-05,
      "loss": 0.6357,
      "step": 2716
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4207770196353973e-05,
      "loss": 0.6981,
      "step": 2717
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4203650757020415e-05,
      "loss": 0.6941,
      "step": 2718
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4199530451044911e-05,
      "loss": 0.6363,
      "step": 2719
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4195409279276926e-05,
      "loss": 0.606,
      "step": 2720
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4191287242566093e-05,
      "loss": 0.6559,
      "step": 2721
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.418716434176223e-05,
      "loss": 0.6529,
      "step": 2722
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4183040577715331e-05,
      "loss": 0.694,
      "step": 2723
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4178915951275568e-05,
      "loss": 0.6684,
      "step": 2724
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4174790463293291e-05,
      "loss": 0.6658,
      "step": 2725
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4170664114619026e-05,
      "loss": 0.6482,
      "step": 2726
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.416653690610348e-05,
      "loss": 0.5689,
      "step": 2727
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4162408838597536e-05,
      "loss": 0.7493,
      "step": 2728
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4158279912952254e-05,
      "loss": 0.652,
      "step": 2729
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4154150130018867e-05,
      "loss": 0.6361,
      "step": 2730
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.415001949064879e-05,
      "loss": 0.6712,
      "step": 2731
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.414588799569361e-05,
      "loss": 0.6444,
      "step": 2732
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4141755646005096e-05,
      "loss": 0.6217,
      "step": 2733
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.413762244243519e-05,
      "loss": 0.5995,
      "step": 2734
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4133488385836011e-05,
      "loss": 0.6949,
      "step": 2735
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.412935347705985e-05,
      "loss": 0.6998,
      "step": 2736
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4125217716959181e-05,
      "loss": 0.7649,
      "step": 2737
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4121081106386648e-05,
      "loss": 0.6648,
      "step": 2738
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4116943646195067e-05,
      "loss": 0.7025,
      "step": 2739
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.411280533723744e-05,
      "loss": 0.6424,
      "step": 2740
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4108666180366933e-05,
      "loss": 0.6817,
      "step": 2741
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4104526176436895e-05,
      "loss": 0.7597,
      "step": 2742
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4100385326300842e-05,
      "loss": 0.6706,
      "step": 2743
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4096243630812478e-05,
      "loss": 0.6831,
      "step": 2744
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4092101090825662e-05,
      "loss": 0.6885,
      "step": 2745
    },
    {
      "epoch": 0.38,
      "learning_rate": 1.4087957707194444e-05,
      "loss": 0.7494,
      "step": 2746
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4083813480773036e-05,
      "loss": 0.6516,
      "step": 2747
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.407966841241583e-05,
      "loss": 0.8274,
      "step": 2748
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4075522502977393e-05,
      "loss": 0.6757,
      "step": 2749
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4071375753312457e-05,
      "loss": 0.6466,
      "step": 2750
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4067228164275941e-05,
      "loss": 0.7201,
      "step": 2751
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4063079736722922e-05,
      "loss": 0.6546,
      "step": 2752
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4058930471508663e-05,
      "loss": 0.6988,
      "step": 2753
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.405478036948859e-05,
      "loss": 0.7013,
      "step": 2754
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4050629431518306e-05,
      "loss": 0.6472,
      "step": 2755
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4046477658453581e-05,
      "loss": 0.6875,
      "step": 2756
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4042325051150368e-05,
      "loss": 0.6672,
      "step": 2757
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4038171610464783e-05,
      "loss": 0.6881,
      "step": 2758
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4034017337253117e-05,
      "loss": 0.6319,
      "step": 2759
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4029862232371831e-05,
      "loss": 0.767,
      "step": 2760
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4025706296677559e-05,
      "loss": 0.7471,
      "step": 2761
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4021549531027108e-05,
      "loss": 0.6846,
      "step": 2762
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4017391936277451e-05,
      "loss": 0.7122,
      "step": 2763
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4013233513285734e-05,
      "loss": 0.6427,
      "step": 2764
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4009074262909277e-05,
      "loss": 0.7003,
      "step": 2765
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.400491418600557e-05,
      "loss": 0.6472,
      "step": 2766
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.4000753283432267e-05,
      "loss": 0.6499,
      "step": 2767
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.39965915560472e-05,
      "loss": 0.7013,
      "step": 2768
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3992429004708368e-05,
      "loss": 0.7151,
      "step": 2769
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3988265630273933e-05,
      "loss": 0.5934,
      "step": 2770
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3984101433602246e-05,
      "loss": 0.7504,
      "step": 2771
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3979936415551804e-05,
      "loss": 0.6793,
      "step": 2772
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3975770576981287e-05,
      "loss": 0.7394,
      "step": 2773
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3971603918749543e-05,
      "loss": 0.7306,
      "step": 2774
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3967436441715591e-05,
      "loss": 0.6802,
      "step": 2775
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3963268146738609e-05,
      "loss": 0.6899,
      "step": 2776
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3959099034677951e-05,
      "loss": 0.6591,
      "step": 2777
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3954929106393142e-05,
      "loss": 0.7005,
      "step": 2778
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3950758362743866e-05,
      "loss": 0.7537,
      "step": 2779
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3946586804589983e-05,
      "loss": 0.737,
      "step": 2780
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.394241443279152e-05,
      "loss": 0.5762,
      "step": 2781
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.393824124820867e-05,
      "loss": 0.6404,
      "step": 2782
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3934067251701792e-05,
      "loss": 0.5598,
      "step": 2783
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3929892444131421e-05,
      "loss": 0.6135,
      "step": 2784
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3925716826358242e-05,
      "loss": 0.7901,
      "step": 2785
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3921540399243125e-05,
      "loss": 0.6969,
      "step": 2786
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3917363163647094e-05,
      "loss": 0.7054,
      "step": 2787
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3913185120431351e-05,
      "loss": 0.7607,
      "step": 2788
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3909006270457259e-05,
      "loss": 0.6541,
      "step": 2789
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.390482661458634e-05,
      "loss": 0.7227,
      "step": 2790
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3900646153680296e-05,
      "loss": 0.6759,
      "step": 2791
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.389646488860098e-05,
      "loss": 0.717,
      "step": 2792
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3892282820210427e-05,
      "loss": 0.6183,
      "step": 2793
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3888099949370823e-05,
      "loss": 0.6808,
      "step": 2794
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3883916276944534e-05,
      "loss": 0.7422,
      "step": 2795
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3879731803794074e-05,
      "loss": 0.7261,
      "step": 2796
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3875546530782136e-05,
      "loss": 0.6865,
      "step": 2797
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3871360458771575e-05,
      "loss": 0.6627,
      "step": 2798
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3867173588625404e-05,
      "loss": 0.8059,
      "step": 2799
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3862985921206811e-05,
      "loss": 0.6849,
      "step": 2800
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3858797457379133e-05,
      "loss": 0.6637,
      "step": 2801
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3854608198005894e-05,
      "loss": 0.7281,
      "step": 2802
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3850418143950759e-05,
      "loss": 0.6574,
      "step": 2803
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3846227296077568e-05,
      "loss": 0.685,
      "step": 2804
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.384203565525033e-05,
      "loss": 0.7071,
      "step": 2805
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3837843222333205e-05,
      "loss": 0.6614,
      "step": 2806
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3833649998190523e-05,
      "loss": 0.6631,
      "step": 2807
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3829455983686777e-05,
      "loss": 0.5188,
      "step": 2808
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3825261179686625e-05,
      "loss": 0.6805,
      "step": 2809
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3821065587054878e-05,
      "loss": 0.6686,
      "step": 2810
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3816869206656525e-05,
      "loss": 0.7777,
      "step": 2811
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.38126720393567e-05,
      "loss": 0.6225,
      "step": 2812
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.380847408602072e-05,
      "loss": 0.6624,
      "step": 2813
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3804275347514043e-05,
      "loss": 0.6943,
      "step": 2814
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.38000758247023e-05,
      "loss": 0.6135,
      "step": 2815
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3795875518451285e-05,
      "loss": 0.727,
      "step": 2816
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.3791674429626947e-05,
      "loss": 0.772,
      "step": 2817
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3787472559095398e-05,
      "loss": 0.7164,
      "step": 2818
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3783269907722918e-05,
      "loss": 0.6507,
      "step": 2819
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3779066476375944e-05,
      "loss": 0.6225,
      "step": 2820
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3774862265921068e-05,
      "loss": 0.6509,
      "step": 2821
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3770657277225048e-05,
      "loss": 0.6861,
      "step": 2822
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3766451511154804e-05,
      "loss": 0.6352,
      "step": 2823
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3762244968577412e-05,
      "loss": 0.69,
      "step": 2824
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3758037650360112e-05,
      "loss": 0.7076,
      "step": 2825
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.37538295573703e-05,
      "loss": 0.7079,
      "step": 2826
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3749620690475534e-05,
      "loss": 0.7154,
      "step": 2827
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.374541105054353e-05,
      "loss": 0.7361,
      "step": 2828
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3741200638442171e-05,
      "loss": 0.6383,
      "step": 2829
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3736989455039486e-05,
      "loss": 0.5687,
      "step": 2830
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3732777501203676e-05,
      "loss": 0.6626,
      "step": 2831
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3728564777803089e-05,
      "loss": 0.7836,
      "step": 2832
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3724351285706239e-05,
      "loss": 0.572,
      "step": 2833
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3720137025781796e-05,
      "loss": 0.6423,
      "step": 2834
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3715921998898593e-05,
      "loss": 0.692,
      "step": 2835
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3711706205925616e-05,
      "loss": 0.6772,
      "step": 2836
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3707489647732009e-05,
      "loss": 0.6902,
      "step": 2837
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3703272325187073e-05,
      "loss": 0.7225,
      "step": 2838
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3699054239160273e-05,
      "loss": 0.6033,
      "step": 2839
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3694835390521224e-05,
      "loss": 0.7364,
      "step": 2840
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3690615780139703e-05,
      "loss": 0.6302,
      "step": 2841
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3686395408885638e-05,
      "loss": 0.665,
      "step": 2842
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3682174277629123e-05,
      "loss": 0.7155,
      "step": 2843
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3677952387240403e-05,
      "loss": 0.6124,
      "step": 2844
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.367372973858988e-05,
      "loss": 0.7607,
      "step": 2845
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.366950633254811e-05,
      "loss": 0.7078,
      "step": 2846
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3665282169985814e-05,
      "loss": 0.7056,
      "step": 2847
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3661057251773855e-05,
      "loss": 0.5709,
      "step": 2848
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3656831578783263e-05,
      "loss": 0.6338,
      "step": 2849
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3652605151885219e-05,
      "loss": 0.7479,
      "step": 2850
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3648377971951066e-05,
      "loss": 0.6837,
      "step": 2851
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3644150039852289e-05,
      "loss": 0.6434,
      "step": 2852
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3639921356460542e-05,
      "loss": 0.6856,
      "step": 2853
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3635691922647622e-05,
      "loss": 0.6769,
      "step": 2854
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3631461739285494e-05,
      "loss": 0.6786,
      "step": 2855
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3627230807246266e-05,
      "loss": 0.6752,
      "step": 2856
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.36229991274022e-05,
      "loss": 0.7521,
      "step": 2857
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3618766700625723e-05,
      "loss": 0.7444,
      "step": 2858
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3614533527789406e-05,
      "loss": 0.712,
      "step": 2859
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3610299609765981e-05,
      "loss": 0.6465,
      "step": 2860
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3606064947428325e-05,
      "loss": 0.7034,
      "step": 2861
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3601829541649479e-05,
      "loss": 0.721,
      "step": 2862
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3597593393302626e-05,
      "loss": 0.6495,
      "step": 2863
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3593356503261111e-05,
      "loss": 0.6386,
      "step": 2864
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3589118872398427e-05,
      "loss": 0.762,
      "step": 2865
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3584880501588225e-05,
      "loss": 0.6828,
      "step": 2866
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3580641391704302e-05,
      "loss": 0.6724,
      "step": 2867
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3576401543620608e-05,
      "loss": 0.6049,
      "step": 2868
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3572160958211254e-05,
      "loss": 0.7274,
      "step": 2869
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3567919636350491e-05,
      "loss": 0.5616,
      "step": 2870
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.356367757891273e-05,
      "loss": 0.6173,
      "step": 2871
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.355943478677253e-05,
      "loss": 0.6602,
      "step": 2872
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3555191260804601e-05,
      "loss": 0.6998,
      "step": 2873
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.355094700188381e-05,
      "loss": 0.6921,
      "step": 2874
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3546702010885167e-05,
      "loss": 0.5288,
      "step": 2875
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.354245628868384e-05,
      "loss": 0.7107,
      "step": 2876
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3538209836155143e-05,
      "loss": 0.753,
      "step": 2877
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3533962654174542e-05,
      "loss": 0.6289,
      "step": 2878
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3529714743617653e-05,
      "loss": 0.6511,
      "step": 2879
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.352546610536024e-05,
      "loss": 0.6775,
      "step": 2880
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3521216740278224e-05,
      "loss": 0.6829,
      "step": 2881
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3516966649247674e-05,
      "loss": 0.6588,
      "step": 2882
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.35127158331448e-05,
      "loss": 0.7249,
      "step": 2883
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3508464292845972e-05,
      "loss": 0.6652,
      "step": 2884
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3504212029227705e-05,
      "loss": 0.6793,
      "step": 2885
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3499959043166661e-05,
      "loss": 0.777,
      "step": 2886
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3495705335539655e-05,
      "loss": 0.6442,
      "step": 2887
    },
    {
      "epoch": 0.4,
      "learning_rate": 1.3491450907223645e-05,
      "loss": 0.6739,
      "step": 2888
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3487195759095743e-05,
      "loss": 0.7176,
      "step": 2889
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3482939892033212e-05,
      "loss": 0.8136,
      "step": 2890
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3478683306913456e-05,
      "loss": 0.7152,
      "step": 2891
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.347442600461403e-05,
      "loss": 0.7471,
      "step": 2892
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.347016798601264e-05,
      "loss": 0.6805,
      "step": 2893
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.346590925198713e-05,
      "loss": 0.7843,
      "step": 2894
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3461649803415501e-05,
      "loss": 0.7177,
      "step": 2895
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3457389641175902e-05,
      "loss": 0.6434,
      "step": 2896
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3453128766146622e-05,
      "loss": 0.768,
      "step": 2897
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3448867179206102e-05,
      "loss": 0.691,
      "step": 2898
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3444604881232928e-05,
      "loss": 0.6045,
      "step": 2899
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3440341873105834e-05,
      "loss": 0.7139,
      "step": 2900
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3436078155703695e-05,
      "loss": 0.671,
      "step": 2901
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3431813729905544e-05,
      "loss": 0.687,
      "step": 2902
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3427548596590546e-05,
      "loss": 0.6267,
      "step": 2903
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3423282756638018e-05,
      "loss": 0.7116,
      "step": 2904
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3419016210927432e-05,
      "loss": 0.6517,
      "step": 2905
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3414748960338385e-05,
      "loss": 0.6781,
      "step": 2906
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3410481005750637e-05,
      "loss": 0.6694,
      "step": 2907
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3406212348044088e-05,
      "loss": 0.6663,
      "step": 2908
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3401942988098781e-05,
      "loss": 0.6617,
      "step": 2909
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3397672926794903e-05,
      "loss": 0.6675,
      "step": 2910
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.339340216501279e-05,
      "loss": 0.6877,
      "step": 2911
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3389130703632916e-05,
      "loss": 0.7016,
      "step": 2912
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3384858543535907e-05,
      "loss": 0.6131,
      "step": 2913
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.338058568560253e-05,
      "loss": 0.7187,
      "step": 2914
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.337631213071369e-05,
      "loss": 0.6215,
      "step": 2915
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3372037879750443e-05,
      "loss": 0.7202,
      "step": 2916
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3367762933593989e-05,
      "loss": 0.703,
      "step": 2917
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3363487293125666e-05,
      "loss": 0.6662,
      "step": 2918
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3359210959226954e-05,
      "loss": 0.6722,
      "step": 2919
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3354933932779485e-05,
      "loss": 0.6097,
      "step": 2920
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3350656214665026e-05,
      "loss": 0.5759,
      "step": 2921
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3346377805765492e-05,
      "loss": 0.6859,
      "step": 2922
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3342098706962934e-05,
      "loss": 0.6651,
      "step": 2923
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.333781891913955e-05,
      "loss": 0.6939,
      "step": 2924
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3333538443177678e-05,
      "loss": 0.7241,
      "step": 2925
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3329257279959797e-05,
      "loss": 0.7183,
      "step": 2926
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3324975430368532e-05,
      "loss": 0.6946,
      "step": 2927
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3320692895286646e-05,
      "loss": 0.6787,
      "step": 2928
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3316409675597046e-05,
      "loss": 0.6949,
      "step": 2929
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3312125772182773e-05,
      "loss": 0.7094,
      "step": 2930
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3307841185927019e-05,
      "loss": 0.6178,
      "step": 2931
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3303555917713111e-05,
      "loss": 0.8195,
      "step": 2932
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3299269968424515e-05,
      "loss": 0.7383,
      "step": 2933
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3294983338944842e-05,
      "loss": 0.6351,
      "step": 2934
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3290696030157841e-05,
      "loss": 0.7111,
      "step": 2935
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3286408042947404e-05,
      "loss": 0.5441,
      "step": 2936
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3282119378197551e-05,
      "loss": 0.8373,
      "step": 2937
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.327783003679246e-05,
      "loss": 0.6193,
      "step": 2938
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3273540019616438e-05,
      "loss": 0.7649,
      "step": 2939
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.326924932755393e-05,
      "loss": 0.6384,
      "step": 2940
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3264957961489523e-05,
      "loss": 0.75,
      "step": 2941
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3260665922307943e-05,
      "loss": 0.7308,
      "step": 2942
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3256373210894053e-05,
      "loss": 0.6722,
      "step": 2943
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.325207982813286e-05,
      "loss": 0.6648,
      "step": 2944
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3247785774909506e-05,
      "loss": 0.7295,
      "step": 2945
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.324349105210926e-05,
      "loss": 0.6392,
      "step": 2946
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3239195660617555e-05,
      "loss": 0.6998,
      "step": 2947
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3234899601319934e-05,
      "loss": 0.7092,
      "step": 2948
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3230602875102102e-05,
      "loss": 0.6175,
      "step": 2949
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3226305482849879e-05,
      "loss": 0.7527,
      "step": 2950
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3222007425449234e-05,
      "loss": 0.744,
      "step": 2951
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.321770870378628e-05,
      "loss": 0.6792,
      "step": 2952
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3213409318747257e-05,
      "loss": 0.6222,
      "step": 2953
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3209109271218538e-05,
      "loss": 0.6178,
      "step": 2954
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3204808562086644e-05,
      "loss": 0.6307,
      "step": 2955
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3200507192238223e-05,
      "loss": 0.6264,
      "step": 2956
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3196205162560066e-05,
      "loss": 0.6449,
      "step": 2957
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3191902473939095e-05,
      "loss": 0.6288,
      "step": 2958
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3187599127262371e-05,
      "loss": 0.7313,
      "step": 2959
    },
    {
      "epoch": 0.41,
      "learning_rate": 1.3183295123417094e-05,
      "loss": 0.7547,
      "step": 2960
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3178990463290586e-05,
      "loss": 0.6472,
      "step": 2961
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3174685147770325e-05,
      "loss": 0.7084,
      "step": 2962
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3170379177743904e-05,
      "loss": 0.712,
      "step": 2963
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3166072554099056e-05,
      "loss": 0.6475,
      "step": 2964
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3161765277723664e-05,
      "loss": 0.7215,
      "step": 2965
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3157457349505723e-05,
      "loss": 0.6562,
      "step": 2966
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3153148770333381e-05,
      "loss": 0.7034,
      "step": 2967
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.314883954109491e-05,
      "loss": 0.7376,
      "step": 2968
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3144529662678715e-05,
      "loss": 0.6667,
      "step": 2969
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3140219135973342e-05,
      "loss": 0.7043,
      "step": 2970
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3135907961867469e-05,
      "loss": 0.7071,
      "step": 2971
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.31315961412499e-05,
      "loss": 0.6668,
      "step": 2972
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.312728367500958e-05,
      "loss": 0.6434,
      "step": 2973
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3122970564035585e-05,
      "loss": 0.7428,
      "step": 2974
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.311865680921712e-05,
      "loss": 0.6836,
      "step": 2975
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3114342411443538e-05,
      "loss": 0.7625,
      "step": 2976
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3110027371604296e-05,
      "loss": 0.7231,
      "step": 2977
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3105711690589015e-05,
      "loss": 0.5983,
      "step": 2978
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3101395369287428e-05,
      "loss": 0.704,
      "step": 2979
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3097078408589405e-05,
      "loss": 0.67,
      "step": 2980
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3092760809384948e-05,
      "loss": 0.6436,
      "step": 2981
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.308844257256419e-05,
      "loss": 0.6005,
      "step": 2982
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3084123699017401e-05,
      "loss": 0.7046,
      "step": 2983
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3079804189634975e-05,
      "loss": 0.718,
      "step": 2984
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3075484045307443e-05,
      "loss": 0.6847,
      "step": 2985
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3071163266925455e-05,
      "loss": 0.6577,
      "step": 2986
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.306684185537981e-05,
      "loss": 0.6953,
      "step": 2987
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3062519811561423e-05,
      "loss": 0.6404,
      "step": 2988
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3058197136361344e-05,
      "loss": 0.7721,
      "step": 2989
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3053873830670756e-05,
      "loss": 0.5979,
      "step": 2990
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3049549895380968e-05,
      "loss": 0.6768,
      "step": 2991
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3045225331383424e-05,
      "loss": 0.6575,
      "step": 2992
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3040900139569687e-05,
      "loss": 0.7291,
      "step": 2993
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3036574320831466e-05,
      "loss": 0.73,
      "step": 2994
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3032247876060576e-05,
      "loss": 0.6394,
      "step": 2995
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3027920806148985e-05,
      "loss": 0.6805,
      "step": 2996
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3023593111988777e-05,
      "loss": 0.6773,
      "step": 2997
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.301926479447217e-05,
      "loss": 0.6525,
      "step": 2998
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3014935854491501e-05,
      "loss": 0.6866,
      "step": 2999
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.301060629293925e-05,
      "loss": 0.6138,
      "step": 3000
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.300627611070801e-05,
      "loss": 0.6027,
      "step": 3001
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.3001945308690514e-05,
      "loss": 0.6542,
      "step": 3002
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2997613887779616e-05,
      "loss": 0.6044,
      "step": 3003
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.29932818488683e-05,
      "loss": 0.7398,
      "step": 3004
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2988949192849676e-05,
      "loss": 0.8166,
      "step": 3005
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2984615920616982e-05,
      "loss": 0.6409,
      "step": 3006
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2980282033063586e-05,
      "loss": 0.6727,
      "step": 3007
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2975947531082977e-05,
      "loss": 0.6118,
      "step": 3008
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.297161241556878e-05,
      "loss": 0.6965,
      "step": 3009
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2967276687414731e-05,
      "loss": 0.6464,
      "step": 3010
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2962940347514708e-05,
      "loss": 0.6705,
      "step": 3011
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2958603396762706e-05,
      "loss": 0.6287,
      "step": 3012
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2954265836052849e-05,
      "loss": 0.6312,
      "step": 3013
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2949927666279388e-05,
      "loss": 0.7182,
      "step": 3014
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2945588888336694e-05,
      "loss": 0.6292,
      "step": 3015
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2941249503119273e-05,
      "loss": 0.672,
      "step": 3016
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2936909511521744e-05,
      "loss": 0.6652,
      "step": 3017
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2932568914438865e-05,
      "loss": 0.7154,
      "step": 3018
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2928227712765504e-05,
      "loss": 0.5792,
      "step": 3019
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2923885907396668e-05,
      "loss": 0.7422,
      "step": 3020
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2919543499227477e-05,
      "loss": 0.6567,
      "step": 3021
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2915200489153177e-05,
      "loss": 0.6284,
      "step": 3022
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.291085687806915e-05,
      "loss": 0.6003,
      "step": 3023
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2906512666870881e-05,
      "loss": 0.6513,
      "step": 3024
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2902167856454001e-05,
      "loss": 0.7251,
      "step": 3025
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2897822447714247e-05,
      "loss": 0.7553,
      "step": 3026
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.289347644154749e-05,
      "loss": 0.631,
      "step": 3027
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.288912983884972e-05,
      "loss": 0.5805,
      "step": 3028
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2884782640517051e-05,
      "loss": 0.7102,
      "step": 3029
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.2880434847445717e-05,
      "loss": 0.7558,
      "step": 3030
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.287608646053208e-05,
      "loss": 0.6126,
      "step": 3031
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2871737480672617e-05,
      "loss": 0.6322,
      "step": 3032
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2867387908763935e-05,
      "loss": 0.6901,
      "step": 3033
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2863037745702762e-05,
      "loss": 0.6437,
      "step": 3034
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2858686992385938e-05,
      "loss": 0.7543,
      "step": 3035
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2854335649710436e-05,
      "loss": 0.6323,
      "step": 3036
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.284998371857335e-05,
      "loss": 0.6246,
      "step": 3037
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2845631199871889e-05,
      "loss": 0.7262,
      "step": 3038
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2841278094503385e-05,
      "loss": 0.5752,
      "step": 3039
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2836924403365297e-05,
      "loss": 0.785,
      "step": 3040
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2832570127355194e-05,
      "loss": 0.7052,
      "step": 3041
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2828215267370774e-05,
      "loss": 0.6378,
      "step": 3042
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2823859824309852e-05,
      "loss": 0.7195,
      "step": 3043
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2819503799070365e-05,
      "loss": 0.6614,
      "step": 3044
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.281514719255037e-05,
      "loss": 0.6185,
      "step": 3045
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2810790005648041e-05,
      "loss": 0.6387,
      "step": 3046
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2806432239261677e-05,
      "loss": 0.6555,
      "step": 3047
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2802073894289688e-05,
      "loss": 0.6831,
      "step": 3048
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2797714971630612e-05,
      "loss": 0.7186,
      "step": 3049
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.27933554721831e-05,
      "loss": 0.7101,
      "step": 3050
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2788995396845927e-05,
      "loss": 0.736,
      "step": 3051
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2784634746517983e-05,
      "loss": 0.6243,
      "step": 3052
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2780273522098276e-05,
      "loss": 0.664,
      "step": 3053
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2775911724485939e-05,
      "loss": 0.7526,
      "step": 3054
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2771549354580208e-05,
      "loss": 0.7693,
      "step": 3055
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2767186413280462e-05,
      "loss": 0.6976,
      "step": 3056
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2762822901486167e-05,
      "loss": 0.7025,
      "step": 3057
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2758458820096935e-05,
      "loss": 0.5912,
      "step": 3058
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2754094170012473e-05,
      "loss": 0.6277,
      "step": 3059
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2749728952132625e-05,
      "loss": 0.7222,
      "step": 3060
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2745363167357336e-05,
      "loss": 0.5826,
      "step": 3061
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2740996816586678e-05,
      "loss": 0.6877,
      "step": 3062
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2736629900720832e-05,
      "loss": 0.6543,
      "step": 3063
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2732262420660098e-05,
      "loss": 0.6406,
      "step": 3064
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2727894377304901e-05,
      "loss": 0.7064,
      "step": 3065
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2723525771555769e-05,
      "loss": 0.6308,
      "step": 3066
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2719156604313352e-05,
      "loss": 0.6132,
      "step": 3067
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2714786876478415e-05,
      "loss": 0.6692,
      "step": 3068
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2710416588951846e-05,
      "loss": 0.7185,
      "step": 3069
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2706045742634637e-05,
      "loss": 0.6752,
      "step": 3070
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2701674338427892e-05,
      "loss": 0.6883,
      "step": 3071
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.269730237723285e-05,
      "loss": 0.595,
      "step": 3072
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2692929859950845e-05,
      "loss": 0.6847,
      "step": 3073
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2688556787483335e-05,
      "loss": 0.6397,
      "step": 3074
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2684183160731891e-05,
      "loss": 0.6947,
      "step": 3075
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2679808980598198e-05,
      "loss": 0.7108,
      "step": 3076
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2675434247984056e-05,
      "loss": 0.7417,
      "step": 3077
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2671058963791377e-05,
      "loss": 0.6821,
      "step": 3078
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2666683128922184e-05,
      "loss": 0.6604,
      "step": 3079
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2662306744278624e-05,
      "loss": 0.6602,
      "step": 3080
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2657929810762943e-05,
      "loss": 0.6682,
      "step": 3081
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2653552329277515e-05,
      "loss": 0.6751,
      "step": 3082
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2649174300724816e-05,
      "loss": 0.7384,
      "step": 3083
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2644795726007436e-05,
      "loss": 0.6911,
      "step": 3084
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2640416606028085e-05,
      "loss": 0.6141,
      "step": 3085
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2636036941689576e-05,
      "loss": 0.6141,
      "step": 3086
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2631656733894842e-05,
      "loss": 0.8096,
      "step": 3087
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.262727598354692e-05,
      "loss": 0.7623,
      "step": 3088
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2622894691548973e-05,
      "loss": 0.59,
      "step": 3089
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2618512858804253e-05,
      "loss": 0.6198,
      "step": 3090
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2614130486216145e-05,
      "loss": 0.6053,
      "step": 3091
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.260974757468814e-05,
      "loss": 0.6745,
      "step": 3092
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2605364125123828e-05,
      "loss": 0.5988,
      "step": 3093
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2600980138426926e-05,
      "loss": 0.6338,
      "step": 3094
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2596595615501252e-05,
      "loss": 0.6621,
      "step": 3095
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2592210557250737e-05,
      "loss": 0.7508,
      "step": 3096
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2587824964579425e-05,
      "loss": 0.6902,
      "step": 3097
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2583438838391462e-05,
      "loss": 0.6535,
      "step": 3098
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2579052179591115e-05,
      "loss": 0.718,
      "step": 3099
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.257466498908276e-05,
      "loss": 0.6543,
      "step": 3100
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.257027726777087e-05,
      "loss": 0.6914,
      "step": 3101
    },
    {
      "epoch": 0.43,
      "learning_rate": 1.2565889016560036e-05,
      "loss": 0.7587,
      "step": 3102
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2561500236354962e-05,
      "loss": 0.6183,
      "step": 3103
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2557110928060456e-05,
      "loss": 0.6534,
      "step": 3104
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2552721092581435e-05,
      "loss": 0.6443,
      "step": 3105
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2548330730822924e-05,
      "loss": 0.6851,
      "step": 3106
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2543939843690063e-05,
      "loss": 0.6851,
      "step": 3107
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2539548432088092e-05,
      "loss": 0.5962,
      "step": 3108
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2535156496922363e-05,
      "loss": 0.6251,
      "step": 3109
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2530764039098333e-05,
      "loss": 0.7119,
      "step": 3110
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2526371059521574e-05,
      "loss": 0.719,
      "step": 3111
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2521977559097756e-05,
      "loss": 0.6314,
      "step": 3112
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2517583538732662e-05,
      "loss": 0.5359,
      "step": 3113
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2513188999332186e-05,
      "loss": 0.6614,
      "step": 3114
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.250879394180232e-05,
      "loss": 0.6046,
      "step": 3115
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.250439836704917e-05,
      "loss": 0.6484,
      "step": 3116
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.250000227597894e-05,
      "loss": 0.6488,
      "step": 3117
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2495605669497952e-05,
      "loss": 0.6518,
      "step": 3118
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2491208548512628e-05,
      "loss": 0.7176,
      "step": 3119
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2486810913929493e-05,
      "loss": 0.6267,
      "step": 3120
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2482412766655183e-05,
      "loss": 0.6923,
      "step": 3121
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2478014107596438e-05,
      "loss": 0.6683,
      "step": 3122
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.247361493766011e-05,
      "loss": 0.6676,
      "step": 3123
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.246921525775314e-05,
      "loss": 0.6685,
      "step": 3124
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.246481506878259e-05,
      "loss": 0.7003,
      "step": 3125
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2460414371655618e-05,
      "loss": 0.5609,
      "step": 3126
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2456013167279494e-05,
      "loss": 0.6615,
      "step": 3127
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2451611456561583e-05,
      "loss": 0.689,
      "step": 3128
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2447209240409363e-05,
      "loss": 0.6995,
      "step": 3129
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2442806519730418e-05,
      "loss": 0.6631,
      "step": 3130
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2438403295432418e-05,
      "loss": 0.6969,
      "step": 3131
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2433999568423162e-05,
      "loss": 0.7163,
      "step": 3132
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2429595339610533e-05,
      "loss": 0.5953,
      "step": 3133
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2425190609902533e-05,
      "loss": 0.7355,
      "step": 3134
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2420785380207249e-05,
      "loss": 0.7028,
      "step": 3135
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2416379651432888e-05,
      "loss": 0.6628,
      "step": 3136
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2411973424487751e-05,
      "loss": 0.6663,
      "step": 3137
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2407566700280247e-05,
      "loss": 0.7042,
      "step": 3138
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2403159479718883e-05,
      "loss": 0.6394,
      "step": 3139
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2398751763712264e-05,
      "loss": 0.732,
      "step": 3140
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.239434355316911e-05,
      "loss": 0.6354,
      "step": 3141
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2389934848998233e-05,
      "loss": 0.6425,
      "step": 3142
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.238552565210855e-05,
      "loss": 0.6167,
      "step": 3143
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2381115963409077e-05,
      "loss": 0.7554,
      "step": 3144
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.237670578380894e-05,
      "loss": 0.6549,
      "step": 3145
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2372295114217351e-05,
      "loss": 0.6925,
      "step": 3146
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.236788395554364e-05,
      "loss": 0.6239,
      "step": 3147
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2363472308697224e-05,
      "loss": 0.6965,
      "step": 3148
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.235906017458763e-05,
      "loss": 0.6323,
      "step": 3149
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2354647554124479e-05,
      "loss": 0.6451,
      "step": 3150
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2350234448217495e-05,
      "loss": 0.6135,
      "step": 3151
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2345820857776502e-05,
      "loss": 0.6956,
      "step": 3152
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2341406783711427e-05,
      "loss": 0.6809,
      "step": 3153
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2336992226932292e-05,
      "loss": 0.6185,
      "step": 3154
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2332577188349217e-05,
      "loss": 0.7172,
      "step": 3155
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2328161668872431e-05,
      "loss": 0.7168,
      "step": 3156
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2323745669412247e-05,
      "loss": 0.6864,
      "step": 3157
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2319329190879097e-05,
      "loss": 0.7146,
      "step": 3158
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2314912234183489e-05,
      "loss": 0.6174,
      "step": 3159
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2310494800236048e-05,
      "loss": 0.6445,
      "step": 3160
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2306076889947489e-05,
      "loss": 0.6884,
      "step": 3161
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2301658504228627e-05,
      "loss": 0.7002,
      "step": 3162
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2297239643990371e-05,
      "loss": 0.7868,
      "step": 3163
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2292820310143734e-05,
      "loss": 0.5945,
      "step": 3164
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2288400503599826e-05,
      "loss": 0.6632,
      "step": 3165
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2283980225269849e-05,
      "loss": 0.6363,
      "step": 3166
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2279559476065106e-05,
      "loss": 0.6596,
      "step": 3167
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2275138256897e-05,
      "loss": 0.7126,
      "step": 3168
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2270716568677026e-05,
      "loss": 0.7204,
      "step": 3169
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2266294412316779e-05,
      "loss": 0.6581,
      "step": 3170
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2261871788727944e-05,
      "loss": 0.7191,
      "step": 3171
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2257448698822314e-05,
      "loss": 0.6198,
      "step": 3172
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2253025143511765e-05,
      "loss": 0.8022,
      "step": 3173
    },
    {
      "epoch": 0.44,
      "learning_rate": 1.2248601123708279e-05,
      "loss": 0.7079,
      "step": 3174
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2244176640323928e-05,
      "loss": 0.6134,
      "step": 3175
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2239751694270887e-05,
      "loss": 0.6485,
      "step": 3176
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2235326286461416e-05,
      "loss": 0.6218,
      "step": 3177
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2230900417807877e-05,
      "loss": 0.6863,
      "step": 3178
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2226474089222725e-05,
      "loss": 0.7291,
      "step": 3179
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2222047301618506e-05,
      "loss": 0.6549,
      "step": 3180
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2217620055907875e-05,
      "loss": 0.6271,
      "step": 3181
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.221319235300356e-05,
      "loss": 0.6868,
      "step": 3182
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2208764193818401e-05,
      "loss": 0.7239,
      "step": 3183
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2204335579265323e-05,
      "loss": 0.7932,
      "step": 3184
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2199906510257351e-05,
      "loss": 0.68,
      "step": 3185
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2195476987707594e-05,
      "loss": 0.6878,
      "step": 3186
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2191047012529267e-05,
      "loss": 0.7483,
      "step": 3187
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.218661658563567e-05,
      "loss": 0.7464,
      "step": 3188
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2182185707940196e-05,
      "loss": 0.618,
      "step": 3189
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.217775438035633e-05,
      "loss": 0.667,
      "step": 3190
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.217332260379766e-05,
      "loss": 0.6791,
      "step": 3191
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2168890379177855e-05,
      "loss": 0.7557,
      "step": 3192
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2164457707410683e-05,
      "loss": 0.7364,
      "step": 3193
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2160024589410002e-05,
      "loss": 0.7299,
      "step": 3194
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2155591026089756e-05,
      "loss": 0.7526,
      "step": 3195
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2151157018363997e-05,
      "loss": 0.6968,
      "step": 3196
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2146722567146846e-05,
      "loss": 0.7286,
      "step": 3197
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2142287673352538e-05,
      "loss": 0.6479,
      "step": 3198
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2137852337895386e-05,
      "loss": 0.6591,
      "step": 3199
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2133416561689792e-05,
      "loss": 0.6982,
      "step": 3200
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.212898034565026e-05,
      "loss": 0.6378,
      "step": 3201
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2124543690691377e-05,
      "loss": 0.6431,
      "step": 3202
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2120106597727823e-05,
      "loss": 0.7088,
      "step": 3203
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2115669067674363e-05,
      "loss": 0.7566,
      "step": 3204
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2111231101445861e-05,
      "loss": 0.5727,
      "step": 3205
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2106792699957264e-05,
      "loss": 0.7051,
      "step": 3206
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2102353864123613e-05,
      "loss": 0.6518,
      "step": 3207
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2097914594860036e-05,
      "loss": 0.6972,
      "step": 3208
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2093474893081747e-05,
      "loss": 0.6334,
      "step": 3209
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.208903475970406e-05,
      "loss": 0.8191,
      "step": 3210
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2084594195642367e-05,
      "loss": 0.6086,
      "step": 3211
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2080153201812155e-05,
      "loss": 0.7642,
      "step": 3212
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2075711779128996e-05,
      "loss": 0.6689,
      "step": 3213
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2071269928508551e-05,
      "loss": 0.6395,
      "step": 3214
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2066827650866571e-05,
      "loss": 0.5643,
      "step": 3215
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2062384947118897e-05,
      "loss": 0.6528,
      "step": 3216
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.205794181818145e-05,
      "loss": 0.6549,
      "step": 3217
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2053498264970251e-05,
      "loss": 0.6475,
      "step": 3218
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2049054288401398e-05,
      "loss": 0.6981,
      "step": 3219
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2044609889391074e-05,
      "loss": 0.703,
      "step": 3220
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.204016506885556e-05,
      "loss": 0.7358,
      "step": 3221
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2035719827711217e-05,
      "loss": 0.5632,
      "step": 3222
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2031274166874498e-05,
      "loss": 0.7303,
      "step": 3223
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2026828087261932e-05,
      "loss": 0.641,
      "step": 3224
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2022381589790149e-05,
      "loss": 0.6466,
      "step": 3225
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2017934675375846e-05,
      "loss": 0.6174,
      "step": 3226
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.201348734493583e-05,
      "loss": 0.7075,
      "step": 3227
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2009039599386973e-05,
      "loss": 0.7052,
      "step": 3228
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.200459143964624e-05,
      "loss": 0.6744,
      "step": 3229
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.2000142866630688e-05,
      "loss": 0.6424,
      "step": 3230
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.199569388125745e-05,
      "loss": 0.5787,
      "step": 3231
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1991244484443745e-05,
      "loss": 0.5793,
      "step": 3232
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1986794677106878e-05,
      "loss": 0.6491,
      "step": 3233
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1982344460164246e-05,
      "loss": 0.7322,
      "step": 3234
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1977893834533318e-05,
      "loss": 0.6987,
      "step": 3235
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1973442801131659e-05,
      "loss": 0.6948,
      "step": 3236
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1968991360876905e-05,
      "loss": 0.6231,
      "step": 3237
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1964539514686787e-05,
      "loss": 0.7116,
      "step": 3238
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.196008726347912e-05,
      "loss": 0.6454,
      "step": 3239
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1955634608171792e-05,
      "loss": 0.7099,
      "step": 3240
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1951181549682785e-05,
      "loss": 0.6229,
      "step": 3241
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1946728088930155e-05,
      "loss": 0.7199,
      "step": 3242
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1942274226832052e-05,
      "loss": 0.6095,
      "step": 3243
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1937819964306697e-05,
      "loss": 0.6406,
      "step": 3244
    },
    {
      "epoch": 0.45,
      "learning_rate": 1.1933365302272402e-05,
      "loss": 0.7274,
      "step": 3245
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1928910241647557e-05,
      "loss": 0.6358,
      "step": 3246
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1924454783350639e-05,
      "loss": 0.5731,
      "step": 3247
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1919998928300203e-05,
      "loss": 0.74,
      "step": 3248
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1915542677414882e-05,
      "loss": 0.6084,
      "step": 3249
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.19110860316134e-05,
      "loss": 0.717,
      "step": 3250
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1906628991814551e-05,
      "loss": 0.6387,
      "step": 3251
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1902171558937223e-05,
      "loss": 0.7542,
      "step": 3252
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1897713733900376e-05,
      "loss": 0.6003,
      "step": 3253
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1893255517623054e-05,
      "loss": 0.6718,
      "step": 3254
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1888796911024383e-05,
      "loss": 0.5837,
      "step": 3255
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1884337915023567e-05,
      "loss": 0.6413,
      "step": 3256
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.187987853053989e-05,
      "loss": 0.6469,
      "step": 3257
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1875418758492714e-05,
      "loss": 0.6693,
      "step": 3258
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1870958599801488e-05,
      "loss": 0.5546,
      "step": 3259
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1866498055385736e-05,
      "loss": 0.7473,
      "step": 3260
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1862037126165062e-05,
      "loss": 0.6411,
      "step": 3261
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.185757581305915e-05,
      "loss": 0.7201,
      "step": 3262
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1853114116987762e-05,
      "loss": 0.7621,
      "step": 3263
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1848652038870738e-05,
      "loss": 0.6237,
      "step": 3264
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1844189579628004e-05,
      "loss": 0.7485,
      "step": 3265
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1839726740179552e-05,
      "loss": 0.7067,
      "step": 3266
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1835263521445463e-05,
      "loss": 0.7298,
      "step": 3267
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1830799924345892e-05,
      "loss": 0.6154,
      "step": 3268
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1826335949801073e-05,
      "loss": 0.6607,
      "step": 3269
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1821871598731319e-05,
      "loss": 0.7134,
      "step": 3270
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1817406872057014e-05,
      "loss": 0.7046,
      "step": 3271
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1812941770698627e-05,
      "loss": 0.6669,
      "step": 3272
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1808476295576702e-05,
      "loss": 0.6589,
      "step": 3273
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1804010447611862e-05,
      "loss": 0.7156,
      "step": 3274
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1799544227724803e-05,
      "loss": 0.7393,
      "step": 3275
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1795077636836294e-05,
      "loss": 0.6714,
      "step": 3276
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1790610675867193e-05,
      "loss": 0.5965,
      "step": 3277
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1786143345738425e-05,
      "loss": 0.6514,
      "step": 3278
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1781675647370994e-05,
      "loss": 0.6017,
      "step": 3279
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1777207581685974e-05,
      "loss": 0.7183,
      "step": 3280
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1772739149604526e-05,
      "loss": 0.6349,
      "step": 3281
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1768270352047877e-05,
      "loss": 0.7341,
      "step": 3282
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1763801189937333e-05,
      "loss": 0.6875,
      "step": 3283
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1759331664194276e-05,
      "loss": 0.6715,
      "step": 3284
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1754861775740163e-05,
      "loss": 0.6616,
      "step": 3285
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.175039152549652e-05,
      "loss": 0.656,
      "step": 3286
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1745920914384957e-05,
      "loss": 0.6755,
      "step": 3287
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1741449943327152e-05,
      "loss": 0.6401,
      "step": 3288
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1736978613244858e-05,
      "loss": 0.7284,
      "step": 3289
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.17325069250599e-05,
      "loss": 0.642,
      "step": 3290
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1728034879694185e-05,
      "loss": 0.6186,
      "step": 3291
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1723562478069688e-05,
      "loss": 0.7111,
      "step": 3292
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1719089721108455e-05,
      "loss": 0.6274,
      "step": 3293
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.171461660973261e-05,
      "loss": 0.746,
      "step": 3294
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1710143144864343e-05,
      "loss": 0.6747,
      "step": 3295
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.170566932742593e-05,
      "loss": 0.6812,
      "step": 3296
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1701195158339706e-05,
      "loss": 0.5925,
      "step": 3297
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1696720638528085e-05,
      "loss": 0.7228,
      "step": 3298
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1692245768913553e-05,
      "loss": 0.6126,
      "step": 3299
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1687770550418667e-05,
      "loss": 0.5814,
      "step": 3300
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1683294983966061e-05,
      "loss": 0.6843,
      "step": 3301
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1678819070478426e-05,
      "loss": 0.6989,
      "step": 3302
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1674342810878545e-05,
      "loss": 0.6653,
      "step": 3303
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1669866206089257e-05,
      "loss": 0.6639,
      "step": 3304
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1665389257033481e-05,
      "loss": 0.6868,
      "step": 3305
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1660911964634196e-05,
      "loss": 0.6403,
      "step": 3306
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1656434329814466e-05,
      "loss": 0.6828,
      "step": 3307
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1651956353497418e-05,
      "loss": 0.664,
      "step": 3308
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1647478036606246e-05,
      "loss": 0.7073,
      "step": 3309
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1642999380064221e-05,
      "loss": 0.6476,
      "step": 3310
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1638520384794681e-05,
      "loss": 0.6022,
      "step": 3311
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1634041051721034e-05,
      "loss": 0.731,
      "step": 3312
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1629561381766756e-05,
      "loss": 0.6858,
      "step": 3313
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1625081375855396e-05,
      "loss": 0.727,
      "step": 3314
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1620601034910571e-05,
      "loss": 0.6808,
      "step": 3315
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.1616120359855966e-05,
      "loss": 0.6382,
      "step": 3316
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1611639351615337e-05,
      "loss": 0.7929,
      "step": 3317
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1607158011112504e-05,
      "loss": 0.6176,
      "step": 3318
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1602676339271362e-05,
      "loss": 0.6874,
      "step": 3319
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1598194337015865e-05,
      "loss": 0.7479,
      "step": 3320
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1593712005270048e-05,
      "loss": 0.6784,
      "step": 3321
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1589229344958e-05,
      "loss": 0.6619,
      "step": 3322
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1584746357003891e-05,
      "loss": 0.6735,
      "step": 3323
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1580263042331949e-05,
      "loss": 0.6229,
      "step": 3324
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1575779401866475e-05,
      "loss": 0.6704,
      "step": 3325
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1571295436531835e-05,
      "loss": 0.6958,
      "step": 3326
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1566811147252457e-05,
      "loss": 0.6461,
      "step": 3327
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1562326534952844e-05,
      "loss": 0.5958,
      "step": 3328
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.155784160055756e-05,
      "loss": 0.6751,
      "step": 3329
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.155335634499124e-05,
      "loss": 0.6112,
      "step": 3330
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1548870769178581e-05,
      "loss": 0.7034,
      "step": 3331
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1544384874044354e-05,
      "loss": 0.6985,
      "step": 3332
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1539898660513377e-05,
      "loss": 0.6479,
      "step": 3333
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.153541212951056e-05,
      "loss": 0.6872,
      "step": 3334
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1530925281960856e-05,
      "loss": 0.5273,
      "step": 3335
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1526438118789294e-05,
      "loss": 0.661,
      "step": 3336
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1521950640920965e-05,
      "loss": 0.6572,
      "step": 3337
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1517462849281027e-05,
      "loss": 0.5837,
      "step": 3338
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1512974744794702e-05,
      "loss": 0.601,
      "step": 3339
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1508486328387276e-05,
      "loss": 0.6573,
      "step": 3340
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.15039976009841e-05,
      "loss": 0.6013,
      "step": 3341
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1499508563510587e-05,
      "loss": 0.6224,
      "step": 3342
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1495019216892218e-05,
      "loss": 0.6413,
      "step": 3343
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1490529562054532e-05,
      "loss": 0.6866,
      "step": 3344
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1486039599923133e-05,
      "loss": 0.679,
      "step": 3345
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1481549331423698e-05,
      "loss": 0.6261,
      "step": 3346
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1477058757481952e-05,
      "loss": 0.6481,
      "step": 3347
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1472567879023695e-05,
      "loss": 0.6561,
      "step": 3348
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.146807669697478e-05,
      "loss": 0.5865,
      "step": 3349
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1463585212261133e-05,
      "loss": 0.6114,
      "step": 3350
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1459093425808729e-05,
      "loss": 0.6743,
      "step": 3351
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1454601338543622e-05,
      "loss": 0.6298,
      "step": 3352
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1450108951391917e-05,
      "loss": 0.6707,
      "step": 3353
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1445616265279777e-05,
      "loss": 0.6859,
      "step": 3354
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1441123281133441e-05,
      "loss": 0.6124,
      "step": 3355
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1436629999879195e-05,
      "loss": 0.6962,
      "step": 3356
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1432136422443397e-05,
      "loss": 0.5923,
      "step": 3357
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1427642549752456e-05,
      "loss": 0.6915,
      "step": 3358
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1423148382732854e-05,
      "loss": 0.6018,
      "step": 3359
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1418653922311121e-05,
      "loss": 0.6029,
      "step": 3360
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1414159169413855e-05,
      "loss": 0.6569,
      "step": 3361
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1409664124967714e-05,
      "loss": 0.7366,
      "step": 3362
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1405168789899418e-05,
      "loss": 0.6396,
      "step": 3363
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1400673165135736e-05,
      "loss": 0.5403,
      "step": 3364
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1396177251603514e-05,
      "loss": 0.603,
      "step": 3365
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.139168105022964e-05,
      "loss": 0.5785,
      "step": 3366
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1387184561941069e-05,
      "loss": 0.6344,
      "step": 3367
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.138268778766482e-05,
      "loss": 0.7348,
      "step": 3368
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1378190728327964e-05,
      "loss": 0.698,
      "step": 3369
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1373693384857641e-05,
      "loss": 0.5747,
      "step": 3370
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1369195758181028e-05,
      "loss": 0.7003,
      "step": 3371
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1364697849225385e-05,
      "loss": 0.6359,
      "step": 3372
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1360199658918016e-05,
      "loss": 0.6772,
      "step": 3373
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1355701188186287e-05,
      "loss": 0.7277,
      "step": 3374
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1351202437957617e-05,
      "loss": 0.6921,
      "step": 3375
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1346703409159495e-05,
      "loss": 0.7591,
      "step": 3376
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1342204102719454e-05,
      "loss": 0.7309,
      "step": 3377
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1337704519565088e-05,
      "loss": 0.6835,
      "step": 3378
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1333204660624053e-05,
      "loss": 0.7216,
      "step": 3379
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1328704526824057e-05,
      "loss": 0.7006,
      "step": 3380
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1324204119092868e-05,
      "loss": 0.6798,
      "step": 3381
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1319703438358304e-05,
      "loss": 0.5608,
      "step": 3382
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.131520248554825e-05,
      "loss": 0.6424,
      "step": 3383
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1310701261590638e-05,
      "loss": 0.6729,
      "step": 3384
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1306199767413455e-05,
      "loss": 0.6516,
      "step": 3385
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1301698003944756e-05,
      "loss": 0.653,
      "step": 3386
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1297195972112636e-05,
      "loss": 0.5835,
      "step": 3387
    },
    {
      "epoch": 0.47,
      "learning_rate": 1.1292693672845254e-05,
      "loss": 0.6763,
      "step": 3388
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1288191107070824e-05,
      "loss": 0.5852,
      "step": 3389
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1283688275717614e-05,
      "loss": 0.6472,
      "step": 3390
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1279185179713945e-05,
      "loss": 0.683,
      "step": 3391
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1274681819988192e-05,
      "loss": 0.6476,
      "step": 3392
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1270178197468788e-05,
      "loss": 0.6841,
      "step": 3393
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1265674313084221e-05,
      "loss": 0.6473,
      "step": 3394
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1261170167763027e-05,
      "loss": 0.6919,
      "step": 3395
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1256665762433798e-05,
      "loss": 0.6699,
      "step": 3396
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1252161098025185e-05,
      "loss": 0.5613,
      "step": 3397
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1247656175465884e-05,
      "loss": 0.7212,
      "step": 3398
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.124315099568465e-05,
      "loss": 0.594,
      "step": 3399
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.123864555961029e-05,
      "loss": 0.6738,
      "step": 3400
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1234139868171666e-05,
      "loss": 0.6567,
      "step": 3401
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1229633922297683e-05,
      "loss": 0.7654,
      "step": 3402
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.122512772291731e-05,
      "loss": 0.5341,
      "step": 3403
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1220621270959565e-05,
      "loss": 0.7134,
      "step": 3404
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1216114567353511e-05,
      "loss": 0.7417,
      "step": 3405
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1211607613028273e-05,
      "loss": 0.7158,
      "step": 3406
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.120710040891302e-05,
      "loss": 0.6474,
      "step": 3407
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1202592955936981e-05,
      "loss": 0.6944,
      "step": 3408
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1198085255029428e-05,
      "loss": 0.6857,
      "step": 3409
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1193577307119687e-05,
      "loss": 0.6789,
      "step": 3410
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1189069113137135e-05,
      "loss": 0.6098,
      "step": 3411
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1184560674011203e-05,
      "loss": 0.7719,
      "step": 3412
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.118005199067136e-05,
      "loss": 0.6731,
      "step": 3413
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1175543064047147e-05,
      "loss": 0.6937,
      "step": 3414
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1171033895068134e-05,
      "loss": 0.6897,
      "step": 3415
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1166524484663953e-05,
      "loss": 0.6316,
      "step": 3416
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1162014833764285e-05,
      "loss": 0.7684,
      "step": 3417
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1157504943298852e-05,
      "loss": 0.6343,
      "step": 3418
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1152994814197439e-05,
      "loss": 0.5724,
      "step": 3419
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1148484447389866e-05,
      "loss": 0.6742,
      "step": 3420
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1143973843806016e-05,
      "loss": 0.6344,
      "step": 3421
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1139463004375806e-05,
      "loss": 0.6361,
      "step": 3422
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1134951930029212e-05,
      "loss": 0.6284,
      "step": 3423
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.113044062169626e-05,
      "loss": 0.7164,
      "step": 3424
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1125929080307011e-05,
      "loss": 0.6629,
      "step": 3425
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1121417306791593e-05,
      "loss": 0.5332,
      "step": 3426
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1116905302080163e-05,
      "loss": 0.5651,
      "step": 3427
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1112393067102943e-05,
      "loss": 0.6473,
      "step": 3428
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1107880602790187e-05,
      "loss": 0.749,
      "step": 3429
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1103367910072205e-05,
      "loss": 0.6949,
      "step": 3430
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.109885498987935e-05,
      "loss": 0.6875,
      "step": 3431
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1094341843142034e-05,
      "loss": 0.6765,
      "step": 3432
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1089828470790694e-05,
      "loss": 0.7491,
      "step": 3433
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1085314873755834e-05,
      "loss": 0.7015,
      "step": 3434
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.108080105296799e-05,
      "loss": 0.6398,
      "step": 3435
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1076287009357753e-05,
      "loss": 0.6139,
      "step": 3436
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1071772743855754e-05,
      "loss": 0.6894,
      "step": 3437
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1067258257392674e-05,
      "loss": 0.6543,
      "step": 3438
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1062743550899242e-05,
      "loss": 0.5925,
      "step": 3439
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1058228625306222e-05,
      "loss": 0.6276,
      "step": 3440
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1053713481544437e-05,
      "loss": 0.6825,
      "step": 3441
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1049198120544737e-05,
      "loss": 0.708,
      "step": 3442
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1044682543238038e-05,
      "loss": 0.7055,
      "step": 3443
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1040166750555288e-05,
      "loss": 0.6271,
      "step": 3444
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1035650743427475e-05,
      "loss": 0.6965,
      "step": 3445
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.103113452278564e-05,
      "loss": 0.7585,
      "step": 3446
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1026618089560869e-05,
      "loss": 0.6248,
      "step": 3447
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.102210144468429e-05,
      "loss": 0.5878,
      "step": 3448
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1017584589087067e-05,
      "loss": 0.6544,
      "step": 3449
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1013067523700418e-05,
      "loss": 0.6619,
      "step": 3450
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1008550249455596e-05,
      "loss": 0.6937,
      "step": 3451
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.1004032767283905e-05,
      "loss": 0.6571,
      "step": 3452
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.0999515078116685e-05,
      "loss": 0.6208,
      "step": 3453
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.0994997182885324e-05,
      "loss": 0.6668,
      "step": 3454
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.0990479082521246e-05,
      "loss": 0.6275,
      "step": 3455
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.0985960777955925e-05,
      "loss": 0.659,
      "step": 3456
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.098144227012087e-05,
      "loss": 0.6831,
      "step": 3457
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.0976923559947636e-05,
      "loss": 0.6517,
      "step": 3458
    },
    {
      "epoch": 0.48,
      "learning_rate": 1.0972404648367823e-05,
      "loss": 0.5615,
      "step": 3459
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.096788553631306e-05,
      "loss": 0.7021,
      "step": 3460
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0963366224715035e-05,
      "loss": 0.6751,
      "step": 3461
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.095884671450546e-05,
      "loss": 0.7329,
      "step": 3462
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0954327006616103e-05,
      "loss": 0.6743,
      "step": 3463
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0949807101978763e-05,
      "loss": 0.6297,
      "step": 3464
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0945287001525277e-05,
      "loss": 0.6875,
      "step": 3465
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0940766706187535e-05,
      "loss": 0.7026,
      "step": 3466
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0936246216897455e-05,
      "loss": 0.6413,
      "step": 3467
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0931725534587004e-05,
      "loss": 0.6543,
      "step": 3468
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0927204660188172e-05,
      "loss": 0.6827,
      "step": 3469
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.092268359463302e-05,
      "loss": 0.6938,
      "step": 3470
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0918162338853617e-05,
      "loss": 0.6963,
      "step": 3471
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.091364089378209e-05,
      "loss": 0.6149,
      "step": 3472
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0909119260350593e-05,
      "loss": 0.6966,
      "step": 3473
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0904597439491326e-05,
      "loss": 0.7027,
      "step": 3474
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.090007543213653e-05,
      "loss": 0.69,
      "step": 3475
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0895553239218475e-05,
      "loss": 0.6008,
      "step": 3476
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.089103086166948e-05,
      "loss": 0.6039,
      "step": 3477
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0886508300421892e-05,
      "loss": 0.7328,
      "step": 3478
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0881985556408107e-05,
      "loss": 0.5924,
      "step": 3479
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0877462630560547e-05,
      "loss": 0.7137,
      "step": 3480
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0872939523811684e-05,
      "loss": 0.7342,
      "step": 3481
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0868416237094008e-05,
      "loss": 0.6851,
      "step": 3482
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0863892771340071e-05,
      "loss": 0.6756,
      "step": 3483
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0859369127482445e-05,
      "loss": 0.6803,
      "step": 3484
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0854845306453737e-05,
      "loss": 0.6489,
      "step": 3485
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0850321309186607e-05,
      "loss": 0.7057,
      "step": 3486
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0845797136613733e-05,
      "loss": 0.7463,
      "step": 3487
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.084127278966784e-05,
      "loss": 0.6591,
      "step": 3488
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0836748269281688e-05,
      "loss": 0.7397,
      "step": 3489
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0832223576388068e-05,
      "loss": 0.6011,
      "step": 3490
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0827698711919807e-05,
      "loss": 0.671,
      "step": 3491
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0823173676809773e-05,
      "loss": 0.6524,
      "step": 3492
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.081864847199087e-05,
      "loss": 0.6376,
      "step": 3493
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0814123098396023e-05,
      "loss": 0.6271,
      "step": 3494
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.080959755695821e-05,
      "loss": 0.7005,
      "step": 3495
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0805071848610431e-05,
      "loss": 0.5753,
      "step": 3496
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0800545974285725e-05,
      "loss": 0.5401,
      "step": 3497
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0796019934917167e-05,
      "loss": 0.7,
      "step": 3498
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0791493731437864e-05,
      "loss": 0.669,
      "step": 3499
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.078696736478095e-05,
      "loss": 0.6979,
      "step": 3500
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0782440835879608e-05,
      "loss": 0.6859,
      "step": 3501
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0777914145667045e-05,
      "loss": 0.6434,
      "step": 3502
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0773387295076496e-05,
      "loss": 0.6562,
      "step": 3503
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0768860285041242e-05,
      "loss": 0.5705,
      "step": 3504
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0764333116494582e-05,
      "loss": 0.7088,
      "step": 3505
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0759805790369865e-05,
      "loss": 0.7755,
      "step": 3506
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0755278307600459e-05,
      "loss": 0.7044,
      "step": 3507
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0750750669119766e-05,
      "loss": 0.6901,
      "step": 3508
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0746222875861223e-05,
      "loss": 0.6968,
      "step": 3509
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0741694928758304e-05,
      "loss": 0.6088,
      "step": 3510
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0737166828744503e-05,
      "loss": 0.6512,
      "step": 3511
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0732638576753355e-05,
      "loss": 0.7027,
      "step": 3512
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0728110173718425e-05,
      "loss": 0.6755,
      "step": 3513
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.07235816205733e-05,
      "loss": 0.6833,
      "step": 3514
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.071905291825161e-05,
      "loss": 0.5458,
      "step": 3515
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.071452406768701e-05,
      "loss": 0.7256,
      "step": 3516
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0709995069813193e-05,
      "loss": 0.656,
      "step": 3517
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0705465925563864e-05,
      "loss": 0.6385,
      "step": 3518
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0700936635872781e-05,
      "loss": 0.6793,
      "step": 3519
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.069640720167371e-05,
      "loss": 0.5814,
      "step": 3520
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0691877623900468e-05,
      "loss": 0.6513,
      "step": 3521
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0687347903486884e-05,
      "loss": 0.6926,
      "step": 3522
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0682818041366829e-05,
      "loss": 0.5966,
      "step": 3523
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0678288038474196e-05,
      "loss": 0.6388,
      "step": 3524
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0673757895742908e-05,
      "loss": 0.6656,
      "step": 3525
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.066922761410692e-05,
      "loss": 0.6678,
      "step": 3526
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0664697194500211e-05,
      "loss": 0.6934,
      "step": 3527
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0660166637856794e-05,
      "loss": 0.7086,
      "step": 3528
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0655635945110705e-05,
      "loss": 0.6451,
      "step": 3529
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.0651105117196013e-05,
      "loss": 0.6584,
      "step": 3530
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0646574155046806e-05,
      "loss": 0.7026,
      "step": 3531
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.064204305959721e-05,
      "loss": 0.5571,
      "step": 3532
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0637511831781375e-05,
      "loss": 0.7425,
      "step": 3533
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0632980472533476e-05,
      "loss": 0.7677,
      "step": 3534
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0628448982787718e-05,
      "loss": 0.6913,
      "step": 3535
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0623917363478331e-05,
      "loss": 0.6761,
      "step": 3536
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0619385615539572e-05,
      "loss": 0.6745,
      "step": 3537
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0614853739905725e-05,
      "loss": 0.6836,
      "step": 3538
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0610321737511097e-05,
      "loss": 0.7074,
      "step": 3539
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0605789609290031e-05,
      "loss": 0.6016,
      "step": 3540
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0601257356176885e-05,
      "loss": 0.6033,
      "step": 3541
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.059672497910605e-05,
      "loss": 0.7509,
      "step": 3542
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0592192479011934e-05,
      "loss": 0.6482,
      "step": 3543
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.058765985682898e-05,
      "loss": 0.6407,
      "step": 3544
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0583127113491648e-05,
      "loss": 0.6777,
      "step": 3545
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0578594249934433e-05,
      "loss": 0.7135,
      "step": 3546
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0574061267091844e-05,
      "loss": 0.7198,
      "step": 3547
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0569528165898424e-05,
      "loss": 0.5932,
      "step": 3548
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0564994947288729e-05,
      "loss": 0.7485,
      "step": 3549
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0560461612197355e-05,
      "loss": 0.6011,
      "step": 3550
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0555928161558905e-05,
      "loss": 0.7201,
      "step": 3551
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0551394596308016e-05,
      "loss": 0.5805,
      "step": 3552
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.054686091737935e-05,
      "loss": 0.5741,
      "step": 3553
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0542327125707582e-05,
      "loss": 0.6828,
      "step": 3554
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0537793222227425e-05,
      "loss": 0.6101,
      "step": 3555
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0533259207873602e-05,
      "loss": 0.658,
      "step": 3556
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0528725083580869e-05,
      "loss": 0.6849,
      "step": 3557
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0524190850283991e-05,
      "loss": 0.637,
      "step": 3558
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0519656508917774e-05,
      "loss": 0.701,
      "step": 3559
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.051512206041703e-05,
      "loss": 0.6859,
      "step": 3560
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0510587505716603e-05,
      "loss": 0.5836,
      "step": 3561
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0506052845751354e-05,
      "loss": 0.7327,
      "step": 3562
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0501518081456164e-05,
      "loss": 0.6454,
      "step": 3563
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0496983213765945e-05,
      "loss": 0.59,
      "step": 3564
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0492448243615621e-05,
      "loss": 0.6374,
      "step": 3565
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.048791317194014e-05,
      "loss": 0.6795,
      "step": 3566
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0483377999674468e-05,
      "loss": 0.8056,
      "step": 3567
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0478842727753604e-05,
      "loss": 0.7281,
      "step": 3568
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0474307357112548e-05,
      "loss": 0.7009,
      "step": 3569
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0469771888686333e-05,
      "loss": 0.7018,
      "step": 3570
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0465236323410018e-05,
      "loss": 0.6691,
      "step": 3571
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0460700662218662e-05,
      "loss": 0.7133,
      "step": 3572
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0456164906047364e-05,
      "loss": 0.6217,
      "step": 3573
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0451629055831229e-05,
      "loss": 0.6539,
      "step": 3574
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.044709311250539e-05,
      "loss": 0.6659,
      "step": 3575
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0442557077004995e-05,
      "loss": 0.5895,
      "step": 3576
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0438020950265208e-05,
      "loss": 0.5913,
      "step": 3577
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0433484733221222e-05,
      "loss": 0.6385,
      "step": 3578
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0428948426808241e-05,
      "loss": 0.646,
      "step": 3579
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0424412031961485e-05,
      "loss": 0.7454,
      "step": 3580
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0419875549616196e-05,
      "loss": 0.6745,
      "step": 3581
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0415338980707639e-05,
      "loss": 0.6903,
      "step": 3582
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0410802326171083e-05,
      "loss": 0.6523,
      "step": 3583
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0406265586941831e-05,
      "loss": 0.6469,
      "step": 3584
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0401728763955192e-05,
      "loss": 0.6059,
      "step": 3585
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.03971918581465e-05,
      "loss": 0.6417,
      "step": 3586
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0392654870451098e-05,
      "loss": 0.7195,
      "step": 3587
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0388117801804354e-05,
      "loss": 0.7191,
      "step": 3588
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0383580653141643e-05,
      "loss": 0.7022,
      "step": 3589
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0379043425398367e-05,
      "loss": 0.653,
      "step": 3590
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0374506119509939e-05,
      "loss": 0.6276,
      "step": 3591
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0369968736411786e-05,
      "loss": 0.5915,
      "step": 3592
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0365431277039355e-05,
      "loss": 0.5289,
      "step": 3593
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0360893742328108e-05,
      "loss": 0.6478,
      "step": 3594
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0356356133213525e-05,
      "loss": 0.7895,
      "step": 3595
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0351818450631093e-05,
      "loss": 0.5527,
      "step": 3596
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0347280695516319e-05,
      "loss": 0.7419,
      "step": 3597
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.034274286880473e-05,
      "loss": 0.6499,
      "step": 3598
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.033820497143186e-05,
      "loss": 0.6423,
      "step": 3599
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0333667004333258e-05,
      "loss": 0.6214,
      "step": 3600
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.0329128968444496e-05,
      "loss": 0.6533,
      "step": 3601
    },
    {
      "epoch": 0.5,
      "learning_rate": 1.032459086470115e-05,
      "loss": 0.548,
      "step": 3602
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0320052694038814e-05,
      "loss": 0.7036,
      "step": 3603
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0315514457393099e-05,
      "loss": 0.656,
      "step": 3604
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0310976155699624e-05,
      "loss": 0.6615,
      "step": 3605
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0306437789894025e-05,
      "loss": 0.6998,
      "step": 3606
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.030189936091195e-05,
      "loss": 0.6871,
      "step": 3607
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0297360869689059e-05,
      "loss": 0.6332,
      "step": 3608
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0292822317161027e-05,
      "loss": 0.7191,
      "step": 3609
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0288283704263541e-05,
      "loss": 0.7735,
      "step": 3610
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0283745031932304e-05,
      "loss": 0.7325,
      "step": 3611
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0279206301103017e-05,
      "loss": 0.6354,
      "step": 3612
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0274667512711414e-05,
      "loss": 0.624,
      "step": 3613
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0270128667693225e-05,
      "loss": 0.7229,
      "step": 3614
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0265589766984199e-05,
      "loss": 0.5508,
      "step": 3615
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0261050811520089e-05,
      "loss": 0.6955,
      "step": 3616
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.025651180223667e-05,
      "loss": 0.7337,
      "step": 3617
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0251972740069724e-05,
      "loss": 0.701,
      "step": 3618
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0247433625955044e-05,
      "loss": 0.6036,
      "step": 3619
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0242894460828426e-05,
      "loss": 0.6905,
      "step": 3620
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0238355245625684e-05,
      "loss": 0.7449,
      "step": 3621
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0233815981282646e-05,
      "loss": 0.7093,
      "step": 3622
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0229276668735143e-05,
      "loss": 0.6994,
      "step": 3623
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0224737308919015e-05,
      "loss": 0.6173,
      "step": 3624
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0220197902770122e-05,
      "loss": 0.6111,
      "step": 3625
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0215658451224322e-05,
      "loss": 0.7089,
      "step": 3626
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0211118955217487e-05,
      "loss": 0.649,
      "step": 3627
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.02065794156855e-05,
      "loss": 0.6229,
      "step": 3628
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0202039833564251e-05,
      "loss": 0.6891,
      "step": 3629
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0197500209789638e-05,
      "loss": 0.6191,
      "step": 3630
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0192960545297568e-05,
      "loss": 0.6679,
      "step": 3631
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0188420841023955e-05,
      "loss": 0.7547,
      "step": 3632
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.018388109790473e-05,
      "loss": 0.7787,
      "step": 3633
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.017934131687582e-05,
      "loss": 0.5858,
      "step": 3634
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0174801498873165e-05,
      "loss": 0.7557,
      "step": 3635
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0170261644832715e-05,
      "loss": 0.5709,
      "step": 3636
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0165721755690423e-05,
      "loss": 0.6492,
      "step": 3637
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.016118183238225e-05,
      "loss": 0.6308,
      "step": 3638
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0156641875844169e-05,
      "loss": 0.7352,
      "step": 3639
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0152101887012154e-05,
      "loss": 0.7429,
      "step": 3640
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0147561866822186e-05,
      "loss": 0.6139,
      "step": 3641
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0143021816210259e-05,
      "loss": 0.5952,
      "step": 3642
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0138481736112363e-05,
      "loss": 0.6889,
      "step": 3643
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0133941627464503e-05,
      "loss": 0.672,
      "step": 3644
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0129401491202686e-05,
      "loss": 0.642,
      "step": 3645
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0124861328262926e-05,
      "loss": 0.6524,
      "step": 3646
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0120321139581239e-05,
      "loss": 0.7079,
      "step": 3647
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.011578092609365e-05,
      "loss": 0.6903,
      "step": 3648
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.011124068873619e-05,
      "loss": 0.6466,
      "step": 3649
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0106700428444892e-05,
      "loss": 0.686,
      "step": 3650
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0102160146155794e-05,
      "loss": 0.6512,
      "step": 3651
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.009761984280494e-05,
      "loss": 0.7277,
      "step": 3652
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0093079519328378e-05,
      "loss": 0.6909,
      "step": 3653
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0088539176662157e-05,
      "loss": 0.7761,
      "step": 3654
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0083998815742335e-05,
      "loss": 0.5896,
      "step": 3655
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0079458437504973e-05,
      "loss": 0.7195,
      "step": 3656
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0074918042886132e-05,
      "loss": 0.5937,
      "step": 3657
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0070377632821879e-05,
      "loss": 0.6756,
      "step": 3658
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0065837208248284e-05,
      "loss": 0.7332,
      "step": 3659
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.006129677010142e-05,
      "loss": 0.6568,
      "step": 3660
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.005675631931736e-05,
      "loss": 0.5705,
      "step": 3661
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0052215856832181e-05,
      "loss": 0.6334,
      "step": 3662
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0047675383581969e-05,
      "loss": 0.579,
      "step": 3663
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0043134900502805e-05,
      "loss": 0.6042,
      "step": 3664
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0038594408530768e-05,
      "loss": 0.639,
      "step": 3665
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0034053908601955e-05,
      "loss": 0.5997,
      "step": 3666
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0029513401652442e-05,
      "loss": 0.6979,
      "step": 3667
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.002497288861833e-05,
      "loss": 0.6345,
      "step": 3668
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.00204323704357e-05,
      "loss": 0.7331,
      "step": 3669
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.001589184804065e-05,
      "loss": 0.6948,
      "step": 3670
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0011351322369272e-05,
      "loss": 0.6381,
      "step": 3671
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0006810794357657e-05,
      "loss": 0.6602,
      "step": 3672
    },
    {
      "epoch": 0.51,
      "learning_rate": 1.0002270264941903e-05,
      "loss": 0.6648,
      "step": 3673
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.997729735058099e-06,
      "loss": 0.7391,
      "step": 3674
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.993189205642343e-06,
      "loss": 0.6356,
      "step": 3675
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.988648677630733e-06,
      "loss": 0.6698,
      "step": 3676
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.984108151959352e-06,
      "loss": 0.6545,
      "step": 3677
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.979567629564302e-06,
      "loss": 0.6982,
      "step": 3678
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.975027111381676e-06,
      "loss": 0.6601,
      "step": 3679
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.97048659834756e-06,
      "loss": 0.7442,
      "step": 3680
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.965946091398048e-06,
      "loss": 0.6804,
      "step": 3681
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.96140559146923e-06,
      "loss": 0.6108,
      "step": 3682
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.9568650994972e-06,
      "loss": 0.7054,
      "step": 3683
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.952324616418034e-06,
      "loss": 0.7302,
      "step": 3684
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.94778414316782e-06,
      "loss": 0.6551,
      "step": 3685
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.943243680682643e-06,
      "loss": 0.7168,
      "step": 3686
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.938703229898586e-06,
      "loss": 0.7088,
      "step": 3687
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.93416279175172e-06,
      "loss": 0.6672,
      "step": 3688
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.929622367178123e-06,
      "loss": 0.6721,
      "step": 3689
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.925081957113873e-06,
      "loss": 0.6949,
      "step": 3690
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.92054156249503e-06,
      "loss": 0.6112,
      "step": 3691
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.916001184257668e-06,
      "loss": 0.725,
      "step": 3692
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.911460823337845e-06,
      "loss": 0.7112,
      "step": 3693
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.906920480671627e-06,
      "loss": 0.6669,
      "step": 3694
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.902380157195063e-06,
      "loss": 0.6444,
      "step": 3695
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.897839853844207e-06,
      "loss": 0.6884,
      "step": 3696
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.89329957155511e-06,
      "loss": 0.6538,
      "step": 3697
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.888759311263814e-06,
      "loss": 0.7093,
      "step": 3698
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.884219073906353e-06,
      "loss": 0.5769,
      "step": 3699
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.879678860418764e-06,
      "loss": 0.7437,
      "step": 3700
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.875138671737079e-06,
      "loss": 0.5393,
      "step": 3701
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.870598508797317e-06,
      "loss": 0.696,
      "step": 3702
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.866058372535499e-06,
      "loss": 0.6499,
      "step": 3703
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.861518263887639e-06,
      "loss": 0.5833,
      "step": 3704
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.856978183789746e-06,
      "loss": 0.6563,
      "step": 3705
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.852438133177818e-06,
      "loss": 0.5892,
      "step": 3706
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.84789811298785e-06,
      "loss": 0.6986,
      "step": 3707
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.843358124155834e-06,
      "loss": 0.6812,
      "step": 3708
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.838818167617751e-06,
      "loss": 0.7046,
      "step": 3709
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.834278244309579e-06,
      "loss": 0.6305,
      "step": 3710
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.829738355167287e-06,
      "loss": 0.6826,
      "step": 3711
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.82519850112684e-06,
      "loss": 0.597,
      "step": 3712
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.820658683124183e-06,
      "loss": 0.6842,
      "step": 3713
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.816118902095273e-06,
      "loss": 0.6258,
      "step": 3714
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.811579158976045e-06,
      "loss": 0.6475,
      "step": 3715
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.807039454702436e-06,
      "loss": 0.7241,
      "step": 3716
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.802499790210366e-06,
      "loss": 0.7169,
      "step": 3717
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.79796016643575e-06,
      "loss": 0.7356,
      "step": 3718
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.793420584314504e-06,
      "loss": 0.7606,
      "step": 3719
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.788881044782517e-06,
      "loss": 0.6574,
      "step": 3720
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.784341548775681e-06,
      "loss": 0.6665,
      "step": 3721
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.77980209722988e-06,
      "loss": 0.609,
      "step": 3722
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.775262691080987e-06,
      "loss": 0.6454,
      "step": 3723
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.77072333126486e-06,
      "loss": 0.6848,
      "step": 3724
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.766184018717356e-06,
      "loss": 0.8141,
      "step": 3725
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.761644754374316e-06,
      "loss": 0.6463,
      "step": 3726
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.75710553917158e-06,
      "loss": 0.6871,
      "step": 3727
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.752566374044961e-06,
      "loss": 0.671,
      "step": 3728
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.748027259930276e-06,
      "loss": 0.5821,
      "step": 3729
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.743488197763333e-06,
      "loss": 0.505,
      "step": 3730
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.738949188479916e-06,
      "loss": 0.6143,
      "step": 3731
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.734410233015804e-06,
      "loss": 0.6723,
      "step": 3732
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.729871332306775e-06,
      "loss": 0.6387,
      "step": 3733
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.72533248728859e-06,
      "loss": 0.6221,
      "step": 3734
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.720793698896986e-06,
      "loss": 0.6558,
      "step": 3735
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.7162549680677e-06,
      "loss": 0.6648,
      "step": 3736
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.711716295736459e-06,
      "loss": 0.6291,
      "step": 3737
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.707177682838976e-06,
      "loss": 0.6656,
      "step": 3738
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.702639130310944e-06,
      "loss": 0.7259,
      "step": 3739
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.698100639088052e-06,
      "loss": 0.6099,
      "step": 3740
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.69356221010598e-06,
      "loss": 0.5716,
      "step": 3741
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.68902384430038e-06,
      "loss": 0.6096,
      "step": 3742
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.684485542606903e-06,
      "loss": 0.5272,
      "step": 3743
    },
    {
      "epoch": 0.52,
      "learning_rate": 9.679947305961188e-06,
      "loss": 0.6897,
      "step": 3744
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.675409135298855e-06,
      "loss": 0.6239,
      "step": 3745
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.67087103155551e-06,
      "loss": 0.6518,
      "step": 3746
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.666332995666743e-06,
      "loss": 0.6544,
      "step": 3747
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.661795028568145e-06,
      "loss": 0.7253,
      "step": 3748
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.657257131195274e-06,
      "loss": 0.5928,
      "step": 3749
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.652719304483683e-06,
      "loss": 0.6295,
      "step": 3750
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.648181549368908e-06,
      "loss": 0.7322,
      "step": 3751
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.64364386678648e-06,
      "loss": 0.6159,
      "step": 3752
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.639106257671894e-06,
      "loss": 0.6284,
      "step": 3753
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.634568722960647e-06,
      "loss": 0.6727,
      "step": 3754
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.630031263588216e-06,
      "loss": 0.5993,
      "step": 3755
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.625493880490065e-06,
      "loss": 0.7191,
      "step": 3756
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.620956574601635e-06,
      "loss": 0.6478,
      "step": 3757
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.616419346858359e-06,
      "loss": 0.7044,
      "step": 3758
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.611882198195653e-06,
      "loss": 0.7318,
      "step": 3759
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.607345129548905e-06,
      "loss": 0.6374,
      "step": 3760
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.602808141853503e-06,
      "loss": 0.5921,
      "step": 3761
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.598271236044808e-06,
      "loss": 0.6199,
      "step": 3762
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.593734413058172e-06,
      "loss": 0.6844,
      "step": 3763
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.589197673828919e-06,
      "loss": 0.6828,
      "step": 3764
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.584661019292364e-06,
      "loss": 0.6536,
      "step": 3765
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.580124450383804e-06,
      "loss": 0.6696,
      "step": 3766
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.57558796803852e-06,
      "loss": 0.6868,
      "step": 3767
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.571051573191762e-06,
      "loss": 0.6025,
      "step": 3768
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.566515266778778e-06,
      "loss": 0.6819,
      "step": 3769
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.561979049734793e-06,
      "loss": 0.748,
      "step": 3770
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.557442922995009e-06,
      "loss": 0.6552,
      "step": 3771
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.552906887494611e-06,
      "loss": 0.7695,
      "step": 3772
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.548370944168773e-06,
      "loss": 0.5817,
      "step": 3773
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.543835093952641e-06,
      "loss": 0.6069,
      "step": 3774
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.539299337781341e-06,
      "loss": 0.737,
      "step": 3775
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.534763676589987e-06,
      "loss": 0.7153,
      "step": 3776
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.530228111313669e-06,
      "loss": 0.6989,
      "step": 3777
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.525692642887455e-06,
      "loss": 0.6178,
      "step": 3778
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.5211572722464e-06,
      "loss": 0.6325,
      "step": 3779
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.51662200032553e-06,
      "loss": 0.6736,
      "step": 3780
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.512086828059865e-06,
      "loss": 0.6423,
      "step": 3781
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.507551756384382e-06,
      "loss": 0.7769,
      "step": 3782
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.503016786234056e-06,
      "loss": 0.6494,
      "step": 3783
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.498481918543836e-06,
      "loss": 0.6791,
      "step": 3784
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.493947154248651e-06,
      "loss": 0.6525,
      "step": 3785
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.4894124942834e-06,
      "loss": 0.6659,
      "step": 3786
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.48487793958297e-06,
      "loss": 0.6475,
      "step": 3787
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.48034349108223e-06,
      "loss": 0.635,
      "step": 3788
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.47580914971601e-06,
      "loss": 0.6495,
      "step": 3789
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.471274916419136e-06,
      "loss": 0.6318,
      "step": 3790
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.4667407921264e-06,
      "loss": 0.6735,
      "step": 3791
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.46220677777258e-06,
      "loss": 0.6603,
      "step": 3792
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.45767287429242e-06,
      "loss": 0.635,
      "step": 3793
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.453139082620655e-06,
      "loss": 0.6329,
      "step": 3794
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.448605403691986e-06,
      "loss": 0.5981,
      "step": 3795
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.4440718384411e-06,
      "loss": 0.7175,
      "step": 3796
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.43953838780265e-06,
      "loss": 0.6321,
      "step": 3797
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.435005052711271e-06,
      "loss": 0.7011,
      "step": 3798
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.430471834101583e-06,
      "loss": 0.7301,
      "step": 3799
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.42593873290816e-06,
      "loss": 0.7013,
      "step": 3800
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.42140575006557e-06,
      "loss": 0.7099,
      "step": 3801
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.416872886508353e-06,
      "loss": 0.6132,
      "step": 3802
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.412340143171025e-06,
      "loss": 0.6632,
      "step": 3803
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.407807520988069e-06,
      "loss": 0.6645,
      "step": 3804
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.403275020893953e-06,
      "loss": 0.7156,
      "step": 3805
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.39874264382312e-06,
      "loss": 0.6762,
      "step": 3806
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.39421039070997e-06,
      "loss": 0.6084,
      "step": 3807
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.389678262488904e-06,
      "loss": 0.7376,
      "step": 3808
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.385146260094277e-06,
      "loss": 0.6055,
      "step": 3809
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.380614384460433e-06,
      "loss": 0.667,
      "step": 3810
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.376082636521672e-06,
      "loss": 0.6444,
      "step": 3811
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.371551017212283e-06,
      "loss": 0.7032,
      "step": 3812
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.367019527466526e-06,
      "loss": 0.7499,
      "step": 3813
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.36248816821863e-06,
      "loss": 0.6702,
      "step": 3814
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.357956940402796e-06,
      "loss": 0.6563,
      "step": 3815
    },
    {
      "epoch": 0.53,
      "learning_rate": 9.353425844953198e-06,
      "loss": 0.6164,
      "step": 3816
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.348894882803994e-06,
      "loss": 0.6867,
      "step": 3817
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.344364054889298e-06,
      "loss": 0.7508,
      "step": 3818
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.339833362143207e-06,
      "loss": 0.7069,
      "step": 3819
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.335302805499789e-06,
      "loss": 0.5887,
      "step": 3820
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.330772385893085e-06,
      "loss": 0.6127,
      "step": 3821
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.326242104257095e-06,
      "loss": 0.6166,
      "step": 3822
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.321711961525806e-06,
      "loss": 0.7483,
      "step": 3823
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.317181958633173e-06,
      "loss": 0.5605,
      "step": 3824
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.312652096513118e-06,
      "loss": 0.7686,
      "step": 3825
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.308122376099534e-06,
      "loss": 0.6489,
      "step": 3826
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.30359279832629e-06,
      "loss": 0.6917,
      "step": 3827
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.299063364127225e-06,
      "loss": 0.6985,
      "step": 3828
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.29453407443614e-06,
      "loss": 0.6983,
      "step": 3829
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.29000493018681e-06,
      "loss": 0.7252,
      "step": 3830
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.285475932312988e-06,
      "loss": 0.6404,
      "step": 3831
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.280947081748393e-06,
      "loss": 0.5631,
      "step": 3832
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.276418379426702e-06,
      "loss": 0.6949,
      "step": 3833
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.271889826281579e-06,
      "loss": 0.6699,
      "step": 3834
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.267361423246645e-06,
      "loss": 0.7134,
      "step": 3835
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.2628331712555e-06,
      "loss": 0.5796,
      "step": 3836
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.2583050712417e-06,
      "loss": 0.6264,
      "step": 3837
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.253777124138779e-06,
      "loss": 0.6216,
      "step": 3838
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.24924933088024e-06,
      "loss": 0.6911,
      "step": 3839
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.244721692399545e-06,
      "loss": 0.65,
      "step": 3840
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.240194209630136e-06,
      "loss": 0.7561,
      "step": 3841
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.235666883505416e-06,
      "loss": 0.5744,
      "step": 3842
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.231139714958763e-06,
      "loss": 0.6228,
      "step": 3843
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.226612704923506e-06,
      "loss": 0.6655,
      "step": 3844
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.222085854332958e-06,
      "loss": 0.6958,
      "step": 3845
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.217559164120395e-06,
      "loss": 0.6586,
      "step": 3846
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.21303263521905e-06,
      "loss": 0.687,
      "step": 3847
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.20850626856214e-06,
      "loss": 0.741,
      "step": 3848
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.203980065082834e-06,
      "loss": 0.6664,
      "step": 3849
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.199454025714278e-06,
      "loss": 0.645,
      "step": 3850
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.194928151389572e-06,
      "loss": 0.5724,
      "step": 3851
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.190402443041792e-06,
      "loss": 0.5966,
      "step": 3852
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.185876901603979e-06,
      "loss": 0.6764,
      "step": 3853
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.181351528009135e-06,
      "loss": 0.6455,
      "step": 3854
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.176826323190228e-06,
      "loss": 0.7047,
      "step": 3855
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.172301288080196e-06,
      "loss": 0.6269,
      "step": 3856
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.167776423611938e-06,
      "loss": 0.6556,
      "step": 3857
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.163251730718315e-06,
      "loss": 0.6189,
      "step": 3858
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.158727210332162e-06,
      "loss": 0.6326,
      "step": 3859
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.154202863386268e-06,
      "loss": 0.6986,
      "step": 3860
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.149678690813398e-06,
      "loss": 0.6811,
      "step": 3861
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.145154693546265e-06,
      "loss": 0.7122,
      "step": 3862
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.14063087251756e-06,
      "loss": 0.6276,
      "step": 3863
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.13610722865993e-06,
      "loss": 0.5992,
      "step": 3864
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.131583762905993e-06,
      "loss": 0.607,
      "step": 3865
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.127060476188321e-06,
      "loss": 0.7206,
      "step": 3866
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.122537369439453e-06,
      "loss": 0.6613,
      "step": 3867
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.118014443591898e-06,
      "loss": 0.6973,
      "step": 3868
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.11349169957811e-06,
      "loss": 0.6453,
      "step": 3869
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.108969138330523e-06,
      "loss": 0.6691,
      "step": 3870
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.104446760781527e-06,
      "loss": 0.6798,
      "step": 3871
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.099924567863474e-06,
      "loss": 0.5885,
      "step": 3872
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.095402560508676e-06,
      "loss": 0.698,
      "step": 3873
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.090880739649408e-06,
      "loss": 0.696,
      "step": 3874
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.086359106217916e-06,
      "loss": 0.6353,
      "step": 3875
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.081837661146386e-06,
      "loss": 0.6119,
      "step": 3876
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.07731640536698e-06,
      "loss": 0.6852,
      "step": 3877
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.072795339811826e-06,
      "loss": 0.714,
      "step": 3878
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.068274465413003e-06,
      "loss": 0.6416,
      "step": 3879
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.063753783102549e-06,
      "loss": 0.643,
      "step": 3880
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.059233293812466e-06,
      "loss": 0.5818,
      "step": 3881
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.054712998474723e-06,
      "loss": 0.6788,
      "step": 3882
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.050192898021242e-06,
      "loss": 0.5984,
      "step": 3883
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.0456729933839e-06,
      "loss": 0.6736,
      "step": 3884
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.04115328549454e-06,
      "loss": 0.6452,
      "step": 3885
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.036633775284968e-06,
      "loss": 0.618,
      "step": 3886
    },
    {
      "epoch": 0.54,
      "learning_rate": 9.032114463686941e-06,
      "loss": 0.7116,
      "step": 3887
    },
    {
      "epoch": 0.55,
      "learning_rate": 9.02759535163218e-06,
      "loss": 0.643,
      "step": 3888
    },
    {
      "epoch": 0.55,
      "learning_rate": 9.023076440052364e-06,
      "loss": 0.7007,
      "step": 3889
    },
    {
      "epoch": 0.55,
      "learning_rate": 9.018557729879135e-06,
      "loss": 0.6752,
      "step": 3890
    },
    {
      "epoch": 0.55,
      "learning_rate": 9.01403922204408e-06,
      "loss": 0.5992,
      "step": 3891
    },
    {
      "epoch": 0.55,
      "learning_rate": 9.009520917478757e-06,
      "loss": 0.6722,
      "step": 3892
    },
    {
      "epoch": 0.55,
      "learning_rate": 9.005002817114678e-06,
      "loss": 0.6417,
      "step": 3893
    },
    {
      "epoch": 0.55,
      "learning_rate": 9.000484921883317e-06,
      "loss": 0.612,
      "step": 3894
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.995967232716097e-06,
      "loss": 0.5805,
      "step": 3895
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.991449750544404e-06,
      "loss": 0.7409,
      "step": 3896
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.986932476299587e-06,
      "loss": 0.6687,
      "step": 3897
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.982415410912935e-06,
      "loss": 0.7077,
      "step": 3898
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.977898555315712e-06,
      "loss": 0.6616,
      "step": 3899
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.97338191043913e-06,
      "loss": 0.6954,
      "step": 3900
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.968865477214362e-06,
      "loss": 0.658,
      "step": 3901
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.964349256572528e-06,
      "loss": 0.6603,
      "step": 3902
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.959833249444715e-06,
      "loss": 0.6032,
      "step": 3903
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.95531745676196e-06,
      "loss": 0.6072,
      "step": 3904
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.950801879455265e-06,
      "loss": 0.669,
      "step": 3905
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.946286518455566e-06,
      "loss": 0.551,
      "step": 3906
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.941771374693778e-06,
      "loss": 0.6566,
      "step": 3907
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.937256449100761e-06,
      "loss": 0.5046,
      "step": 3908
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.932741742607328e-06,
      "loss": 0.6181,
      "step": 3909
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.928227256144248e-06,
      "loss": 0.6968,
      "step": 3910
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.923712990642249e-06,
      "loss": 0.64,
      "step": 3911
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.919198947032014e-06,
      "loss": 0.6094,
      "step": 3912
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.914685126244169e-06,
      "loss": 0.6123,
      "step": 3913
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.910171529209306e-06,
      "loss": 0.6666,
      "step": 3914
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.905658156857971e-06,
      "loss": 0.7025,
      "step": 3915
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.901145010120651e-06,
      "loss": 0.6219,
      "step": 3916
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.896632089927799e-06,
      "loss": 0.6502,
      "step": 3917
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.892119397209817e-06,
      "loss": 0.635,
      "step": 3918
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.88760693289706e-06,
      "loss": 0.6692,
      "step": 3919
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.883094697919839e-06,
      "loss": 0.6275,
      "step": 3920
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.878582693208409e-06,
      "loss": 0.7247,
      "step": 3921
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.87407091969299e-06,
      "loss": 0.6466,
      "step": 3922
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.869559378303747e-06,
      "loss": 0.6363,
      "step": 3923
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.865048069970792e-06,
      "loss": 0.655,
      "step": 3924
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.860536995624198e-06,
      "loss": 0.5977,
      "step": 3925
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.85602615619399e-06,
      "loss": 0.6553,
      "step": 3926
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.851515552610135e-06,
      "loss": 0.6473,
      "step": 3927
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.847005185802564e-06,
      "loss": 0.6272,
      "step": 3928
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.842495056701148e-06,
      "loss": 0.5966,
      "step": 3929
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.837985166235721e-06,
      "loss": 0.7196,
      "step": 3930
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.833475515336049e-06,
      "loss": 0.6629,
      "step": 3931
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.828966104931868e-06,
      "loss": 0.7027,
      "step": 3932
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.824456935952856e-06,
      "loss": 0.6504,
      "step": 3933
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.819948009328641e-06,
      "loss": 0.6162,
      "step": 3934
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.815439325988802e-06,
      "loss": 0.6605,
      "step": 3935
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.810930886862865e-06,
      "loss": 0.7546,
      "step": 3936
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.806422692880318e-06,
      "loss": 0.6562,
      "step": 3937
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.801914744970574e-06,
      "loss": 0.6565,
      "step": 3938
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.79740704406302e-06,
      "loss": 0.7483,
      "step": 3939
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.79289959108698e-06,
      "loss": 0.6121,
      "step": 3940
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.78839238697173e-06,
      "loss": 0.7362,
      "step": 3941
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.783885432646492e-06,
      "loss": 0.8347,
      "step": 3942
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.779378729040439e-06,
      "loss": 0.5724,
      "step": 3943
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.774872277082695e-06,
      "loss": 0.651,
      "step": 3944
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.770366077702322e-06,
      "loss": 0.661,
      "step": 3945
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.76586013182834e-06,
      "loss": 0.6615,
      "step": 3946
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.761354440389712e-06,
      "loss": 0.5677,
      "step": 3947
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.756849004315353e-06,
      "loss": 0.75,
      "step": 3948
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.75234382453412e-06,
      "loss": 0.6839,
      "step": 3949
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.747838901974818e-06,
      "loss": 0.5866,
      "step": 3950
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.743334237566202e-06,
      "loss": 0.6775,
      "step": 3951
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.738829832236979e-06,
      "loss": 0.658,
      "step": 3952
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.734325686915782e-06,
      "loss": 0.6888,
      "step": 3953
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.729821802531213e-06,
      "loss": 0.7119,
      "step": 3954
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.725318180011811e-06,
      "loss": 0.6761,
      "step": 3955
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.720814820286059e-06,
      "loss": 0.6579,
      "step": 3956
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.716311724282388e-06,
      "loss": 0.6965,
      "step": 3957
    },
    {
      "epoch": 0.55,
      "learning_rate": 8.711808892929177e-06,
      "loss": 0.6086,
      "step": 3958
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.70730632715475e-06,
      "loss": 0.7884,
      "step": 3959
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.702804027887369e-06,
      "loss": 0.7305,
      "step": 3960
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.698301996055247e-06,
      "loss": 0.6939,
      "step": 3961
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.693800232586545e-06,
      "loss": 0.6018,
      "step": 3962
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.689298738409367e-06,
      "loss": 0.5974,
      "step": 3963
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.684797514451751e-06,
      "loss": 0.6483,
      "step": 3964
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.680296561641695e-06,
      "loss": 0.6946,
      "step": 3965
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.675795880907137e-06,
      "loss": 0.6476,
      "step": 3966
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.671295473175946e-06,
      "loss": 0.6712,
      "step": 3967
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.66679533937595e-06,
      "loss": 0.6661,
      "step": 3968
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.662295480434914e-06,
      "loss": 0.6351,
      "step": 3969
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.657795897280553e-06,
      "loss": 0.664,
      "step": 3970
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.653296590840509e-06,
      "loss": 0.6025,
      "step": 3971
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.648797562042384e-06,
      "loss": 0.7221,
      "step": 3972
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.644298811813718e-06,
      "loss": 0.6746,
      "step": 3973
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.639800341081987e-06,
      "loss": 0.6801,
      "step": 3974
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.635302150774616e-06,
      "loss": 0.6869,
      "step": 3975
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.630804241818972e-06,
      "loss": 0.7035,
      "step": 3976
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.626306615142366e-06,
      "loss": 0.5946,
      "step": 3977
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.621809271672037e-06,
      "loss": 0.6935,
      "step": 3978
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.617312212335182e-06,
      "loss": 0.6716,
      "step": 3979
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.612815438058934e-06,
      "loss": 0.6531,
      "step": 3980
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.608318949770367e-06,
      "loss": 0.6062,
      "step": 3981
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.603822748396492e-06,
      "loss": 0.7422,
      "step": 3982
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.599326834864264e-06,
      "loss": 0.7068,
      "step": 3983
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.594831210100587e-06,
      "loss": 0.6876,
      "step": 3984
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.59033587503229e-06,
      "loss": 0.6496,
      "step": 3985
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.585840830586147e-06,
      "loss": 0.6527,
      "step": 3986
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.58134607768888e-06,
      "loss": 0.6979,
      "step": 3987
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.576851617267151e-06,
      "loss": 0.6777,
      "step": 3988
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.572357450247546e-06,
      "loss": 0.5905,
      "step": 3989
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.567863577556605e-06,
      "loss": 0.6321,
      "step": 3990
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.563370000120805e-06,
      "loss": 0.716,
      "step": 3991
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.558876718866564e-06,
      "loss": 0.6448,
      "step": 3992
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.554383734720226e-06,
      "loss": 0.5963,
      "step": 3993
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.549891048608088e-06,
      "loss": 0.6881,
      "step": 3994
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.545398661456381e-06,
      "loss": 0.703,
      "step": 3995
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.540906574191273e-06,
      "loss": 0.7107,
      "step": 3996
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.53641478773887e-06,
      "loss": 0.6769,
      "step": 3997
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.531923303025222e-06,
      "loss": 0.6458,
      "step": 3998
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.52743212097631e-06,
      "loss": 0.5614,
      "step": 3999
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.52294124251805e-06,
      "loss": 0.7498,
      "step": 4000
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.518450668576303e-06,
      "loss": 0.6373,
      "step": 4001
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.513960400076865e-06,
      "loss": 0.6968,
      "step": 4002
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.509470437945472e-06,
      "loss": 0.6526,
      "step": 4003
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.504980783107785e-06,
      "loss": 0.6921,
      "step": 4004
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.500491436489413e-06,
      "loss": 0.6782,
      "step": 4005
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.496002399015903e-06,
      "loss": 0.6945,
      "step": 4006
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.491513671612726e-06,
      "loss": 0.8033,
      "step": 4007
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.4870252552053e-06,
      "loss": 0.6407,
      "step": 4008
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.482537150718974e-06,
      "loss": 0.6705,
      "step": 4009
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.478049359079038e-06,
      "loss": 0.6859,
      "step": 4010
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.47356188121071e-06,
      "loss": 0.6889,
      "step": 4011
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.469074718039146e-06,
      "loss": 0.6737,
      "step": 4012
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.464587870489444e-06,
      "loss": 0.7025,
      "step": 4013
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.460101339486624e-06,
      "loss": 0.7098,
      "step": 4014
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.45561512595565e-06,
      "loss": 0.6352,
      "step": 4015
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.451129230821418e-06,
      "loss": 0.7047,
      "step": 4016
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.446643655008761e-06,
      "loss": 0.6771,
      "step": 4017
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.442158399442442e-06,
      "loss": 0.6053,
      "step": 4018
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.437673465047158e-06,
      "loss": 0.5983,
      "step": 4019
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.433188852747544e-06,
      "loss": 0.6969,
      "step": 4020
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.42870456346817e-06,
      "loss": 0.7609,
      "step": 4021
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.424220598133526e-06,
      "loss": 0.5955,
      "step": 4022
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.41973695766805e-06,
      "loss": 0.6915,
      "step": 4023
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.415253642996112e-06,
      "loss": 0.7115,
      "step": 4024
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.410770655042003e-06,
      "loss": 0.6192,
      "step": 4025
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.406287994729954e-06,
      "loss": 0.6467,
      "step": 4026
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.401805662984135e-06,
      "loss": 0.6852,
      "step": 4027
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.397323660728643e-06,
      "loss": 0.6805,
      "step": 4028
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.392841988887499e-06,
      "loss": 0.6892,
      "step": 4029
    },
    {
      "epoch": 0.56,
      "learning_rate": 8.388360648384664e-06,
      "loss": 0.6537,
      "step": 4030
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.383879640144032e-06,
      "loss": 0.7162,
      "step": 4031
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.37939896508943e-06,
      "loss": 0.6597,
      "step": 4032
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.374918624144607e-06,
      "loss": 0.5625,
      "step": 4033
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.370438618233247e-06,
      "loss": 0.654,
      "step": 4034
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.365958948278971e-06,
      "loss": 0.6506,
      "step": 4035
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.361479615205324e-06,
      "loss": 0.629,
      "step": 4036
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.357000619935782e-06,
      "loss": 0.7113,
      "step": 4037
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.352521963393755e-06,
      "loss": 0.6172,
      "step": 4038
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.348043646502588e-06,
      "loss": 0.6523,
      "step": 4039
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.343565670185538e-06,
      "loss": 0.6166,
      "step": 4040
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.339088035365806e-06,
      "loss": 0.596,
      "step": 4041
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.334610742966524e-06,
      "loss": 0.6758,
      "step": 4042
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.330133793910744e-06,
      "loss": 0.6427,
      "step": 4043
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.325657189121457e-06,
      "loss": 0.7028,
      "step": 4044
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.321180929521574e-06,
      "loss": 0.6737,
      "step": 4045
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.316705016033946e-06,
      "loss": 0.7364,
      "step": 4046
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.312229449581337e-06,
      "loss": 0.6567,
      "step": 4047
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.30775423108645e-06,
      "loss": 0.7221,
      "step": 4048
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.303279361471918e-06,
      "loss": 0.659,
      "step": 4049
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.298804841660297e-06,
      "loss": 0.721,
      "step": 4050
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.294330672574072e-06,
      "loss": 0.6539,
      "step": 4051
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.289856855135657e-06,
      "loss": 0.545,
      "step": 4052
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.285383390267397e-06,
      "loss": 0.7269,
      "step": 4053
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.280910278891549e-06,
      "loss": 0.7017,
      "step": 4054
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.276437521930313e-06,
      "loss": 0.6346,
      "step": 4055
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.271965120305815e-06,
      "loss": 0.6534,
      "step": 4056
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.267493074940103e-06,
      "loss": 0.6522,
      "step": 4057
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.263021386755145e-06,
      "loss": 0.6706,
      "step": 4058
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.258550056672851e-06,
      "loss": 0.6914,
      "step": 4059
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.254079085615043e-06,
      "loss": 0.7236,
      "step": 4060
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.249608474503483e-06,
      "loss": 0.6962,
      "step": 4061
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.24513822425984e-06,
      "loss": 0.7194,
      "step": 4062
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.240668335805725e-06,
      "loss": 0.5538,
      "step": 4063
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.23619881006267e-06,
      "loss": 0.6528,
      "step": 4064
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.231729647952126e-06,
      "loss": 0.6722,
      "step": 4065
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.227260850395476e-06,
      "loss": 0.7338,
      "step": 4066
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.222792418314026e-06,
      "loss": 0.7192,
      "step": 4067
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.218324352629013e-06,
      "loss": 0.6307,
      "step": 4068
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.213856654261578e-06,
      "loss": 0.728,
      "step": 4069
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.209389324132808e-06,
      "loss": 0.5812,
      "step": 4070
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.20492236316371e-06,
      "loss": 0.688,
      "step": 4071
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.200455772275202e-06,
      "loss": 0.7057,
      "step": 4072
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.19598955238814e-06,
      "loss": 0.6569,
      "step": 4073
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.191523704423298e-06,
      "loss": 0.5776,
      "step": 4074
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.187058229301377e-06,
      "loss": 0.7126,
      "step": 4075
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.182593127942991e-06,
      "loss": 0.6876,
      "step": 4076
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.178128401268686e-06,
      "loss": 0.5566,
      "step": 4077
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.173664050198929e-06,
      "loss": 0.689,
      "step": 4078
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.16920007565411e-06,
      "loss": 0.6888,
      "step": 4079
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.164736478554538e-06,
      "loss": 0.7202,
      "step": 4080
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.160273259820448e-06,
      "loss": 0.6568,
      "step": 4081
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.155810420372e-06,
      "loss": 0.6614,
      "step": 4082
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.151347961129264e-06,
      "loss": 0.6735,
      "step": 4083
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.14688588301224e-06,
      "loss": 0.7592,
      "step": 4084
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.142424186940852e-06,
      "loss": 0.6154,
      "step": 4085
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.137962873834942e-06,
      "loss": 0.7366,
      "step": 4086
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.133501944614267e-06,
      "loss": 0.6202,
      "step": 4087
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.129041400198516e-06,
      "loss": 0.677,
      "step": 4088
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.124581241507289e-06,
      "loss": 0.5902,
      "step": 4089
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.120121469460114e-06,
      "loss": 0.6875,
      "step": 4090
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.115662084976436e-06,
      "loss": 0.6906,
      "step": 4091
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.111203088975618e-06,
      "loss": 0.5334,
      "step": 4092
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.10674448237695e-06,
      "loss": 0.7012,
      "step": 4093
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.102286266099627e-06,
      "loss": 0.6382,
      "step": 4094
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.09782844106278e-06,
      "loss": 0.6626,
      "step": 4095
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.09337100818545e-06,
      "loss": 0.5774,
      "step": 4096
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.088913968386607e-06,
      "loss": 0.6531,
      "step": 4097
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.084457322585121e-06,
      "loss": 0.6265,
      "step": 4098
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.0800010716998e-06,
      "loss": 0.6897,
      "step": 4099
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.075545216649361e-06,
      "loss": 0.6324,
      "step": 4100
    },
    {
      "epoch": 0.57,
      "learning_rate": 8.071089758352446e-06,
      "loss": 0.5907,
      "step": 4101
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.066634697727603e-06,
      "loss": 0.6221,
      "step": 4102
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.062180035693307e-06,
      "loss": 0.6195,
      "step": 4103
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.057725773167953e-06,
      "loss": 0.68,
      "step": 4104
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.053271911069848e-06,
      "loss": 0.64,
      "step": 4105
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.04881845031722e-06,
      "loss": 0.7135,
      "step": 4106
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.04436539182821e-06,
      "loss": 0.6486,
      "step": 4107
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.039912736520886e-06,
      "loss": 0.6405,
      "step": 4108
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.035460485313216e-06,
      "loss": 0.6452,
      "step": 4109
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.031008639123098e-06,
      "loss": 0.6312,
      "step": 4110
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.026557198868346e-06,
      "loss": 0.6998,
      "step": 4111
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.022106165466684e-06,
      "loss": 0.6813,
      "step": 4112
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.017655539835756e-06,
      "loss": 0.6807,
      "step": 4113
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.013205322893122e-06,
      "loss": 0.6463,
      "step": 4114
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.008755515556262e-06,
      "loss": 0.7272,
      "step": 4115
    },
    {
      "epoch": 0.58,
      "learning_rate": 8.004306118742556e-06,
      "loss": 0.7316,
      "step": 4116
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.999857133369314e-06,
      "loss": 0.7064,
      "step": 4117
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.99540856035376e-06,
      "loss": 0.5996,
      "step": 4118
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.99096040061303e-06,
      "loss": 0.6512,
      "step": 4119
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.986512655064173e-06,
      "loss": 0.6642,
      "step": 4120
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.982065324624153e-06,
      "loss": 0.6788,
      "step": 4121
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.977618410209858e-06,
      "loss": 0.599,
      "step": 4122
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.973171912738071e-06,
      "loss": 0.6442,
      "step": 4123
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.968725833125505e-06,
      "loss": 0.6086,
      "step": 4124
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.964280172288783e-06,
      "loss": 0.6099,
      "step": 4125
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.959834931144443e-06,
      "loss": 0.6244,
      "step": 4126
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.955390110608928e-06,
      "loss": 0.6787,
      "step": 4127
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.950945711598605e-06,
      "loss": 0.7332,
      "step": 4128
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.946501735029749e-06,
      "loss": 0.6631,
      "step": 4129
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.942058181818551e-06,
      "loss": 0.6376,
      "step": 4130
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.937615052881107e-06,
      "loss": 0.5565,
      "step": 4131
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.93317234913343e-06,
      "loss": 0.6089,
      "step": 4132
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.928730071491452e-06,
      "loss": 0.6343,
      "step": 4133
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.924288220871009e-06,
      "loss": 0.6248,
      "step": 4134
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.919846798187846e-06,
      "loss": 0.6068,
      "step": 4135
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.915405804357632e-06,
      "loss": 0.6091,
      "step": 4136
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.910965240295944e-06,
      "loss": 0.6005,
      "step": 4137
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.906525106918255e-06,
      "loss": 0.6624,
      "step": 4138
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.902085405139968e-06,
      "loss": 0.6691,
      "step": 4139
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.897646135876392e-06,
      "loss": 0.6206,
      "step": 4140
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.89320730004274e-06,
      "loss": 0.7074,
      "step": 4141
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.88876889855414e-06,
      "loss": 0.6884,
      "step": 4142
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.884330932325637e-06,
      "loss": 0.5986,
      "step": 4143
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.879893402272182e-06,
      "loss": 0.6372,
      "step": 4144
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.875456309308625e-06,
      "loss": 0.661,
      "step": 4145
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.871019654349742e-06,
      "loss": 0.6215,
      "step": 4146
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.866583438310208e-06,
      "loss": 0.6855,
      "step": 4147
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.86214766210462e-06,
      "loss": 0.6169,
      "step": 4148
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.857712326647465e-06,
      "loss": 0.7605,
      "step": 4149
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.853277432853155e-06,
      "loss": 0.6919,
      "step": 4150
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.848842981636008e-06,
      "loss": 0.6251,
      "step": 4151
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.844408973910245e-06,
      "loss": 0.6435,
      "step": 4152
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.839975410590001e-06,
      "loss": 0.7353,
      "step": 4153
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.835542292589318e-06,
      "loss": 0.7297,
      "step": 4154
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.831109620822148e-06,
      "loss": 0.6809,
      "step": 4155
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.826677396202344e-06,
      "loss": 0.6948,
      "step": 4156
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.822245619643672e-06,
      "loss": 0.6273,
      "step": 4157
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.81781429205981e-06,
      "loss": 0.6487,
      "step": 4158
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.813383414364336e-06,
      "loss": 0.7903,
      "step": 4159
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.808952987470735e-06,
      "loss": 0.6465,
      "step": 4160
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.804523012292407e-06,
      "loss": 0.6935,
      "step": 4161
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.800093489742655e-06,
      "loss": 0.7124,
      "step": 4162
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.79566442073468e-06,
      "loss": 0.715,
      "step": 4163
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.791235806181604e-06,
      "loss": 0.6049,
      "step": 4164
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.786807646996442e-06,
      "loss": 0.6813,
      "step": 4165
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.782379944092131e-06,
      "loss": 0.6868,
      "step": 4166
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.777952698381495e-06,
      "loss": 0.627,
      "step": 4167
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.773525910777278e-06,
      "loss": 0.598,
      "step": 4168
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.769099582192125e-06,
      "loss": 0.6226,
      "step": 4169
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.764673713538588e-06,
      "loss": 0.5511,
      "step": 4170
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.760248305729116e-06,
      "loss": 0.6819,
      "step": 4171
    },
    {
      "epoch": 0.58,
      "learning_rate": 7.755823359676072e-06,
      "loss": 0.6291,
      "step": 4172
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.751398876291725e-06,
      "loss": 0.5525,
      "step": 4173
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.746974856488238e-06,
      "loss": 0.6534,
      "step": 4174
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.74255130117769e-06,
      "loss": 0.6359,
      "step": 4175
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.738128211272056e-06,
      "loss": 0.6325,
      "step": 4176
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.733705587683226e-06,
      "loss": 0.6474,
      "step": 4177
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.729283431322976e-06,
      "loss": 0.6547,
      "step": 4178
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.724861743103e-06,
      "loss": 0.634,
      "step": 4179
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.720440523934895e-06,
      "loss": 0.5962,
      "step": 4180
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.716019774730153e-06,
      "loss": 0.5877,
      "step": 4181
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.711599496400175e-06,
      "loss": 0.6546,
      "step": 4182
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.707179689856266e-06,
      "loss": 0.5882,
      "step": 4183
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.702760356009632e-06,
      "loss": 0.74,
      "step": 4184
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.698341495771378e-06,
      "loss": 0.673,
      "step": 4185
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.693923110052513e-06,
      "loss": 0.6924,
      "step": 4186
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.689505199763952e-06,
      "loss": 0.5462,
      "step": 4187
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.685087765816513e-06,
      "loss": 0.6374,
      "step": 4188
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.680670809120907e-06,
      "loss": 0.5719,
      "step": 4189
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.676254330587751e-06,
      "loss": 0.65,
      "step": 4190
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.671838331127575e-06,
      "loss": 0.6469,
      "step": 4191
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.667422811650786e-06,
      "loss": 0.6343,
      "step": 4192
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.663007773067711e-06,
      "loss": 0.6328,
      "step": 4193
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.658593216288575e-06,
      "loss": 0.7215,
      "step": 4194
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.654179142223501e-06,
      "loss": 0.6997,
      "step": 4195
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.649765551782507e-06,
      "loss": 0.5626,
      "step": 4196
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.645352445875523e-06,
      "loss": 0.6753,
      "step": 4197
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.64093982541237e-06,
      "loss": 0.7015,
      "step": 4198
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.636527691302778e-06,
      "loss": 0.5995,
      "step": 4199
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.632116044456363e-06,
      "loss": 0.6967,
      "step": 4200
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.627704885782649e-06,
      "loss": 0.6357,
      "step": 4201
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.623294216191066e-06,
      "loss": 0.7355,
      "step": 4202
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.618884036590926e-06,
      "loss": 0.5746,
      "step": 4203
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.614474347891454e-06,
      "loss": 0.6361,
      "step": 4204
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.61006515100177e-06,
      "loss": 0.6997,
      "step": 4205
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.605656446830893e-06,
      "loss": 0.6743,
      "step": 4206
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.601248236287738e-06,
      "loss": 0.5922,
      "step": 4207
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.596840520281121e-06,
      "loss": 0.581,
      "step": 4208
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.592433299719757e-06,
      "loss": 0.6401,
      "step": 4209
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.58802657551225e-06,
      "loss": 0.7258,
      "step": 4210
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.583620348567114e-06,
      "loss": 0.6299,
      "step": 4211
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.579214619792753e-06,
      "loss": 0.6653,
      "step": 4212
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.574809390097473e-06,
      "loss": 0.679,
      "step": 4213
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.570404660389467e-06,
      "loss": 0.7093,
      "step": 4214
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.56600043157684e-06,
      "loss": 0.6951,
      "step": 4215
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.561596704567582e-06,
      "loss": 0.6763,
      "step": 4216
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.557193480269589e-06,
      "loss": 0.6012,
      "step": 4217
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.5527907595906394e-06,
      "loss": 0.6151,
      "step": 4218
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.548388543438418e-06,
      "loss": 0.6123,
      "step": 4219
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.543986832720511e-06,
      "loss": 0.6564,
      "step": 4220
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.539585628344385e-06,
      "loss": 0.6609,
      "step": 4221
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.535184931217412e-06,
      "loss": 0.5148,
      "step": 4222
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.530784742246862e-06,
      "loss": 0.7134,
      "step": 4223
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.5263850623398956e-06,
      "loss": 0.6853,
      "step": 4224
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.521985892403562e-06,
      "loss": 0.6702,
      "step": 4225
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.51758723334482e-06,
      "loss": 0.6526,
      "step": 4226
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.5131890860705095e-06,
      "loss": 0.6582,
      "step": 4227
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.508791451487376e-06,
      "loss": 0.6324,
      "step": 4228
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.504394330502051e-06,
      "loss": 0.6533,
      "step": 4229
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.499997724021062e-06,
      "loss": 0.7489,
      "step": 4230
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.495601632950837e-06,
      "loss": 0.7223,
      "step": 4231
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.491206058197684e-06,
      "loss": 0.614,
      "step": 4232
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.486811000667816e-06,
      "loss": 0.6347,
      "step": 4233
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.482416461267339e-06,
      "loss": 0.6199,
      "step": 4234
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.478022440902249e-06,
      "loss": 0.6697,
      "step": 4235
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.47362894047843e-06,
      "loss": 0.6641,
      "step": 4236
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.469235960901669e-06,
      "loss": 0.6241,
      "step": 4237
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.464843503077643e-06,
      "loss": 0.7502,
      "step": 4238
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.4604515679119124e-06,
      "loss": 0.7347,
      "step": 4239
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.456060156309939e-06,
      "loss": 0.6391,
      "step": 4240
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.451669269177077e-06,
      "loss": 0.6317,
      "step": 4241
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.4472789074185695e-06,
      "loss": 0.6221,
      "step": 4242
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.442889071939548e-06,
      "loss": 0.6685,
      "step": 4243
    },
    {
      "epoch": 0.59,
      "learning_rate": 7.438499763645039e-06,
      "loss": 0.6569,
      "step": 4244
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.434110983439965e-06,
      "loss": 0.7404,
      "step": 4245
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.429722732229137e-06,
      "loss": 0.7623,
      "step": 4246
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.425335010917244e-06,
      "loss": 0.7017,
      "step": 4247
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.420947820408885e-06,
      "loss": 0.6078,
      "step": 4248
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.41656116160854e-06,
      "loss": 0.6498,
      "step": 4249
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.412175035420579e-06,
      "loss": 0.6507,
      "step": 4250
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.407789442749265e-06,
      "loss": 0.6337,
      "step": 4251
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.403404384498749e-06,
      "loss": 0.6207,
      "step": 4252
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.399019861573078e-06,
      "loss": 0.6107,
      "step": 4253
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.394635874876175e-06,
      "loss": 0.6832,
      "step": 4254
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.390252425311864e-06,
      "loss": 0.5896,
      "step": 4255
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.385869513783854e-06,
      "loss": 0.6335,
      "step": 4256
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.381487141195749e-06,
      "loss": 0.7184,
      "step": 4257
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.377105308451032e-06,
      "loss": 0.6494,
      "step": 4258
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.372724016453079e-06,
      "loss": 0.648,
      "step": 4259
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.368343266105162e-06,
      "loss": 0.6522,
      "step": 4260
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.363963058310427e-06,
      "loss": 0.6654,
      "step": 4261
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.359583393971919e-06,
      "loss": 0.7448,
      "step": 4262
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.355204273992564e-06,
      "loss": 0.6791,
      "step": 4263
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.35082569927519e-06,
      "loss": 0.6562,
      "step": 4264
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.346447670722489e-06,
      "loss": 0.6402,
      "step": 4265
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.342070189237058e-06,
      "loss": 0.6315,
      "step": 4266
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.337693255721379e-06,
      "loss": 0.5962,
      "step": 4267
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.333316871077818e-06,
      "loss": 0.6204,
      "step": 4268
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.328941036208628e-06,
      "loss": 0.5976,
      "step": 4269
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.324565752015947e-06,
      "loss": 0.6602,
      "step": 4270
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.320191019401806e-06,
      "loss": 0.6696,
      "step": 4271
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.315816839268113e-06,
      "loss": 0.5734,
      "step": 4272
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.311443212516669e-06,
      "loss": 0.5829,
      "step": 4273
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.307070140049158e-06,
      "loss": 0.6069,
      "step": 4274
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.302697622767154e-06,
      "loss": 0.7261,
      "step": 4275
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.29832566157211e-06,
      "loss": 0.6867,
      "step": 4276
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.293954257365368e-06,
      "loss": 0.6477,
      "step": 4277
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.289583411048159e-06,
      "loss": 0.6835,
      "step": 4278
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.285213123521586e-06,
      "loss": 0.7035,
      "step": 4279
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.280843395686652e-06,
      "loss": 0.6254,
      "step": 4280
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.276474228444235e-06,
      "loss": 0.5257,
      "step": 4281
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.272105622695104e-06,
      "loss": 0.6623,
      "step": 4282
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.267737579339904e-06,
      "loss": 0.6594,
      "step": 4283
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.263370099279173e-06,
      "loss": 0.7215,
      "step": 4284
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.259003183413325e-06,
      "loss": 0.6071,
      "step": 4285
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.254636832642667e-06,
      "loss": 0.6273,
      "step": 4286
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.250271047867379e-06,
      "loss": 0.6752,
      "step": 4287
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.245905829987527e-06,
      "loss": 0.6768,
      "step": 4288
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.241541179903071e-06,
      "loss": 0.6378,
      "step": 4289
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.237177098513835e-06,
      "loss": 0.6843,
      "step": 4290
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.232813586719542e-06,
      "loss": 0.5952,
      "step": 4291
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.228450645419791e-06,
      "loss": 0.6087,
      "step": 4292
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.224088275514068e-06,
      "loss": 0.6433,
      "step": 4293
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.2197264779017275e-06,
      "loss": 0.6891,
      "step": 4294
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.21536525348202e-06,
      "loss": 0.5925,
      "step": 4295
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.211004603154074e-06,
      "loss": 0.7517,
      "step": 4296
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.2066445278169015e-06,
      "loss": 0.6827,
      "step": 4297
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.20228502836939e-06,
      "loss": 0.6394,
      "step": 4298
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.197926105710314e-06,
      "loss": 0.6367,
      "step": 4299
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.193567760738328e-06,
      "loss": 0.4896,
      "step": 4300
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.189209994351961e-06,
      "loss": 0.6172,
      "step": 4301
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.184852807449631e-06,
      "loss": 0.6274,
      "step": 4302
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.180496200929636e-06,
      "loss": 0.6162,
      "step": 4303
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.176140175690152e-06,
      "loss": 0.5983,
      "step": 4304
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.17178473262923e-06,
      "loss": 0.6892,
      "step": 4305
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.167429872644809e-06,
      "loss": 0.7076,
      "step": 4306
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.163075596634709e-06,
      "loss": 0.6708,
      "step": 4307
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.158721905496617e-06,
      "loss": 0.5947,
      "step": 4308
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.1543688001281145e-06,
      "loss": 0.6572,
      "step": 4309
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.150016281426652e-06,
      "loss": 0.6081,
      "step": 4310
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.145664350289566e-06,
      "loss": 0.6071,
      "step": 4311
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.141313007614066e-06,
      "loss": 0.632,
      "step": 4312
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.136962254297242e-06,
      "loss": 0.6294,
      "step": 4313
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.132612091236066e-06,
      "loss": 0.6167,
      "step": 4314
    },
    {
      "epoch": 0.6,
      "learning_rate": 7.128262519327387e-06,
      "loss": 0.6477,
      "step": 4315
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.123913539467924e-06,
      "loss": 0.5878,
      "step": 4316
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.119565152554284e-06,
      "loss": 0.6382,
      "step": 4317
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.1152173594829545e-06,
      "loss": 0.6183,
      "step": 4318
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.110870161150283e-06,
      "loss": 0.6207,
      "step": 4319
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.106523558452512e-06,
      "loss": 0.5916,
      "step": 4320
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.102177552285753e-06,
      "loss": 0.7728,
      "step": 4321
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.097832143546004e-06,
      "loss": 0.6268,
      "step": 4322
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.093487333129121e-06,
      "loss": 0.6105,
      "step": 4323
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.089143121930855e-06,
      "loss": 0.6402,
      "step": 4324
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.084799510846823e-06,
      "loss": 0.6385,
      "step": 4325
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.08045650077253e-06,
      "loss": 0.661,
      "step": 4326
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.076114092603337e-06,
      "loss": 0.6426,
      "step": 4327
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.071772287234497e-06,
      "loss": 0.6661,
      "step": 4328
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.067431085561139e-06,
      "loss": 0.6246,
      "step": 4329
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.063090488478257e-06,
      "loss": 0.7294,
      "step": 4330
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.05875049688073e-06,
      "loss": 0.6201,
      "step": 4331
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.054411111663306e-06,
      "loss": 0.7599,
      "step": 4332
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.0500723337206175e-06,
      "loss": 0.7405,
      "step": 4333
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.045734163947155e-06,
      "loss": 0.6967,
      "step": 4334
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.0413966032372985e-06,
      "loss": 0.5965,
      "step": 4335
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.037059652485296e-06,
      "loss": 0.6905,
      "step": 4336
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.032723312585272e-06,
      "loss": 0.67,
      "step": 4337
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.028387584431223e-06,
      "loss": 0.7157,
      "step": 4338
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.024052468917022e-06,
      "loss": 0.7105,
      "step": 4339
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.019717966936418e-06,
      "loss": 0.5693,
      "step": 4340
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.015384079383021e-06,
      "loss": 0.6857,
      "step": 4341
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.011050807150328e-06,
      "loss": 0.5474,
      "step": 4342
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.006718151131704e-06,
      "loss": 0.6861,
      "step": 4343
    },
    {
      "epoch": 0.61,
      "learning_rate": 7.002386112220388e-06,
      "loss": 0.6404,
      "step": 4344
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.998054691309489e-06,
      "loss": 0.6359,
      "step": 4345
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.993723889291992e-06,
      "loss": 0.7032,
      "step": 4346
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.9893937070607565e-06,
      "loss": 0.5851,
      "step": 4347
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.985064145508502e-06,
      "loss": 0.7162,
      "step": 4348
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.980735205527833e-06,
      "loss": 0.6614,
      "step": 4349
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.9764068880112234e-06,
      "loss": 0.5692,
      "step": 4350
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.972079193851018e-06,
      "loss": 0.6252,
      "step": 4351
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.967752123939426e-06,
      "loss": 0.6289,
      "step": 4352
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.963425679168538e-06,
      "loss": 0.674,
      "step": 4353
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.959099860430312e-06,
      "loss": 0.7054,
      "step": 4354
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.954774668616581e-06,
      "loss": 0.7198,
      "step": 4355
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.950450104619033e-06,
      "loss": 0.6694,
      "step": 4356
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.946126169329246e-06,
      "loss": 0.7272,
      "step": 4357
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.9418028636386595e-06,
      "loss": 0.6353,
      "step": 4358
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.937480188438582e-06,
      "loss": 0.5426,
      "step": 4359
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.933158144620193e-06,
      "loss": 0.6475,
      "step": 4360
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.9288367330745455e-06,
      "loss": 0.6226,
      "step": 4361
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.924515954692563e-06,
      "loss": 0.6801,
      "step": 4362
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.920195810365027e-06,
      "loss": 0.6179,
      "step": 4363
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.9158763009826e-06,
      "loss": 0.6403,
      "step": 4364
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.91155742743581e-06,
      "loss": 0.7513,
      "step": 4365
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.907239190615056e-06,
      "loss": 0.7238,
      "step": 4366
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.902921591410597e-06,
      "loss": 0.7454,
      "step": 4367
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.898604630712573e-06,
      "loss": 0.6492,
      "step": 4368
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.894288309410988e-06,
      "loss": 0.6661,
      "step": 4369
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.8899726283957045e-06,
      "loss": 0.694,
      "step": 4370
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.885657588556467e-06,
      "loss": 0.6946,
      "step": 4371
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.8813431907828785e-06,
      "loss": 0.6257,
      "step": 4372
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.8770294359644196e-06,
      "loss": 0.6831,
      "step": 4373
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.872716324990423e-06,
      "loss": 0.7409,
      "step": 4374
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.8684038587501014e-06,
      "loss": 0.6247,
      "step": 4375
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.864092038132536e-06,
      "loss": 0.6178,
      "step": 4376
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.8597808640266595e-06,
      "loss": 0.5485,
      "step": 4377
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.8554703373212865e-06,
      "loss": 0.6024,
      "step": 4378
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.851160458905093e-06,
      "loss": 0.6129,
      "step": 4379
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.846851229666623e-06,
      "loss": 0.7787,
      "step": 4380
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.842542650494279e-06,
      "loss": 0.6176,
      "step": 4381
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.83823472227634e-06,
      "loss": 0.626,
      "step": 4382
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.833927445900945e-06,
      "loss": 0.624,
      "step": 4383
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.829620822256102e-06,
      "loss": 0.6251,
      "step": 4384
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.825314852229679e-06,
      "loss": 0.5796,
      "step": 4385
    },
    {
      "epoch": 0.61,
      "learning_rate": 6.821009536709413e-06,
      "loss": 0.6481,
      "step": 4386
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.816704876582912e-06,
      "loss": 0.6484,
      "step": 4387
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.81240087273763e-06,
      "loss": 0.6386,
      "step": 4388
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.808097526060907e-06,
      "loss": 0.6356,
      "step": 4389
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.803794837439937e-06,
      "loss": 0.6138,
      "step": 4390
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.7994928077617805e-06,
      "loss": 0.67,
      "step": 4391
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.79519143791336e-06,
      "loss": 0.7601,
      "step": 4392
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.790890728781464e-06,
      "loss": 0.7292,
      "step": 4393
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.786590681252745e-06,
      "loss": 0.607,
      "step": 4394
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.7822912962137225e-06,
      "loss": 0.7216,
      "step": 4395
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.777992574550767e-06,
      "loss": 0.6913,
      "step": 4396
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.773694517150124e-06,
      "loss": 0.5595,
      "step": 4397
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.769397124897903e-06,
      "loss": 0.7047,
      "step": 4398
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.7651003986800664e-06,
      "loss": 0.6036,
      "step": 4399
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.7608043393824475e-06,
      "loss": 0.7652,
      "step": 4400
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.756508947890739e-06,
      "loss": 0.5891,
      "step": 4401
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.752214225090501e-06,
      "loss": 0.6393,
      "step": 4402
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.747920171867143e-06,
      "loss": 0.6757,
      "step": 4403
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.743626789105948e-06,
      "loss": 0.5915,
      "step": 4404
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.739334077692061e-06,
      "loss": 0.6575,
      "step": 4405
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.735042038510481e-06,
      "loss": 0.6577,
      "step": 4406
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.730750672446074e-06,
      "loss": 0.6717,
      "step": 4407
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.726459980383564e-06,
      "loss": 0.5877,
      "step": 4408
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.722169963207544e-06,
      "loss": 0.7331,
      "step": 4409
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.7178806218024515e-06,
      "loss": 0.635,
      "step": 4410
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.713591957052601e-06,
      "loss": 0.6719,
      "step": 4411
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.7093039698421606e-06,
      "loss": 0.5975,
      "step": 4412
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.705016661055162e-06,
      "loss": 0.7066,
      "step": 4413
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.700730031575486e-06,
      "loss": 0.6475,
      "step": 4414
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.6964440822868905e-06,
      "loss": 0.6086,
      "step": 4415
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.6921588140729845e-06,
      "loss": 0.6951,
      "step": 4416
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.687874227817231e-06,
      "loss": 0.6698,
      "step": 4417
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.683590324402958e-06,
      "loss": 0.6842,
      "step": 4418
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.679307104713355e-06,
      "loss": 0.6127,
      "step": 4419
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.67502456963147e-06,
      "loss": 0.6948,
      "step": 4420
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.670742720040206e-06,
      "loss": 0.5919,
      "step": 4421
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.6664615568223245e-06,
      "loss": 0.7137,
      "step": 4422
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.662181080860451e-06,
      "loss": 0.6827,
      "step": 4423
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.65790129303707e-06,
      "loss": 0.6727,
      "step": 4424
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.653622194234511e-06,
      "loss": 0.5623,
      "step": 4425
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.649343785334975e-06,
      "loss": 0.6539,
      "step": 4426
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.645066067220518e-06,
      "loss": 0.7011,
      "step": 4427
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.640789040773049e-06,
      "loss": 0.6197,
      "step": 4428
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.636512706874339e-06,
      "loss": 0.7644,
      "step": 4429
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.632237066406014e-06,
      "loss": 0.6746,
      "step": 4430
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.62796212024956e-06,
      "loss": 0.6685,
      "step": 4431
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.623687869286314e-06,
      "loss": 0.713,
      "step": 4432
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.619414314397474e-06,
      "loss": 0.6617,
      "step": 4433
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.615141456464094e-06,
      "loss": 0.6398,
      "step": 4434
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.610869296367088e-06,
      "loss": 0.6665,
      "step": 4435
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.606597834987213e-06,
      "loss": 0.6424,
      "step": 4436
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.602327073205097e-06,
      "loss": 0.6725,
      "step": 4437
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.598057011901223e-06,
      "loss": 0.5765,
      "step": 4438
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.5937876519559144e-06,
      "loss": 0.6461,
      "step": 4439
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.589518994249364e-06,
      "loss": 0.687,
      "step": 4440
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.585251039661617e-06,
      "loss": 0.6876,
      "step": 4441
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.580983789072574e-06,
      "loss": 0.6374,
      "step": 4442
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.576717243361984e-06,
      "loss": 0.5499,
      "step": 4443
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.572451403409458e-06,
      "loss": 0.5816,
      "step": 4444
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.568186270094461e-06,
      "loss": 0.6329,
      "step": 4445
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.563921844296306e-06,
      "loss": 0.6632,
      "step": 4446
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.559658126894169e-06,
      "loss": 0.6767,
      "step": 4447
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.5553951187670724e-06,
      "loss": 0.6905,
      "step": 4448
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.551132820793902e-06,
      "loss": 0.6083,
      "step": 4449
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.5468712338533816e-06,
      "loss": 0.6637,
      "step": 4450
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.5426103588241016e-06,
      "loss": 0.7327,
      "step": 4451
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.538350196584501e-06,
      "loss": 0.63,
      "step": 4452
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.5340907480128755e-06,
      "loss": 0.6905,
      "step": 4453
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.529832013987365e-06,
      "loss": 0.6684,
      "step": 4454
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.525573995385972e-06,
      "loss": 0.6145,
      "step": 4455
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.521316693086548e-06,
      "loss": 0.6806,
      "step": 4456
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.517060107966792e-06,
      "loss": 0.5658,
      "step": 4457
    },
    {
      "epoch": 0.62,
      "learning_rate": 6.512804240904259e-06,
      "loss": 0.668,
      "step": 4458
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.5085490927763584e-06,
      "loss": 0.6648,
      "step": 4459
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.504294664460351e-06,
      "loss": 0.6769,
      "step": 4460
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.500040956833342e-06,
      "loss": 0.6057,
      "step": 4461
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.495787970772296e-06,
      "loss": 0.6294,
      "step": 4462
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.491535707154027e-06,
      "loss": 0.6881,
      "step": 4463
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.487284166855203e-06,
      "loss": 0.6687,
      "step": 4464
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.483033350752328e-06,
      "loss": 0.6107,
      "step": 4465
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.478783259721776e-06,
      "loss": 0.6454,
      "step": 4466
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.474533894639763e-06,
      "loss": 0.5944,
      "step": 4467
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.470285256382351e-06,
      "loss": 0.6274,
      "step": 4468
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.466037345825462e-06,
      "loss": 0.6657,
      "step": 4469
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.461790163844859e-06,
      "loss": 0.7052,
      "step": 4470
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.457543711316163e-06,
      "loss": 0.6757,
      "step": 4471
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.453297989114835e-06,
      "loss": 0.7197,
      "step": 4472
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.449052998116192e-06,
      "loss": 0.7045,
      "step": 4473
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.444808739195401e-06,
      "loss": 0.6115,
      "step": 4474
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.440565213227475e-06,
      "loss": 0.619,
      "step": 4475
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.436322421087274e-06,
      "loss": 0.6921,
      "step": 4476
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.4320803636495115e-06,
      "loss": 0.6005,
      "step": 4477
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.4278390417887505e-06,
      "loss": 0.5271,
      "step": 4478
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.423598456379394e-06,
      "loss": 0.6575,
      "step": 4479
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.419358608295702e-06,
      "loss": 0.5213,
      "step": 4480
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.4151194984117774e-06,
      "loss": 0.6561,
      "step": 4481
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.410881127601576e-06,
      "loss": 0.6591,
      "step": 4482
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.406643496738891e-06,
      "loss": 0.6299,
      "step": 4483
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.402406606697375e-06,
      "loss": 0.6181,
      "step": 4484
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.398170458350527e-06,
      "loss": 0.6077,
      "step": 4485
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.393935052571678e-06,
      "loss": 0.5997,
      "step": 4486
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.389700390234022e-06,
      "loss": 0.6381,
      "step": 4487
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.385466472210595e-06,
      "loss": 0.6892,
      "step": 4488
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.38123329937428e-06,
      "loss": 0.562,
      "step": 4489
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.377000872597802e-06,
      "loss": 0.6804,
      "step": 4490
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.372769192753737e-06,
      "loss": 0.6116,
      "step": 4491
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.3685382607145066e-06,
      "loss": 0.6972,
      "step": 4492
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.364308077352379e-06,
      "loss": 0.5811,
      "step": 4493
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.36007864353946e-06,
      "loss": 0.6186,
      "step": 4494
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.355849960147712e-06,
      "loss": 0.7117,
      "step": 4495
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.35162202804894e-06,
      "loss": 0.5878,
      "step": 4496
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.347394848114783e-06,
      "loss": 0.6265,
      "step": 4497
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.343168421216741e-06,
      "loss": 0.696,
      "step": 4498
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.338942748226149e-06,
      "loss": 0.6436,
      "step": 4499
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.334717830014192e-06,
      "loss": 0.6963,
      "step": 4500
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.330493667451891e-06,
      "loss": 0.6839,
      "step": 4501
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.326270261410123e-06,
      "loss": 0.6427,
      "step": 4502
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.322047612759601e-06,
      "loss": 0.7043,
      "step": 4503
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.317825722370881e-06,
      "loss": 0.6223,
      "step": 4504
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.313604591114365e-06,
      "loss": 0.5999,
      "step": 4505
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.3093842198603014e-06,
      "loss": 0.629,
      "step": 4506
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.30516460947878e-06,
      "loss": 0.5346,
      "step": 4507
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.300945760839731e-06,
      "loss": 0.6729,
      "step": 4508
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.296727674812928e-06,
      "loss": 0.6178,
      "step": 4509
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.292510352267993e-06,
      "loss": 0.6811,
      "step": 4510
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.288293794074388e-06,
      "loss": 0.7647,
      "step": 4511
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.28407800110141e-06,
      "loss": 0.7289,
      "step": 4512
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.2798629742182045e-06,
      "loss": 0.611,
      "step": 4513
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.2756487142937646e-06,
      "loss": 0.6551,
      "step": 4514
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.2714352221969155e-06,
      "loss": 0.5569,
      "step": 4515
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.267222498796327e-06,
      "loss": 0.695,
      "step": 4516
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.2630105449605135e-06,
      "loss": 0.6732,
      "step": 4517
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.258799361557834e-06,
      "loss": 0.7235,
      "step": 4518
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.254588949456473e-06,
      "loss": 0.6411,
      "step": 4519
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.250379309524471e-06,
      "loss": 0.634,
      "step": 4520
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.2461704426297035e-06,
      "loss": 0.5412,
      "step": 4521
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.241962349639892e-06,
      "loss": 0.6426,
      "step": 4522
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.23775503142259e-06,
      "loss": 0.6096,
      "step": 4523
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.233548488845198e-06,
      "loss": 0.7209,
      "step": 4524
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.229342722774956e-06,
      "loss": 0.6054,
      "step": 4525
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.2251377340789365e-06,
      "loss": 0.5428,
      "step": 4526
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.220933523624059e-06,
      "loss": 0.5472,
      "step": 4527
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.216730092277081e-06,
      "loss": 0.7091,
      "step": 4528
    },
    {
      "epoch": 0.63,
      "learning_rate": 6.212527440904603e-06,
      "loss": 0.688,
      "step": 4529
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.208325570373058e-06,
      "loss": 0.6876,
      "step": 4530
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.204124481548718e-06,
      "loss": 0.6754,
      "step": 4531
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.199924175297701e-06,
      "loss": 0.7349,
      "step": 4532
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.195724652485961e-06,
      "loss": 0.5877,
      "step": 4533
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.191525913979284e-06,
      "loss": 0.6328,
      "step": 4534
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.187327960643299e-06,
      "loss": 0.7576,
      "step": 4535
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.183130793343479e-06,
      "loss": 0.5808,
      "step": 4536
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.178934412945124e-06,
      "loss": 0.6659,
      "step": 4537
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.174738820313379e-06,
      "loss": 0.6676,
      "step": 4538
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.1705440163132235e-06,
      "loss": 0.6768,
      "step": 4539
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.166350001809482e-06,
      "loss": 0.6693,
      "step": 4540
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.162156777666799e-06,
      "loss": 0.7005,
      "step": 4541
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.157964344749672e-06,
      "loss": 0.7087,
      "step": 4542
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.153772703922434e-06,
      "loss": 0.6754,
      "step": 4543
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.149581856049245e-06,
      "loss": 0.6943,
      "step": 4544
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.145391801994109e-06,
      "loss": 0.7035,
      "step": 4545
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.1412025426208665e-06,
      "loss": 0.6821,
      "step": 4546
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.137014078793195e-06,
      "loss": 0.6125,
      "step": 4547
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.1328264113746e-06,
      "loss": 0.6659,
      "step": 4548
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.128639541228427e-06,
      "loss": 0.6546,
      "step": 4549
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.124453469217864e-06,
      "loss": 0.6488,
      "step": 4550
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.12026819620593e-06,
      "loss": 0.702,
      "step": 4551
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.116083723055468e-06,
      "loss": 0.5445,
      "step": 4552
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.111900050629176e-06,
      "loss": 0.6932,
      "step": 4553
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.1077171797895784e-06,
      "loss": 0.5705,
      "step": 4554
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.103535111399024e-06,
      "loss": 0.6898,
      "step": 4555
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.0993538463197084e-06,
      "loss": 0.6379,
      "step": 4556
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.095173385413662e-06,
      "loss": 0.5706,
      "step": 4557
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.090993729542747e-06,
      "loss": 0.6407,
      "step": 4558
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.08681487956865e-06,
      "loss": 0.6527,
      "step": 4559
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.082636836352906e-06,
      "loss": 0.573,
      "step": 4560
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.078459600756877e-06,
      "loss": 0.7051,
      "step": 4561
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.074283173641761e-06,
      "loss": 0.6867,
      "step": 4562
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.070107555868583e-06,
      "loss": 0.691,
      "step": 4563
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.065932748298207e-06,
      "loss": 0.6792,
      "step": 4564
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.061758751791333e-06,
      "loss": 0.6435,
      "step": 4565
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.057585567208484e-06,
      "loss": 0.6493,
      "step": 4566
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.053413195410021e-06,
      "loss": 0.6686,
      "step": 4567
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.049241637256138e-06,
      "loss": 0.5987,
      "step": 4568
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.045070893606864e-06,
      "loss": 0.5702,
      "step": 4569
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.040900965322052e-06,
      "loss": 0.6161,
      "step": 4570
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.036731853261393e-06,
      "loss": 0.6682,
      "step": 4571
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.032563558284415e-06,
      "loss": 0.7094,
      "step": 4572
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.0283960812504586e-06,
      "loss": 0.661,
      "step": 4573
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.024229423018715e-06,
      "loss": 0.6245,
      "step": 4574
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.020063584448199e-06,
      "loss": 0.6247,
      "step": 4575
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.015898566397759e-06,
      "loss": 0.6445,
      "step": 4576
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.011734369726067e-06,
      "loss": 0.6045,
      "step": 4577
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.007570995291636e-06,
      "loss": 0.7083,
      "step": 4578
    },
    {
      "epoch": 0.64,
      "learning_rate": 6.0034084439528005e-06,
      "loss": 0.6882,
      "step": 4579
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.999246716567737e-06,
      "loss": 0.598,
      "step": 4580
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.995085813994433e-06,
      "loss": 0.6614,
      "step": 4581
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.990925737090725e-06,
      "loss": 0.6332,
      "step": 4582
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.986766486714268e-06,
      "loss": 0.6315,
      "step": 4583
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.982608063722552e-06,
      "loss": 0.6583,
      "step": 4584
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.978450468972894e-06,
      "loss": 0.6318,
      "step": 4585
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.974293703322441e-06,
      "loss": 0.5739,
      "step": 4586
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.9701377676281725e-06,
      "loss": 0.6996,
      "step": 4587
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.965982662746887e-06,
      "loss": 0.8091,
      "step": 4588
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.96182838953522e-06,
      "loss": 0.6976,
      "step": 4589
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.957674948849634e-06,
      "loss": 0.6882,
      "step": 4590
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.953522341546421e-06,
      "loss": 0.62,
      "step": 4591
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.9493705684816984e-06,
      "loss": 0.6428,
      "step": 4592
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.945219630511412e-06,
      "loss": 0.6215,
      "step": 4593
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.941069528491341e-06,
      "loss": 0.6277,
      "step": 4594
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.936920263277079e-06,
      "loss": 0.681,
      "step": 4595
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.9327718357240605e-06,
      "loss": 0.6704,
      "step": 4596
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.928624246687543e-06,
      "loss": 0.7137,
      "step": 4597
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.924477497022611e-06,
      "loss": 0.6704,
      "step": 4598
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.920331587584172e-06,
      "loss": 0.631,
      "step": 4599
    },
    {
      "epoch": 0.64,
      "learning_rate": 5.916186519226966e-06,
      "loss": 0.6827,
      "step": 4600
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.912042292805562e-06,
      "loss": 0.6031,
      "step": 4601
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.907898909174341e-06,
      "loss": 0.7009,
      "step": 4602
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.903756369187525e-06,
      "loss": 0.6011,
      "step": 4603
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.899614673699157e-06,
      "loss": 0.6788,
      "step": 4604
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.895473823563109e-06,
      "loss": 0.7603,
      "step": 4605
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.89133381963307e-06,
      "loss": 0.7083,
      "step": 4606
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.887194662762563e-06,
      "loss": 0.628,
      "step": 4607
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.8830563538049346e-06,
      "loss": 0.6778,
      "step": 4608
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.878918893613358e-06,
      "loss": 0.65,
      "step": 4609
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.874782283040822e-06,
      "loss": 0.6767,
      "step": 4610
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.870646522940151e-06,
      "loss": 0.6808,
      "step": 4611
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.8665116141639945e-06,
      "loss": 0.645,
      "step": 4612
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.862377557564813e-06,
      "loss": 0.6583,
      "step": 4613
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.858244353994907e-06,
      "loss": 0.721,
      "step": 4614
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.8541120043063925e-06,
      "loss": 0.7239,
      "step": 4615
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.8499805093512165e-06,
      "loss": 0.6396,
      "step": 4616
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.845849869981137e-06,
      "loss": 0.5781,
      "step": 4617
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.841720087047749e-06,
      "loss": 0.5607,
      "step": 4618
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.837591161402466e-06,
      "loss": 0.6045,
      "step": 4619
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.833463093896521e-06,
      "loss": 0.669,
      "step": 4620
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.829335885380976e-06,
      "loss": 0.7082,
      "step": 4621
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.8252095367067105e-06,
      "loss": 0.6999,
      "step": 4622
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.8210840487244366e-06,
      "loss": 0.6571,
      "step": 4623
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.8169594222846725e-06,
      "loss": 0.5711,
      "step": 4624
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.812835658237772e-06,
      "loss": 0.6735,
      "step": 4625
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.808712757433908e-06,
      "loss": 0.7047,
      "step": 4626
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.804590720723079e-06,
      "loss": 0.6051,
      "step": 4627
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.800469548955092e-06,
      "loss": 0.576,
      "step": 4628
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.796349242979589e-06,
      "loss": 0.6778,
      "step": 4629
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.792229803646029e-06,
      "loss": 0.65,
      "step": 4630
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.788111231803697e-06,
      "loss": 0.7093,
      "step": 4631
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.783993528301688e-06,
      "loss": 0.7246,
      "step": 4632
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.779876693988926e-06,
      "loss": 0.6365,
      "step": 4633
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.775760729714155e-06,
      "loss": 0.6959,
      "step": 4634
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.771645636325942e-06,
      "loss": 0.6963,
      "step": 4635
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.767531414672669e-06,
      "loss": 0.6214,
      "step": 4636
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.763418065602541e-06,
      "loss": 0.6849,
      "step": 4637
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.759305589963587e-06,
      "loss": 0.7092,
      "step": 4638
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.755193988603646e-06,
      "loss": 0.6227,
      "step": 4639
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.751083262370384e-06,
      "loss": 0.6874,
      "step": 4640
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.74697341211129e-06,
      "loss": 0.645,
      "step": 4641
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.742864438673661e-06,
      "loss": 0.6341,
      "step": 4642
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.738756342904621e-06,
      "loss": 0.6484,
      "step": 4643
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.7346491256511146e-06,
      "loss": 0.6791,
      "step": 4644
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.730542787759906e-06,
      "loss": 0.6938,
      "step": 4645
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.726437330077567e-06,
      "loss": 0.6488,
      "step": 4646
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.7223327534504995e-06,
      "loss": 0.5801,
      "step": 4647
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.718229058724918e-06,
      "loss": 0.5574,
      "step": 4648
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.714126246746858e-06,
      "loss": 0.6025,
      "step": 4649
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.710024318362175e-06,
      "loss": 0.622,
      "step": 4650
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.705923274416536e-06,
      "loss": 0.6843,
      "step": 4651
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.701823115755433e-06,
      "loss": 0.7363,
      "step": 4652
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.697723843224166e-06,
      "loss": 0.6325,
      "step": 4653
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.693625457667862e-06,
      "loss": 0.6342,
      "step": 4654
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.689527959931458e-06,
      "loss": 0.5341,
      "step": 4655
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.685431350859718e-06,
      "loss": 0.6953,
      "step": 4656
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.681335631297206e-06,
      "loss": 0.5204,
      "step": 4657
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.677240802088318e-06,
      "loss": 0.6562,
      "step": 4658
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.673146864077258e-06,
      "loss": 0.5797,
      "step": 4659
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.669053818108056e-06,
      "loss": 0.685,
      "step": 4660
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.664961665024542e-06,
      "loss": 0.6461,
      "step": 4661
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.660870405670375e-06,
      "loss": 0.5371,
      "step": 4662
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.656780040889027e-06,
      "loss": 0.7043,
      "step": 4663
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.652690571523782e-06,
      "loss": 0.4989,
      "step": 4664
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.648601998417744e-06,
      "loss": 0.5871,
      "step": 4665
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.64451432241383e-06,
      "loss": 0.7322,
      "step": 4666
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.6404275443547766e-06,
      "loss": 0.5803,
      "step": 4667
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.636341665083121e-06,
      "loss": 0.6723,
      "step": 4668
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.6322566854412285e-06,
      "loss": 0.603,
      "step": 4669
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.628172606271281e-06,
      "loss": 0.6044,
      "step": 4670
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.624089428415261e-06,
      "loss": 0.6862,
      "step": 4671
    },
    {
      "epoch": 0.65,
      "learning_rate": 5.620007152714977e-06,
      "loss": 0.6765,
      "step": 4672
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.615925780012047e-06,
      "loss": 0.6302,
      "step": 4673
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.611845311147908e-06,
      "loss": 0.7517,
      "step": 4674
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.607765746963799e-06,
      "loss": 0.5818,
      "step": 4675
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.603687088300783e-06,
      "loss": 0.6342,
      "step": 4676
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.599609335999734e-06,
      "loss": 0.5818,
      "step": 4677
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.5955324909013396e-06,
      "loss": 0.6121,
      "step": 4678
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.5914565538460944e-06,
      "loss": 0.6781,
      "step": 4679
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.587381525674312e-06,
      "loss": 0.6265,
      "step": 4680
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.583307407226117e-06,
      "loss": 0.5454,
      "step": 4681
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.579234199341449e-06,
      "loss": 0.6032,
      "step": 4682
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.575161902860055e-06,
      "loss": 0.6213,
      "step": 4683
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.571090518621496e-06,
      "loss": 0.6108,
      "step": 4684
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.5670200474651505e-06,
      "loss": 0.6256,
      "step": 4685
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.562950490230195e-06,
      "loss": 0.6187,
      "step": 4686
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.5588818477556315e-06,
      "loss": 0.6592,
      "step": 4687
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.554814120880267e-06,
      "loss": 0.6136,
      "step": 4688
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.550747310442724e-06,
      "loss": 0.695,
      "step": 4689
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.5466814172814254e-06,
      "loss": 0.7024,
      "step": 4690
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.542616442234618e-06,
      "loss": 0.6254,
      "step": 4691
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.538552386140356e-06,
      "loss": 0.6602,
      "step": 4692
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.5344892498364946e-06,
      "loss": 0.631,
      "step": 4693
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.530427034160711e-06,
      "loss": 0.6097,
      "step": 4694
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.5263657399504875e-06,
      "loss": 0.61,
      "step": 4695
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.522305368043118e-06,
      "loss": 0.6658,
      "step": 4696
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.518245919275705e-06,
      "loss": 0.5765,
      "step": 4697
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.514187394485162e-06,
      "loss": 0.6473,
      "step": 4698
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.51012979450821e-06,
      "loss": 0.6617,
      "step": 4699
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.506073120181384e-06,
      "loss": 0.627,
      "step": 4700
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.502017372341019e-06,
      "loss": 0.641,
      "step": 4701
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.497962551823266e-06,
      "loss": 0.6407,
      "step": 4702
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.493908659464091e-06,
      "loss": 0.6479,
      "step": 4703
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.4898556960992485e-06,
      "loss": 0.6092,
      "step": 4704
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.485803662564323e-06,
      "loss": 0.6253,
      "step": 4705
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.481752559694695e-06,
      "loss": 0.6463,
      "step": 4706
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.477702388325561e-06,
      "loss": 0.6718,
      "step": 4707
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.473653149291915e-06,
      "loss": 0.562,
      "step": 4708
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.469604843428566e-06,
      "loss": 0.6512,
      "step": 4709
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.465557471570131e-06,
      "loss": 0.6204,
      "step": 4710
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.461511034551032e-06,
      "loss": 0.6592,
      "step": 4711
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.457465533205501e-06,
      "loss": 0.6081,
      "step": 4712
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.453420968367573e-06,
      "loss": 0.6884,
      "step": 4713
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.449377340871098e-06,
      "loss": 0.682,
      "step": 4714
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.4453346515497165e-06,
      "loss": 0.691,
      "step": 4715
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.441292901236892e-06,
      "loss": 0.6621,
      "step": 4716
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.437252090765889e-06,
      "loss": 0.5132,
      "step": 4717
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.433212220969779e-06,
      "loss": 0.6388,
      "step": 4718
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.429173292681433e-06,
      "loss": 0.6013,
      "step": 4719
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.425135306733533e-06,
      "loss": 0.6307,
      "step": 4720
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.421098263958576e-06,
      "loss": 0.6563,
      "step": 4721
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.417062165188844e-06,
      "loss": 0.6655,
      "step": 4722
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.413027011256441e-06,
      "loss": 0.6065,
      "step": 4723
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.408992802993269e-06,
      "loss": 0.716,
      "step": 4724
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.4049595412310405e-06,
      "loss": 0.7199,
      "step": 4725
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.400927226801267e-06,
      "loss": 0.6619,
      "step": 4726
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.396895860535267e-06,
      "loss": 0.6558,
      "step": 4727
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.392865443264164e-06,
      "loss": 0.7103,
      "step": 4728
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.388835975818889e-06,
      "loss": 0.6858,
      "step": 4729
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.384807459030166e-06,
      "loss": 0.611,
      "step": 4730
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.380779893728534e-06,
      "loss": 0.6775,
      "step": 4731
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.376753280744338e-06,
      "loss": 0.6172,
      "step": 4732
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.372727620907712e-06,
      "loss": 0.6399,
      "step": 4733
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.368702915048607e-06,
      "loss": 0.7111,
      "step": 4734
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.364679163996772e-06,
      "loss": 0.6595,
      "step": 4735
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.3606563685817646e-06,
      "loss": 0.6481,
      "step": 4736
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.356634529632933e-06,
      "loss": 0.5984,
      "step": 4737
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.352613647979441e-06,
      "loss": 0.7193,
      "step": 4738
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.348593724450253e-06,
      "loss": 0.6044,
      "step": 4739
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.344574759874124e-06,
      "loss": 0.6194,
      "step": 4740
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.340556755079626e-06,
      "loss": 0.6261,
      "step": 4741
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.336539710895127e-06,
      "loss": 0.6623,
      "step": 4742
    },
    {
      "epoch": 0.66,
      "learning_rate": 5.332523628148798e-06,
      "loss": 0.6625,
      "step": 4743
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.328508507668608e-06,
      "loss": 0.6458,
      "step": 4744
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.324494350282335e-06,
      "loss": 0.6481,
      "step": 4745
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.320481156817552e-06,
      "loss": 0.683,
      "step": 4746
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.31646892810164e-06,
      "loss": 0.586,
      "step": 4747
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.312457664961768e-06,
      "loss": 0.5925,
      "step": 4748
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.308447368224919e-06,
      "loss": 0.6841,
      "step": 4749
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.304438038717876e-06,
      "loss": 0.6892,
      "step": 4750
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.300429677267212e-06,
      "loss": 0.5961,
      "step": 4751
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.296422284699309e-06,
      "loss": 0.6649,
      "step": 4752
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.29241586184035e-06,
      "loss": 0.6194,
      "step": 4753
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.288410409516318e-06,
      "loss": 0.7807,
      "step": 4754
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.284405928552987e-06,
      "loss": 0.657,
      "step": 4755
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.28040241977594e-06,
      "loss": 0.6716,
      "step": 4756
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.2763998840105566e-06,
      "loss": 0.6759,
      "step": 4757
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.2723983220820175e-06,
      "loss": 0.655,
      "step": 4758
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.2683977348152996e-06,
      "loss": 0.6313,
      "step": 4759
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.2643981230351815e-06,
      "loss": 0.6858,
      "step": 4760
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.260399487566243e-06,
      "loss": 0.6531,
      "step": 4761
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.256401829232851e-06,
      "loss": 0.646,
      "step": 4762
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.252405148859186e-06,
      "loss": 0.5485,
      "step": 4763
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.248409447269216e-06,
      "loss": 0.5872,
      "step": 4764
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.244414725286717e-06,
      "loss": 0.625,
      "step": 4765
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.24042098373525e-06,
      "loss": 0.6886,
      "step": 4766
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.236428223438184e-06,
      "loss": 0.7175,
      "step": 4767
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.232436445218688e-06,
      "loss": 0.5906,
      "step": 4768
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.228445649899716e-06,
      "loss": 0.6328,
      "step": 4769
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.224455838304028e-06,
      "loss": 0.6662,
      "step": 4770
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.220467011254182e-06,
      "loss": 0.7172,
      "step": 4771
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.2164791695725325e-06,
      "loss": 0.6032,
      "step": 4772
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.212492314081226e-06,
      "loss": 0.5668,
      "step": 4773
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.2085064456022105e-06,
      "loss": 0.6204,
      "step": 4774
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.20452156495723e-06,
      "loss": 0.6594,
      "step": 4775
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.200537672967827e-06,
      "loss": 0.6776,
      "step": 4776
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.196554770455329e-06,
      "loss": 0.6494,
      "step": 4777
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.192572858240872e-06,
      "loss": 0.6942,
      "step": 4778
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.188591937145386e-06,
      "loss": 0.5718,
      "step": 4779
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.184612007989589e-06,
      "loss": 0.6838,
      "step": 4780
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.1806330715940016e-06,
      "loss": 0.6298,
      "step": 4781
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.1766551287789355e-06,
      "loss": 0.6491,
      "step": 4782
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.1726781803645084e-06,
      "loss": 0.6365,
      "step": 4783
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.168702227170614e-06,
      "loss": 0.5598,
      "step": 4784
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.164727270016955e-06,
      "loss": 0.5963,
      "step": 4785
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.160753309723025e-06,
      "loss": 0.7181,
      "step": 4786
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.1567803471081164e-06,
      "loss": 0.5539,
      "step": 4787
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.152808382991303e-06,
      "loss": 0.6805,
      "step": 4788
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.148837418191464e-06,
      "loss": 0.5909,
      "step": 4789
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.1448674535272755e-06,
      "loss": 0.5836,
      "step": 4790
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.140898489817196e-06,
      "loss": 0.6555,
      "step": 4791
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.1369305278794855e-06,
      "loss": 0.714,
      "step": 4792
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.132963568532194e-06,
      "loss": 0.6684,
      "step": 4793
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.128997612593172e-06,
      "loss": 0.6792,
      "step": 4794
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.125032660880049e-06,
      "loss": 0.5931,
      "step": 4795
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.121068714210258e-06,
      "loss": 0.7008,
      "step": 4796
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.1171057734010245e-06,
      "loss": 0.6151,
      "step": 4797
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.113143839269368e-06,
      "loss": 0.6568,
      "step": 4798
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.109182912632089e-06,
      "loss": 0.669,
      "step": 4799
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.105222994305792e-06,
      "loss": 0.7524,
      "step": 4800
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.101264085106875e-06,
      "loss": 0.684,
      "step": 4801
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.097306185851515e-06,
      "loss": 0.6668,
      "step": 4802
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.093349297355692e-06,
      "loss": 0.6417,
      "step": 4803
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.089393420435176e-06,
      "loss": 0.5904,
      "step": 4804
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.085438555905524e-06,
      "loss": 0.6512,
      "step": 4805
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.0814847045820895e-06,
      "loss": 0.6103,
      "step": 4806
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.0775318672800144e-06,
      "loss": 0.7208,
      "step": 4807
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.073580044814237e-06,
      "loss": 0.6405,
      "step": 4808
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.069629237999469e-06,
      "loss": 0.637,
      "step": 4809
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.065679447650234e-06,
      "loss": 0.68,
      "step": 4810
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.061730674580836e-06,
      "loss": 0.7377,
      "step": 4811
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.0577829196053716e-06,
      "loss": 0.6685,
      "step": 4812
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.0538361835377205e-06,
      "loss": 0.5818,
      "step": 4813
    },
    {
      "epoch": 0.67,
      "learning_rate": 5.0498904671915615e-06,
      "loss": 0.6612,
      "step": 4814
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.04594577138036e-06,
      "loss": 0.6138,
      "step": 4815
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.042002096917373e-06,
      "loss": 0.6595,
      "step": 4816
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.03805944461564e-06,
      "loss": 0.6628,
      "step": 4817
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.034117815287995e-06,
      "loss": 0.6149,
      "step": 4818
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.030177209747062e-06,
      "loss": 0.6519,
      "step": 4819
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.026237628805254e-06,
      "loss": 0.4794,
      "step": 4820
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.022299073274769e-06,
      "loss": 0.6881,
      "step": 4821
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.018361543967596e-06,
      "loss": 0.6696,
      "step": 4822
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.014425041695518e-06,
      "loss": 0.7081,
      "step": 4823
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.0104895672700905e-06,
      "loss": 0.615,
      "step": 4824
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.006555121502672e-06,
      "loss": 0.7131,
      "step": 4825
    },
    {
      "epoch": 0.68,
      "learning_rate": 5.002621705204405e-06,
      "loss": 0.6396,
      "step": 4826
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.998689319186219e-06,
      "loss": 0.6905,
      "step": 4827
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.9947579642588274e-06,
      "loss": 0.6051,
      "step": 4828
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.990827641232737e-06,
      "loss": 0.6317,
      "step": 4829
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.986898350918242e-06,
      "loss": 0.718,
      "step": 4830
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.982970094125416e-06,
      "loss": 0.6144,
      "step": 4831
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.979042871664126e-06,
      "loss": 0.6239,
      "step": 4832
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.975116684344025e-06,
      "loss": 0.668,
      "step": 4833
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.971191532974552e-06,
      "loss": 0.5643,
      "step": 4834
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.9672674183649315e-06,
      "loss": 0.6111,
      "step": 4835
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.9633443413241775e-06,
      "loss": 0.7315,
      "step": 4836
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.95942230266109e-06,
      "loss": 0.6581,
      "step": 4837
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.9555013031842445e-06,
      "loss": 0.5331,
      "step": 4838
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.951581343702014e-06,
      "loss": 0.5821,
      "step": 4839
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.947662425022556e-06,
      "loss": 0.6421,
      "step": 4840
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.943744547953811e-06,
      "loss": 0.601,
      "step": 4841
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.939827713303501e-06,
      "loss": 0.6734,
      "step": 4842
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.935911921879139e-06,
      "loss": 0.6517,
      "step": 4843
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.931997174488018e-06,
      "loss": 0.592,
      "step": 4844
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.928083471937226e-06,
      "loss": 0.5935,
      "step": 4845
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.924170815033619e-06,
      "loss": 0.6426,
      "step": 4846
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.92025920458385e-06,
      "loss": 0.6741,
      "step": 4847
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.916348641394355e-06,
      "loss": 0.547,
      "step": 4848
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.9124391262713474e-06,
      "loss": 0.7104,
      "step": 4849
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.9085306600208314e-06,
      "loss": 0.6417,
      "step": 4850
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.904623243448592e-06,
      "loss": 0.7127,
      "step": 4851
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.900716877360199e-06,
      "loss": 0.5729,
      "step": 4852
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.896811562561005e-06,
      "loss": 0.573,
      "step": 4853
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.892907299856143e-06,
      "loss": 0.65,
      "step": 4854
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.889004090050536e-06,
      "loss": 0.5704,
      "step": 4855
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.885101933948888e-06,
      "loss": 0.6633,
      "step": 4856
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.881200832355675e-06,
      "loss": 0.7167,
      "step": 4857
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.877300786075169e-06,
      "loss": 0.6566,
      "step": 4858
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.873401795911423e-06,
      "loss": 0.6248,
      "step": 4859
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.869503862668261e-06,
      "loss": 0.6371,
      "step": 4860
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.865606987149302e-06,
      "loss": 0.6387,
      "step": 4861
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.86171117015794e-06,
      "loss": 0.6525,
      "step": 4862
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.857816412497358e-06,
      "loss": 0.6609,
      "step": 4863
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.853922714970507e-06,
      "loss": 0.6193,
      "step": 4864
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.8500300783801325e-06,
      "loss": 0.5795,
      "step": 4865
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.846138503528755e-06,
      "loss": 0.5998,
      "step": 4866
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.842247991218678e-06,
      "loss": 0.6704,
      "step": 4867
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.838358542251985e-06,
      "loss": 0.6177,
      "step": 4868
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.834470157430543e-06,
      "loss": 0.7235,
      "step": 4869
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.8305828375559995e-06,
      "loss": 0.6505,
      "step": 4870
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.826696583429773e-06,
      "loss": 0.6122,
      "step": 4871
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.822811395853073e-06,
      "loss": 0.6853,
      "step": 4872
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.818927275626887e-06,
      "loss": 0.7012,
      "step": 4873
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.815044223551983e-06,
      "loss": 0.6263,
      "step": 4874
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.811162240428902e-06,
      "loss": 0.5544,
      "step": 4875
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.807281327057972e-06,
      "loss": 0.6085,
      "step": 4876
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.8034014842393015e-06,
      "loss": 0.6132,
      "step": 4877
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.799522712772767e-06,
      "loss": 0.7723,
      "step": 4878
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.795645013458038e-06,
      "loss": 0.733,
      "step": 4879
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.791768387094555e-06,
      "loss": 0.704,
      "step": 4880
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.78789283448154e-06,
      "loss": 0.6345,
      "step": 4881
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.784018356417992e-06,
      "loss": 0.5986,
      "step": 4882
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.78014495370269e-06,
      "loss": 0.5871,
      "step": 4883
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.776272627134191e-06,
      "loss": 0.7468,
      "step": 4884
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.772401377510833e-06,
      "loss": 0.7088,
      "step": 4885
    },
    {
      "epoch": 0.68,
      "learning_rate": 4.768531205630721e-06,
      "loss": 0.5962,
      "step": 4886
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.76466211229175e-06,
      "loss": 0.5907,
      "step": 4887
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.7607940982915926e-06,
      "loss": 0.5903,
      "step": 4888
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.756927164427685e-06,
      "loss": 0.5971,
      "step": 4889
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.753061311497256e-06,
      "loss": 0.6581,
      "step": 4890
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.7491965402973026e-06,
      "loss": 0.6442,
      "step": 4891
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.74533285162461e-06,
      "loss": 0.658,
      "step": 4892
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.741470246275722e-06,
      "loss": 0.5683,
      "step": 4893
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.737608725046973e-06,
      "loss": 0.5985,
      "step": 4894
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.733748288734471e-06,
      "loss": 0.6571,
      "step": 4895
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.7298889381340986e-06,
      "loss": 0.5908,
      "step": 4896
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.726030674041516e-06,
      "loss": 0.587,
      "step": 4897
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.722173497252159e-06,
      "loss": 0.6586,
      "step": 4898
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.718317408561243e-06,
      "loss": 0.6755,
      "step": 4899
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.714462408763746e-06,
      "loss": 0.6441,
      "step": 4900
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.710608498654435e-06,
      "loss": 0.7006,
      "step": 4901
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.70675567902785e-06,
      "loss": 0.5695,
      "step": 4902
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.702903950678306e-06,
      "loss": 0.6368,
      "step": 4903
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.699053314399883e-06,
      "loss": 0.5904,
      "step": 4904
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.69520377098645e-06,
      "loss": 0.6119,
      "step": 4905
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.691355321231645e-06,
      "loss": 0.594,
      "step": 4906
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.687507965928877e-06,
      "loss": 0.5414,
      "step": 4907
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.683661705871334e-06,
      "loss": 0.6882,
      "step": 4908
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.679816541851977e-06,
      "loss": 0.7735,
      "step": 4909
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.675972474663545e-06,
      "loss": 0.6295,
      "step": 4910
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.672129505098538e-06,
      "loss": 0.602,
      "step": 4911
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.668287633949244e-06,
      "loss": 0.58,
      "step": 4912
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.664446862007718e-06,
      "loss": 0.592,
      "step": 4913
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.660607190065789e-06,
      "loss": 0.6834,
      "step": 4914
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.656768618915059e-06,
      "loss": 0.5719,
      "step": 4915
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.652931149346907e-06,
      "loss": 0.6725,
      "step": 4916
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.649094782152481e-06,
      "loss": 0.7123,
      "step": 4917
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.645259518122698e-06,
      "loss": 0.6374,
      "step": 4918
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.641425358048254e-06,
      "loss": 0.6014,
      "step": 4919
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.637592302719614e-06,
      "loss": 0.5952,
      "step": 4920
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.633760352927024e-06,
      "loss": 0.6467,
      "step": 4921
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.629929509460483e-06,
      "loss": 0.7295,
      "step": 4922
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.62609977310978e-06,
      "loss": 0.672,
      "step": 4923
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.622271144664468e-06,
      "loss": 0.5877,
      "step": 4924
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.618443624913875e-06,
      "loss": 0.6203,
      "step": 4925
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.614617214647095e-06,
      "loss": 0.6782,
      "step": 4926
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.6107919146529956e-06,
      "loss": 0.6443,
      "step": 4927
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.606967725720219e-06,
      "loss": 0.5975,
      "step": 4928
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.603144648637176e-06,
      "loss": 0.5854,
      "step": 4929
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.599322684192046e-06,
      "loss": 0.7177,
      "step": 4930
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.595501833172782e-06,
      "loss": 0.645,
      "step": 4931
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.591682096367111e-06,
      "loss": 0.6453,
      "step": 4932
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.587863474562516e-06,
      "loss": 0.6662,
      "step": 4933
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.5840459685462655e-06,
      "loss": 0.5799,
      "step": 4934
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.580229579105396e-06,
      "loss": 0.6446,
      "step": 4935
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.576414307026702e-06,
      "loss": 0.6341,
      "step": 4936
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.5726001530967575e-06,
      "loss": 0.6686,
      "step": 4937
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.5687871181019085e-06,
      "loss": 0.6232,
      "step": 4938
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.564975202828266e-06,
      "loss": 0.7415,
      "step": 4939
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.561164408061703e-06,
      "loss": 0.5655,
      "step": 4940
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.557354734587874e-06,
      "loss": 0.6754,
      "step": 4941
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.553546183192197e-06,
      "loss": 0.5402,
      "step": 4942
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.549738754659857e-06,
      "loss": 0.7219,
      "step": 4943
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.5459324497758104e-06,
      "loss": 0.6194,
      "step": 4944
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.542127269324779e-06,
      "loss": 0.5614,
      "step": 4945
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.538323214091262e-06,
      "loss": 0.6932,
      "step": 4946
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.534520284859507e-06,
      "loss": 0.606,
      "step": 4947
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.530718482413549e-06,
      "loss": 0.5764,
      "step": 4948
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.52691780753718e-06,
      "loss": 0.6608,
      "step": 4949
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.523118261013969e-06,
      "loss": 0.6485,
      "step": 4950
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.519319843627238e-06,
      "loss": 0.6254,
      "step": 4951
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.515522556160088e-06,
      "loss": 0.5961,
      "step": 4952
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.511726399395383e-06,
      "loss": 0.6639,
      "step": 4953
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.507931374115758e-06,
      "loss": 0.6169,
      "step": 4954
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.504137481103605e-06,
      "loss": 0.665,
      "step": 4955
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.50034472114109e-06,
      "loss": 0.6803,
      "step": 4956
    },
    {
      "epoch": 0.69,
      "learning_rate": 4.496553095010147e-06,
      "loss": 0.6274,
      "step": 4957
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.49276260349247e-06,
      "loss": 0.6197,
      "step": 4958
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.488973247369525e-06,
      "loss": 0.5686,
      "step": 4959
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.485185027422538e-06,
      "loss": 0.6686,
      "step": 4960
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.481397944432512e-06,
      "loss": 0.6677,
      "step": 4961
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.477611999180197e-06,
      "loss": 0.6115,
      "step": 4962
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.473827192446125e-06,
      "loss": 0.5732,
      "step": 4963
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.470043525010586e-06,
      "loss": 0.634,
      "step": 4964
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.466260997653639e-06,
      "loss": 0.6856,
      "step": 4965
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.462479611155099e-06,
      "loss": 0.6453,
      "step": 4966
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.458699366294558e-06,
      "loss": 0.5773,
      "step": 4967
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.454920263851368e-06,
      "loss": 0.5232,
      "step": 4968
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.451142304604637e-06,
      "loss": 0.7466,
      "step": 4969
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.4473654893332495e-06,
      "loss": 0.5855,
      "step": 4970
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.44358981881585e-06,
      "loss": 0.6918,
      "step": 4971
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.439815293830847e-06,
      "loss": 0.6013,
      "step": 4972
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.436041915156407e-06,
      "loss": 0.7124,
      "step": 4973
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.432269683570469e-06,
      "loss": 0.6027,
      "step": 4974
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.428498599850732e-06,
      "loss": 0.6803,
      "step": 4975
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.424728664774655e-06,
      "loss": 0.7064,
      "step": 4976
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.420959879119468e-06,
      "loss": 0.5868,
      "step": 4977
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.417192243662155e-06,
      "loss": 0.6587,
      "step": 4978
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.4134257591794735e-06,
      "loss": 0.7205,
      "step": 4979
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.40966042644793e-06,
      "loss": 0.6916,
      "step": 4980
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.405896246243805e-06,
      "loss": 0.6907,
      "step": 4981
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.4021332193431365e-06,
      "loss": 0.6484,
      "step": 4982
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.398371346521729e-06,
      "loss": 0.6477,
      "step": 4983
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.394610628555138e-06,
      "loss": 0.6346,
      "step": 4984
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.3908510662186945e-06,
      "loss": 0.5801,
      "step": 4985
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.387092660287486e-06,
      "loss": 0.6336,
      "step": 4986
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.383335411536357e-06,
      "loss": 0.6504,
      "step": 4987
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.379579320739919e-06,
      "loss": 0.6533,
      "step": 4988
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.375824388672541e-06,
      "loss": 0.6936,
      "step": 4989
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.372070616108359e-06,
      "loss": 0.5815,
      "step": 4990
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.368318003821266e-06,
      "loss": 0.6633,
      "step": 4991
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.364566552584914e-06,
      "loss": 0.6988,
      "step": 4992
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.360816263172717e-06,
      "loss": 0.6632,
      "step": 4993
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.3570671363578566e-06,
      "loss": 0.6314,
      "step": 4994
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.353319172913258e-06,
      "loss": 0.5143,
      "step": 4995
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.349572373611623e-06,
      "loss": 0.6063,
      "step": 4996
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.34582673922541e-06,
      "loss": 0.6772,
      "step": 4997
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.342082270526827e-06,
      "loss": 0.6253,
      "step": 4998
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.338338968287853e-06,
      "loss": 0.6287,
      "step": 4999
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.334596833280221e-06,
      "loss": 0.6051,
      "step": 5000
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.33085586627543e-06,
      "loss": 0.6907,
      "step": 5001
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.327116068044726e-06,
      "loss": 0.587,
      "step": 5002
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.323377439359123e-06,
      "loss": 0.6495,
      "step": 5003
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.319639980989395e-06,
      "loss": 0.6274,
      "step": 5004
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.315903693706071e-06,
      "loss": 0.6562,
      "step": 5005
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.312168578279436e-06,
      "loss": 0.66,
      "step": 5006
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.308434635479542e-06,
      "loss": 0.638,
      "step": 5007
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.304701866076194e-06,
      "loss": 0.6434,
      "step": 5008
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.30097027083895e-06,
      "loss": 0.6614,
      "step": 5009
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.297239850537133e-06,
      "loss": 0.71,
      "step": 5010
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.293510605939823e-06,
      "loss": 0.5522,
      "step": 5011
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.2897825378158575e-06,
      "loss": 0.6308,
      "step": 5012
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.2860556469338265e-06,
      "loss": 0.7355,
      "step": 5013
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.282329934062084e-06,
      "loss": 0.6677,
      "step": 5014
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.27860539996874e-06,
      "loss": 0.5893,
      "step": 5015
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.274882045421654e-06,
      "loss": 0.7247,
      "step": 5016
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.271159871188453e-06,
      "loss": 0.7016,
      "step": 5017
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.267438878036513e-06,
      "loss": 0.6665,
      "step": 5018
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.2637190667329705e-06,
      "loss": 0.6394,
      "step": 5019
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.260000438044718e-06,
      "loss": 0.6892,
      "step": 5020
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.256282992738403e-06,
      "loss": 0.6556,
      "step": 5021
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.252566731580428e-06,
      "loss": 0.6706,
      "step": 5022
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.248851655336957e-06,
      "loss": 0.6222,
      "step": 5023
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.245137764773899e-06,
      "loss": 0.5884,
      "step": 5024
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.241425060656927e-06,
      "loss": 0.5659,
      "step": 5025
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.237713543751473e-06,
      "loss": 0.6771,
      "step": 5026
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.234003214822708e-06,
      "loss": 0.6773,
      "step": 5027
    },
    {
      "epoch": 0.7,
      "learning_rate": 4.2302940746355765e-06,
      "loss": 0.7105,
      "step": 5028
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.226586123954768e-06,
      "loss": 0.7459,
      "step": 5029
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.222879363544733e-06,
      "loss": 0.4736,
      "step": 5030
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.219173794169664e-06,
      "loss": 0.6268,
      "step": 5031
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.215469416593522e-06,
      "loss": 0.6612,
      "step": 5032
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.211766231580018e-06,
      "loss": 0.6963,
      "step": 5033
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.208064239892611e-06,
      "loss": 0.5707,
      "step": 5034
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.20436344229452e-06,
      "loss": 0.65,
      "step": 5035
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.20066383954872e-06,
      "loss": 0.5845,
      "step": 5036
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.1969654324179334e-06,
      "loss": 0.6044,
      "step": 5037
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.19326822166464e-06,
      "loss": 0.6968,
      "step": 5038
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.1895722080510715e-06,
      "loss": 0.6784,
      "step": 5039
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.185877392339215e-06,
      "loss": 0.6429,
      "step": 5040
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.18218377529081e-06,
      "loss": 0.584,
      "step": 5041
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.178491357667342e-06,
      "loss": 0.638,
      "step": 5042
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.1748001402300596e-06,
      "loss": 0.7196,
      "step": 5043
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.171110123739962e-06,
      "loss": 0.6232,
      "step": 5044
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.167421308957791e-06,
      "loss": 0.748,
      "step": 5045
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.16373369664405e-06,
      "loss": 0.6044,
      "step": 5046
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.160047287558994e-06,
      "loss": 0.6182,
      "step": 5047
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.1563620824626325e-06,
      "loss": 0.6086,
      "step": 5048
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.152678082114714e-06,
      "loss": 0.5795,
      "step": 5049
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.148995287274751e-06,
      "loss": 0.7199,
      "step": 5050
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.145313698702003e-06,
      "loss": 0.7061,
      "step": 5051
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.141633317155484e-06,
      "loss": 0.596,
      "step": 5052
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.137954143393954e-06,
      "loss": 0.5968,
      "step": 5053
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.134276178175926e-06,
      "loss": 0.6039,
      "step": 5054
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.130599422259672e-06,
      "loss": 0.6922,
      "step": 5055
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.126923876403196e-06,
      "loss": 0.7473,
      "step": 5056
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.123249541364269e-06,
      "loss": 0.6697,
      "step": 5057
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.119576417900407e-06,
      "loss": 0.6301,
      "step": 5058
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.11590450676888e-06,
      "loss": 0.6174,
      "step": 5059
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.112233808726697e-06,
      "loss": 0.6668,
      "step": 5060
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.108564324530626e-06,
      "loss": 0.6774,
      "step": 5061
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.104896054937185e-06,
      "loss": 0.6564,
      "step": 5062
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.1012290007026434e-06,
      "loss": 0.5526,
      "step": 5063
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.097563162583008e-06,
      "loss": 0.5849,
      "step": 5064
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.093898541334047e-06,
      "loss": 0.6025,
      "step": 5065
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.090235137711274e-06,
      "loss": 0.6523,
      "step": 5066
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.08657295246995e-06,
      "loss": 0.528,
      "step": 5067
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.082911986365088e-06,
      "loss": 0.6033,
      "step": 5068
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.079252240151448e-06,
      "loss": 0.6899,
      "step": 5069
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.07559371458354e-06,
      "loss": 0.6582,
      "step": 5070
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.071936410415614e-06,
      "loss": 0.8079,
      "step": 5071
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.06828032840168e-06,
      "loss": 0.6085,
      "step": 5072
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.064625469295494e-06,
      "loss": 0.666,
      "step": 5073
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.0609718338505485e-06,
      "loss": 0.6604,
      "step": 5074
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.057319422820096e-06,
      "loss": 0.6382,
      "step": 5075
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.053668236957135e-06,
      "loss": 0.6429,
      "step": 5076
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.050018277014408e-06,
      "loss": 0.5786,
      "step": 5077
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.0463695437444014e-06,
      "loss": 0.7068,
      "step": 5078
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.042722037899357e-06,
      "loss": 0.5868,
      "step": 5079
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.039075760231259e-06,
      "loss": 0.6128,
      "step": 5080
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.035430711491842e-06,
      "loss": 0.7287,
      "step": 5081
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.0317868924325784e-06,
      "loss": 0.6408,
      "step": 5082
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.028144303804692e-06,
      "loss": 0.6313,
      "step": 5083
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.0245029463591645e-06,
      "loss": 0.6976,
      "step": 5084
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.020862820846703e-06,
      "loss": 0.6701,
      "step": 5085
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.017223928017774e-06,
      "loss": 0.5737,
      "step": 5086
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.013586268622586e-06,
      "loss": 0.7526,
      "step": 5087
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.009949843411098e-06,
      "loss": 0.585,
      "step": 5088
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.006314653133004e-06,
      "loss": 0.5716,
      "step": 5089
    },
    {
      "epoch": 0.71,
      "learning_rate": 4.002680698537752e-06,
      "loss": 0.6236,
      "step": 5090
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.999047980374534e-06,
      "loss": 0.6534,
      "step": 5091
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.9954164993922895e-06,
      "loss": 0.6183,
      "step": 5092
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.991786256339692e-06,
      "loss": 0.6415,
      "step": 5093
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.988157251965172e-06,
      "loss": 0.5508,
      "step": 5094
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.984529487016903e-06,
      "loss": 0.5714,
      "step": 5095
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.980902962242792e-06,
      "loss": 0.709,
      "step": 5096
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.977277678390502e-06,
      "loss": 0.6015,
      "step": 5097
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.973653636207437e-06,
      "loss": 0.5848,
      "step": 5098
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.970030836440745e-06,
      "loss": 0.635,
      "step": 5099
    },
    {
      "epoch": 0.71,
      "learning_rate": 3.966409279837317e-06,
      "loss": 0.5729,
      "step": 5100
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.962788967143787e-06,
      "loss": 0.6375,
      "step": 5101
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.959169899106538e-06,
      "loss": 0.6089,
      "step": 5102
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.955552076471684e-06,
      "loss": 0.7076,
      "step": 5103
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.951935499985095e-06,
      "loss": 0.6328,
      "step": 5104
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.948320170392378e-06,
      "loss": 0.6686,
      "step": 5105
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.94470608843889e-06,
      "loss": 0.5892,
      "step": 5106
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.9410932548697145e-06,
      "loss": 0.6845,
      "step": 5107
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.9374816704296945e-06,
      "loss": 0.6821,
      "step": 5108
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.933871335863408e-06,
      "loss": 0.6338,
      "step": 5109
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.930262251915181e-06,
      "loss": 0.6537,
      "step": 5110
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.926654419329069e-06,
      "loss": 0.6234,
      "step": 5111
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.923047838848882e-06,
      "loss": 0.5622,
      "step": 5112
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.919442511218166e-06,
      "loss": 0.6283,
      "step": 5113
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.915838437180211e-06,
      "loss": 0.5962,
      "step": 5114
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.912235617478046e-06,
      "loss": 0.5595,
      "step": 5115
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.9086340528544475e-06,
      "loss": 0.6111,
      "step": 5116
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.905033744051929e-06,
      "loss": 0.5499,
      "step": 5117
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.9014346918127385e-06,
      "loss": 0.6079,
      "step": 5118
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.897836896878875e-06,
      "loss": 0.573,
      "step": 5119
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.894240359992075e-06,
      "loss": 0.5315,
      "step": 5120
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.890645081893819e-06,
      "loss": 0.5951,
      "step": 5121
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.887051063325318e-06,
      "loss": 0.5705,
      "step": 5122
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.883458305027531e-06,
      "loss": 0.6707,
      "step": 5123
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.879866807741161e-06,
      "loss": 0.5827,
      "step": 5124
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.8762765722066385e-06,
      "loss": 0.674,
      "step": 5125
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.872687599164145e-06,
      "loss": 0.5962,
      "step": 5126
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.869099889353597e-06,
      "loss": 0.7027,
      "step": 5127
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.865513443514652e-06,
      "loss": 0.6572,
      "step": 5128
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.8619282623867074e-06,
      "loss": 0.634,
      "step": 5129
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.858344346708898e-06,
      "loss": 0.5637,
      "step": 5130
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.854761697220102e-06,
      "loss": 0.5959,
      "step": 5131
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.8511803146589264e-06,
      "loss": 0.6069,
      "step": 5132
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.847600199763727e-06,
      "loss": 0.5962,
      "step": 5133
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.844021353272595e-06,
      "loss": 0.6253,
      "step": 5134
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.840443775923365e-06,
      "loss": 0.6237,
      "step": 5135
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.836867468453597e-06,
      "loss": 0.5764,
      "step": 5136
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.833292431600599e-06,
      "loss": 0.6638,
      "step": 5137
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.829718666101418e-06,
      "loss": 0.6499,
      "step": 5138
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.82614617269284e-06,
      "loss": 0.6302,
      "step": 5139
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.822574952111375e-06,
      "loss": 0.6031,
      "step": 5140
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.819005005093286e-06,
      "loss": 0.6421,
      "step": 5141
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.815436332374572e-06,
      "loss": 0.6044,
      "step": 5142
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.8118689346909566e-06,
      "loss": 0.6365,
      "step": 5143
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.8083028127779143e-06,
      "loss": 0.5974,
      "step": 5144
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.804737967370651e-06,
      "loss": 0.6112,
      "step": 5145
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.8011743992041084e-06,
      "loss": 0.5058,
      "step": 5146
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.797612109012968e-06,
      "loss": 0.6565,
      "step": 5147
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7940510975316468e-06,
      "loss": 0.6445,
      "step": 5148
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7904913654942953e-06,
      "loss": 0.6755,
      "step": 5149
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.786932913634809e-06,
      "loss": 0.518,
      "step": 5150
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7833757426868022e-06,
      "loss": 0.5519,
      "step": 5151
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.779819853383643e-06,
      "loss": 0.5867,
      "step": 5152
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7762652464584304e-06,
      "loss": 0.6523,
      "step": 5153
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.772711922643989e-06,
      "loss": 0.657,
      "step": 5154
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7691598826728904e-06,
      "loss": 0.6553,
      "step": 5155
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7656091272774386e-06,
      "loss": 0.6043,
      "step": 5156
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.762059657189674e-06,
      "loss": 0.7334,
      "step": 5157
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7585114731413652e-06,
      "loss": 0.6586,
      "step": 5158
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.754964575864022e-06,
      "loss": 0.6386,
      "step": 5159
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.751418966088889e-06,
      "loss": 0.6273,
      "step": 5160
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7478746445469415e-06,
      "loss": 0.7084,
      "step": 5161
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7443316119688933e-06,
      "loss": 0.577,
      "step": 5162
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7407898690851897e-06,
      "loss": 0.5878,
      "step": 5163
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.737249416626014e-06,
      "loss": 0.7052,
      "step": 5164
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7337102553212758e-06,
      "loss": 0.641,
      "step": 5165
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7301723859006234e-06,
      "loss": 0.5649,
      "step": 5166
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7266358090934407e-06,
      "loss": 0.6546,
      "step": 5167
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7231005256288467e-06,
      "loss": 0.7054,
      "step": 5168
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7195665362356815e-06,
      "loss": 0.5603,
      "step": 5169
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7160338416425303e-06,
      "loss": 0.6934,
      "step": 5170
    },
    {
      "epoch": 0.72,
      "learning_rate": 3.7125024425777135e-06,
      "loss": 0.611,
      "step": 5171
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.70897233976927e-06,
      "loss": 0.666,
      "step": 5172
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.7054435339449847e-06,
      "loss": 0.6065,
      "step": 5173
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.7019160258323696e-06,
      "loss": 0.6274,
      "step": 5174
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6983898161586717e-06,
      "loss": 0.5201,
      "step": 5175
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.694864905650869e-06,
      "loss": 0.7048,
      "step": 5176
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.69134129503567e-06,
      "loss": 0.5882,
      "step": 5177
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6878189850395186e-06,
      "loss": 0.5423,
      "step": 5178
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.68429797638859e-06,
      "loss": 0.6297,
      "step": 5179
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6807782698087846e-06,
      "loss": 0.6136,
      "step": 5180
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.677259866025743e-06,
      "loss": 0.5799,
      "step": 5181
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6737427657648374e-06,
      "loss": 0.6309,
      "step": 5182
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6702269697511593e-06,
      "loss": 0.6664,
      "step": 5183
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6667124787095444e-06,
      "loss": 0.6626,
      "step": 5184
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6631992933645543e-06,
      "loss": 0.7108,
      "step": 5185
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.659687414440486e-06,
      "loss": 0.6991,
      "step": 5186
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6561768426613543e-06,
      "loss": 0.5457,
      "step": 5187
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.652667578750918e-06,
      "loss": 0.6733,
      "step": 5188
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6491596234326597e-06,
      "loss": 0.666,
      "step": 5189
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6456529774297965e-06,
      "loss": 0.6883,
      "step": 5190
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.642147641465271e-06,
      "loss": 0.5797,
      "step": 5191
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.638643616261759e-06,
      "loss": 0.5681,
      "step": 5192
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6351409025416675e-06,
      "loss": 0.5859,
      "step": 5193
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.631639501027122e-06,
      "loss": 0.5851,
      "step": 5194
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.628139412439993e-06,
      "loss": 0.6344,
      "step": 5195
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.624640637501868e-06,
      "loss": 0.6156,
      "step": 5196
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6211431769340777e-06,
      "loss": 0.6219,
      "step": 5197
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.617647031457663e-06,
      "loss": 0.5683,
      "step": 5198
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.614152201793407e-06,
      "loss": 0.5778,
      "step": 5199
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6106586886618233e-06,
      "loss": 0.6646,
      "step": 5200
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.6071664927831408e-06,
      "loss": 0.5692,
      "step": 5201
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.603675614877329e-06,
      "loss": 0.6166,
      "step": 5202
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.60018605566408e-06,
      "loss": 0.5669,
      "step": 5203
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5966978158628217e-06,
      "loss": 0.6661,
      "step": 5204
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.593210896192696e-06,
      "loss": 0.6805,
      "step": 5205
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5897252973725826e-06,
      "loss": 0.6614,
      "step": 5206
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5862410201210895e-06,
      "loss": 0.6381,
      "step": 5207
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5827580651565487e-06,
      "loss": 0.6342,
      "step": 5208
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5792764331970187e-06,
      "loss": 0.6363,
      "step": 5209
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.575796124960289e-06,
      "loss": 0.6744,
      "step": 5210
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.572317141163878e-06,
      "loss": 0.6785,
      "step": 5211
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5688394825250193e-06,
      "loss": 0.5808,
      "step": 5212
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5653631497606854e-06,
      "loss": 0.516,
      "step": 5213
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.561888143587572e-06,
      "loss": 0.7196,
      "step": 5214
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.558414464722102e-06,
      "loss": 0.6882,
      "step": 5215
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5549421138804173e-06,
      "loss": 0.5999,
      "step": 5216
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5514710917783967e-06,
      "loss": 0.5884,
      "step": 5217
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5480013991316398e-06,
      "loss": 0.6102,
      "step": 5218
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5445330366554765e-06,
      "loss": 0.5733,
      "step": 5219
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.54106600506495e-06,
      "loss": 0.6868,
      "step": 5220
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.537600305074843e-06,
      "loss": 0.6752,
      "step": 5221
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5341359373996585e-06,
      "loss": 0.6716,
      "step": 5222
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5306729027536235e-06,
      "loss": 0.6278,
      "step": 5223
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.527211201850693e-06,
      "loss": 0.6154,
      "step": 5224
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5237508354045447e-06,
      "loss": 0.6429,
      "step": 5225
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.520291804128585e-06,
      "loss": 0.5987,
      "step": 5226
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5168341087359357e-06,
      "loss": 0.5875,
      "step": 5227
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5133777499394537e-06,
      "loss": 0.6411,
      "step": 5228
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5099227284517145e-06,
      "loss": 0.6048,
      "step": 5229
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5064690449850245e-06,
      "loss": 0.6052,
      "step": 5230
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.5030167002514017e-06,
      "loss": 0.6297,
      "step": 5231
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.499565694962599e-06,
      "loss": 0.6646,
      "step": 5232
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.4961160298300934e-06,
      "loss": 0.7102,
      "step": 5233
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.492667705565075e-06,
      "loss": 0.6713,
      "step": 5234
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.4892207228784693e-06,
      "loss": 0.5421,
      "step": 5235
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.485775082480919e-06,
      "loss": 0.6755,
      "step": 5236
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.4823307850827914e-06,
      "loss": 0.7339,
      "step": 5237
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.4788878313941776e-06,
      "loss": 0.6732,
      "step": 5238
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.475446222124892e-06,
      "loss": 0.6809,
      "step": 5239
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.4720059579844724e-06,
      "loss": 0.7366,
      "step": 5240
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.4685670396821725e-06,
      "loss": 0.5156,
      "step": 5241
    },
    {
      "epoch": 0.73,
      "learning_rate": 3.4651294679269763e-06,
      "loss": 0.5575,
      "step": 5242
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4616932434275894e-06,
      "loss": 0.5732,
      "step": 5243
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4582583668924385e-06,
      "loss": 0.6282,
      "step": 5244
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.454824839029668e-06,
      "loss": 0.5252,
      "step": 5245
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4513926605471504e-06,
      "loss": 0.6577,
      "step": 5246
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4479618321524764e-06,
      "loss": 0.6622,
      "step": 5247
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.444532354552965e-06,
      "loss": 0.654,
      "step": 5248
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.441104228455645e-06,
      "loss": 0.6122,
      "step": 5249
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4376774545672744e-06,
      "loss": 0.6322,
      "step": 5250
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.434252033594332e-06,
      "loss": 0.6816,
      "step": 5251
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4308279662430166e-06,
      "loss": 0.6466,
      "step": 5252
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.427405253219248e-06,
      "loss": 0.6825,
      "step": 5253
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4239838952286674e-06,
      "loss": 0.518,
      "step": 5254
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.420563892976638e-06,
      "loss": 0.5589,
      "step": 5255
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4171452471682366e-06,
      "loss": 0.6207,
      "step": 5256
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4137279585082672e-06,
      "loss": 0.7148,
      "step": 5257
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4103120277012534e-06,
      "loss": 0.6842,
      "step": 5258
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.406897455451439e-06,
      "loss": 0.6953,
      "step": 5259
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.403484242462781e-06,
      "loss": 0.5733,
      "step": 5260
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.4000723894389655e-06,
      "loss": 0.7005,
      "step": 5261
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3966618970833965e-06,
      "loss": 0.5765,
      "step": 5262
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3932527660991877e-06,
      "loss": 0.5757,
      "step": 5263
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3898449971891833e-06,
      "loss": 0.653,
      "step": 5264
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.386438591055945e-06,
      "loss": 0.7072,
      "step": 5265
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3830335484017517e-06,
      "loss": 0.6096,
      "step": 5266
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3796298699285968e-06,
      "loss": 0.6814,
      "step": 5267
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3762275563381986e-06,
      "loss": 0.6319,
      "step": 5268
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3728266083319925e-06,
      "loss": 0.5829,
      "step": 5269
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3694270266111316e-06,
      "loss": 0.6674,
      "step": 5270
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3660288118764894e-06,
      "loss": 0.6578,
      "step": 5271
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3626319648286533e-06,
      "loss": 0.7119,
      "step": 5272
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.359236486167936e-06,
      "loss": 0.6588,
      "step": 5273
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.355842376594357e-06,
      "loss": 0.691,
      "step": 5274
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.352449636807662e-06,
      "loss": 0.6609,
      "step": 5275
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3490582675073136e-06,
      "loss": 0.5679,
      "step": 5276
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3456682693924926e-06,
      "loss": 0.7034,
      "step": 5277
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3422796431620883e-06,
      "loss": 0.6589,
      "step": 5278
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3388923895147184e-06,
      "loss": 0.7608,
      "step": 5279
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.335506509148716e-06,
      "loss": 0.6555,
      "step": 5280
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3321220027621202e-06,
      "loss": 0.621,
      "step": 5281
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.328738871052699e-06,
      "loss": 0.5791,
      "step": 5282
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3253571147179333e-06,
      "loss": 0.5594,
      "step": 5283
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.321976734455019e-06,
      "loss": 0.6168,
      "step": 5284
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.31859773096087e-06,
      "loss": 0.6606,
      "step": 5285
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3152201049321154e-06,
      "loss": 0.7001,
      "step": 5286
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.311843857065099e-06,
      "loss": 0.6085,
      "step": 5287
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.308468988055887e-06,
      "loss": 0.6701,
      "step": 5288
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.3050954986002502e-06,
      "loss": 0.6289,
      "step": 5289
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.301723389393683e-06,
      "loss": 0.7028,
      "step": 5290
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2983526611313966e-06,
      "loss": 0.603,
      "step": 5291
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2949833145083075e-06,
      "loss": 0.6863,
      "step": 5292
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2916153502190583e-06,
      "loss": 0.6586,
      "step": 5293
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2882487689580023e-06,
      "loss": 0.5719,
      "step": 5294
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2848835714192105e-06,
      "loss": 0.5871,
      "step": 5295
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2815197582964587e-06,
      "loss": 0.6139,
      "step": 5296
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2781573302832493e-06,
      "loss": 0.661,
      "step": 5297
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2747962880727936e-06,
      "loss": 0.6287,
      "step": 5298
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.271436632358017e-06,
      "loss": 0.6908,
      "step": 5299
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2680783638315615e-06,
      "loss": 0.6686,
      "step": 5300
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.264721483185781e-06,
      "loss": 0.5966,
      "step": 5301
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.261365991112747e-06,
      "loss": 0.56,
      "step": 5302
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2580118883042342e-06,
      "loss": 0.6601,
      "step": 5303
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.254659175451743e-06,
      "loss": 0.6153,
      "step": 5304
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2513078532464816e-06,
      "loss": 0.6487,
      "step": 5305
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2479579223793756e-06,
      "loss": 0.5805,
      "step": 5306
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2446093835410542e-06,
      "loss": 0.5836,
      "step": 5307
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2412622374218685e-06,
      "loss": 0.5874,
      "step": 5308
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.237916484711885e-06,
      "loss": 0.5986,
      "step": 5309
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.23457212610087e-06,
      "loss": 0.6588,
      "step": 5310
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.231229162278313e-06,
      "loss": 0.6201,
      "step": 5311
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.227887593933414e-06,
      "loss": 0.6757,
      "step": 5312
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.2245474217550885e-06,
      "loss": 0.5593,
      "step": 5313
    },
    {
      "epoch": 0.74,
      "learning_rate": 3.221208646431949e-06,
      "loss": 0.661,
      "step": 5314
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.2178712686523417e-06,
      "loss": 0.6303,
      "step": 5315
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.2145352891043103e-06,
      "loss": 0.6255,
      "step": 5316
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.211200708475618e-06,
      "loss": 0.6195,
      "step": 5317
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.2078675274537287e-06,
      "loss": 0.6304,
      "step": 5318
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.2045357467258287e-06,
      "loss": 0.6962,
      "step": 5319
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.2012053669788136e-06,
      "loss": 0.6796,
      "step": 5320
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1978763888992824e-06,
      "loss": 0.6466,
      "step": 5321
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1945488131735537e-06,
      "loss": 0.5332,
      "step": 5322
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1912226404876555e-06,
      "loss": 0.6399,
      "step": 5323
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1878978715273267e-06,
      "loss": 0.5971,
      "step": 5324
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.184574506978011e-06,
      "loss": 0.5325,
      "step": 5325
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.181252547524869e-06,
      "loss": 0.6338,
      "step": 5326
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1779319938527686e-06,
      "loss": 0.5758,
      "step": 5327
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.174612846646293e-06,
      "loss": 0.6409,
      "step": 5328
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.171295106589726e-06,
      "loss": 0.5731,
      "step": 5329
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1679787743670667e-06,
      "loss": 0.6322,
      "step": 5330
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1646638506620265e-06,
      "loss": 0.6333,
      "step": 5331
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1613503361580235e-06,
      "loss": 0.5819,
      "step": 5332
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.158038231538184e-06,
      "loss": 0.6488,
      "step": 5333
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.154727537485346e-06,
      "loss": 0.605,
      "step": 5334
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1514182546820593e-06,
      "loss": 0.6255,
      "step": 5335
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.148110383810572e-06,
      "loss": 0.6476,
      "step": 5336
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.144803925552853e-06,
      "loss": 0.6484,
      "step": 5337
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1414988805905764e-06,
      "loss": 0.6006,
      "step": 5338
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1381952496051207e-06,
      "loss": 0.6676,
      "step": 5339
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1348930332775764e-06,
      "loss": 0.5999,
      "step": 5340
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1315922322887417e-06,
      "loss": 0.6862,
      "step": 5341
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1282928473191287e-06,
      "loss": 0.6566,
      "step": 5342
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.124994879048945e-06,
      "loss": 0.6775,
      "step": 5343
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.121698328158116e-06,
      "loss": 0.6675,
      "step": 5344
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1184031953262728e-06,
      "loss": 0.6332,
      "step": 5345
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1151094812327532e-06,
      "loss": 0.6191,
      "step": 5346
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1118171865566026e-06,
      "loss": 0.6474,
      "step": 5347
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.108526311976574e-06,
      "loss": 0.639,
      "step": 5348
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.1052368581711324e-06,
      "loss": 0.7025,
      "step": 5349
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.101948825818436e-06,
      "loss": 0.6455,
      "step": 5350
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0986622155963653e-06,
      "loss": 0.5979,
      "step": 5351
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.095377028182499e-06,
      "loss": 0.5895,
      "step": 5352
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0920932642541303e-06,
      "loss": 0.6366,
      "step": 5353
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0888109244882436e-06,
      "loss": 0.6717,
      "step": 5354
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.085530009561547e-06,
      "loss": 0.6292,
      "step": 5355
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.082250520150444e-06,
      "loss": 0.613,
      "step": 5356
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0789724569310532e-06,
      "loss": 0.6349,
      "step": 5357
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.075695820579185e-06,
      "loss": 0.6909,
      "step": 5358
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.072420611770369e-06,
      "loss": 0.6907,
      "step": 5359
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0691468311798354e-06,
      "loss": 0.6242,
      "step": 5360
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0658744794825212e-06,
      "loss": 0.5929,
      "step": 5361
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0626035573530664e-06,
      "loss": 0.6597,
      "step": 5362
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0593340654658176e-06,
      "loss": 0.6661,
      "step": 5363
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.056066004494832e-06,
      "loss": 0.6804,
      "step": 5364
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0527993751138575e-06,
      "loss": 0.5799,
      "step": 5365
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0495341779963606e-06,
      "loss": 0.6393,
      "step": 5366
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0462704138155107e-06,
      "loss": 0.5915,
      "step": 5367
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0430080832441735e-06,
      "loss": 0.593,
      "step": 5368
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0397471869549256e-06,
      "loss": 0.6454,
      "step": 5369
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0364877256200475e-06,
      "loss": 0.6538,
      "step": 5370
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.033229699911527e-06,
      "loss": 0.6397,
      "step": 5371
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0299731105010457e-06,
      "loss": 0.6302,
      "step": 5372
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.026717958059998e-06,
      "loss": 0.7139,
      "step": 5373
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.023464243259481e-06,
      "loss": 0.6085,
      "step": 5374
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0202119667702946e-06,
      "loss": 0.6684,
      "step": 5375
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0169611292629364e-06,
      "loss": 0.6963,
      "step": 5376
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.013711731407617e-06,
      "loss": 0.6177,
      "step": 5377
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.010463773874244e-06,
      "loss": 0.6109,
      "step": 5378
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.00721725733243e-06,
      "loss": 0.6442,
      "step": 5379
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0039721824514902e-06,
      "loss": 0.6497,
      "step": 5380
    },
    {
      "epoch": 0.75,
      "learning_rate": 3.0007285499004422e-06,
      "loss": 0.6472,
      "step": 5381
    },
    {
      "epoch": 0.75,
      "learning_rate": 2.997486360348011e-06,
      "loss": 0.705,
      "step": 5382
    },
    {
      "epoch": 0.75,
      "learning_rate": 2.994245614462612e-06,
      "loss": 0.6982,
      "step": 5383
    },
    {
      "epoch": 0.75,
      "learning_rate": 2.9910063129123755e-06,
      "loss": 0.6843,
      "step": 5384
    },
    {
      "epoch": 0.75,
      "learning_rate": 2.987768456365128e-06,
      "loss": 0.574,
      "step": 5385
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.984532045488403e-06,
      "loss": 0.6329,
      "step": 5386
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.981297080949426e-06,
      "loss": 0.5951,
      "step": 5387
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9780635634151334e-06,
      "loss": 0.7005,
      "step": 5388
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9748314935521627e-06,
      "loss": 0.6547,
      "step": 5389
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9716008720268474e-06,
      "loss": 0.5987,
      "step": 5390
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9683716995052257e-06,
      "loss": 0.6662,
      "step": 5391
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9651439766530387e-06,
      "loss": 0.6173,
      "step": 5392
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.961917704135727e-06,
      "loss": 0.7238,
      "step": 5393
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9586928826184323e-06,
      "loss": 0.7285,
      "step": 5394
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.955469512765996e-06,
      "loss": 0.6122,
      "step": 5395
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9522475952429653e-06,
      "loss": 0.7214,
      "step": 5396
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9490271307135774e-06,
      "loss": 0.6614,
      "step": 5397
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.945808119841781e-06,
      "loss": 0.6408,
      "step": 5398
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.942590563291219e-06,
      "loss": 0.5975,
      "step": 5399
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9393744617252395e-06,
      "loss": 0.5825,
      "step": 5400
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9361598158068806e-06,
      "loss": 0.6265,
      "step": 5401
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9329466261988917e-06,
      "loss": 0.606,
      "step": 5402
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9297348935637148e-06,
      "loss": 0.5595,
      "step": 5403
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9265246185635e-06,
      "loss": 0.655,
      "step": 5404
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9233158018600816e-06,
      "loss": 0.6758,
      "step": 5405
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9201084441150075e-06,
      "loss": 0.7071,
      "step": 5406
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9169025459895193e-06,
      "loss": 0.598,
      "step": 5407
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.913698108144558e-06,
      "loss": 0.6902,
      "step": 5408
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9104951312407638e-06,
      "loss": 0.6199,
      "step": 5409
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9072936159384756e-06,
      "loss": 0.6045,
      "step": 5410
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9040935628977342e-06,
      "loss": 0.597,
      "step": 5411
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.9008949727782687e-06,
      "loss": 0.668,
      "step": 5412
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.897697846239518e-06,
      "loss": 0.5603,
      "step": 5413
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.894502183940614e-06,
      "loss": 0.5082,
      "step": 5414
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8913079865403915e-06,
      "loss": 0.6198,
      "step": 5415
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.888115254697371e-06,
      "loss": 0.7047,
      "step": 5416
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8849239890697856e-06,
      "loss": 0.659,
      "step": 5417
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8817341903155604e-06,
      "loss": 0.6061,
      "step": 5418
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8785458590923123e-06,
      "loss": 0.6055,
      "step": 5419
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8753589960573636e-06,
      "loss": 0.6123,
      "step": 5420
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8721736018677315e-06,
      "loss": 0.5961,
      "step": 5421
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8689896771801284e-06,
      "loss": 0.6261,
      "step": 5422
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.865807222650968e-06,
      "loss": 0.7021,
      "step": 5423
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8626262389363556e-06,
      "loss": 0.6326,
      "step": 5424
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.859446726692098e-06,
      "loss": 0.6559,
      "step": 5425
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8562686865736977e-06,
      "loss": 0.6418,
      "step": 5426
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.853092119236348e-06,
      "loss": 0.7182,
      "step": 5427
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.849917025334945e-06,
      "loss": 0.7348,
      "step": 5428
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.846743405524083e-06,
      "loss": 0.6923,
      "step": 5429
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8435712604580425e-06,
      "loss": 0.6752,
      "step": 5430
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8404005907908083e-06,
      "loss": 0.6018,
      "step": 5431
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.837231397176059e-06,
      "loss": 0.6651,
      "step": 5432
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8340636802671716e-06,
      "loss": 0.6599,
      "step": 5433
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.83089744071721e-06,
      "loss": 0.5834,
      "step": 5434
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8277326791789405e-06,
      "loss": 0.5854,
      "step": 5435
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8245693963048293e-06,
      "loss": 0.5915,
      "step": 5436
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.821407592747024e-06,
      "loss": 0.5567,
      "step": 5437
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.818247269157378e-06,
      "loss": 0.6477,
      "step": 5438
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8150884261874366e-06,
      "loss": 0.5696,
      "step": 5439
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8119310644884413e-06,
      "loss": 0.6788,
      "step": 5440
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8087751847113254e-06,
      "loss": 0.6383,
      "step": 5441
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8056207875067176e-06,
      "loss": 0.5576,
      "step": 5442
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.8024678735249424e-06,
      "loss": 0.549,
      "step": 5443
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.7993164434160216e-06,
      "loss": 0.6772,
      "step": 5444
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.7961664978296577e-06,
      "loss": 0.5701,
      "step": 5445
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.793018037415263e-06,
      "loss": 0.6459,
      "step": 5446
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.789871062821937e-06,
      "loss": 0.6743,
      "step": 5447
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.78672557469847e-06,
      "loss": 0.5728,
      "step": 5448
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.7835815736933493e-06,
      "loss": 0.6778,
      "step": 5449
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.780439060454756e-06,
      "loss": 0.5688,
      "step": 5450
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.7772980356305667e-06,
      "loss": 0.6295,
      "step": 5451
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.7741584998683426e-06,
      "loss": 0.549,
      "step": 5452
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.771020453815344e-06,
      "loss": 0.6883,
      "step": 5453
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.767883898118526e-06,
      "loss": 0.6988,
      "step": 5454
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.7647488334245333e-06,
      "loss": 0.7183,
      "step": 5455
    },
    {
      "epoch": 0.76,
      "learning_rate": 2.761615260379702e-06,
      "loss": 0.6773,
      "step": 5456
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.758483179630065e-06,
      "loss": 0.6073,
      "step": 5457
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7553525918213454e-06,
      "loss": 0.6389,
      "step": 5458
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7522234975989536e-06,
      "loss": 0.5854,
      "step": 5459
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7490958976079997e-06,
      "loss": 0.6234,
      "step": 5460
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7459697924932817e-06,
      "loss": 0.6047,
      "step": 5461
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.742845182899294e-06,
      "loss": 0.6677,
      "step": 5462
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.739722069470213e-06,
      "loss": 0.5556,
      "step": 5463
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7366004528499147e-06,
      "loss": 0.6169,
      "step": 5464
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.733480333681968e-06,
      "loss": 0.6872,
      "step": 5465
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.730361712609625e-06,
      "loss": 0.6982,
      "step": 5466
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.727244590275834e-06,
      "loss": 0.5187,
      "step": 5467
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.724128967323234e-06,
      "loss": 0.6338,
      "step": 5468
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7210148443941565e-06,
      "loss": 0.6157,
      "step": 5469
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7179022221306206e-06,
      "loss": 0.5715,
      "step": 5470
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7147911011743376e-06,
      "loss": 0.6549,
      "step": 5471
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.711681482166708e-06,
      "loss": 0.6667,
      "step": 5472
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.708573365748829e-06,
      "loss": 0.605,
      "step": 5473
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.705466752561475e-06,
      "loss": 0.5998,
      "step": 5474
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.7023616432451216e-06,
      "loss": 0.5926,
      "step": 5475
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6992580384399334e-06,
      "loss": 0.643,
      "step": 5476
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.696155938785756e-06,
      "loss": 0.7143,
      "step": 5477
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6930553449221363e-06,
      "loss": 0.6737,
      "step": 5478
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.689956257488303e-06,
      "loss": 0.6172,
      "step": 5479
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.686858677123181e-06,
      "loss": 0.7283,
      "step": 5480
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.683762604465374e-06,
      "loss": 0.6258,
      "step": 5481
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.680668040153184e-06,
      "loss": 0.5743,
      "step": 5482
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.677574984824598e-06,
      "loss": 0.5617,
      "step": 5483
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.674483439117296e-06,
      "loss": 0.6577,
      "step": 5484
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6713934036686405e-06,
      "loss": 0.5652,
      "step": 5485
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6683048791156873e-06,
      "loss": 0.7324,
      "step": 5486
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6652178660951833e-06,
      "loss": 0.5783,
      "step": 5487
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6621323652435515e-06,
      "loss": 0.593,
      "step": 5488
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.659048377196917e-06,
      "loss": 0.6805,
      "step": 5489
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6559659025910857e-06,
      "loss": 0.5797,
      "step": 5490
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6528849420615575e-06,
      "loss": 0.6028,
      "step": 5491
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6498054962435093e-06,
      "loss": 0.642,
      "step": 5492
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.646727565771815e-06,
      "loss": 0.6322,
      "step": 5493
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6436511512810325e-06,
      "loss": 0.5884,
      "step": 5494
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6405762534054136e-06,
      "loss": 0.5843,
      "step": 5495
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6375028727788845e-06,
      "loss": 0.5435,
      "step": 5496
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.634431010035069e-06,
      "loss": 0.5333,
      "step": 5497
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6313606658072777e-06,
      "loss": 0.6075,
      "step": 5498
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6282918407285008e-06,
      "loss": 0.6413,
      "step": 5499
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.625224535431421e-06,
      "loss": 0.6468,
      "step": 5500
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.622158750548407e-06,
      "loss": 0.5938,
      "step": 5501
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.619094486711514e-06,
      "loss": 0.5728,
      "step": 5502
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.616031744552484e-06,
      "loss": 0.6488,
      "step": 5503
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6129705247027447e-06,
      "loss": 0.5121,
      "step": 5504
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6099108277934105e-06,
      "loss": 0.6534,
      "step": 5505
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6068526544552776e-06,
      "loss": 0.6146,
      "step": 5506
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6037960053188327e-06,
      "loss": 0.5917,
      "step": 5507
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.6007408810142474e-06,
      "loss": 0.6477,
      "step": 5508
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.597687282171384e-06,
      "loss": 0.5999,
      "step": 5509
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.594635209419777e-06,
      "loss": 0.6438,
      "step": 5510
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5915846633886567e-06,
      "loss": 0.6263,
      "step": 5511
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5885356447069375e-06,
      "loss": 0.5689,
      "step": 5512
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5854881540032205e-06,
      "loss": 0.7028,
      "step": 5513
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.582442191905783e-06,
      "loss": 0.5871,
      "step": 5514
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5793977590425954e-06,
      "loss": 0.6986,
      "step": 5515
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.576354856041311e-06,
      "loss": 0.554,
      "step": 5516
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5733134835292663e-06,
      "loss": 0.7037,
      "step": 5517
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5702736421334853e-06,
      "loss": 0.5636,
      "step": 5518
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.567235332480672e-06,
      "loss": 0.6116,
      "step": 5519
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5641985551972213e-06,
      "loss": 0.6677,
      "step": 5520
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5611633109092003e-06,
      "loss": 0.6076,
      "step": 5521
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5581296002423716e-06,
      "loss": 0.586,
      "step": 5522
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.555097423822178e-06,
      "loss": 0.6466,
      "step": 5523
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5520667822737467e-06,
      "loss": 0.6459,
      "step": 5524
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5490376762218828e-06,
      "loss": 0.5449,
      "step": 5525
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5460101062910815e-06,
      "loss": 0.6367,
      "step": 5526
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5429840731055223e-06,
      "loss": 0.6823,
      "step": 5527
    },
    {
      "epoch": 0.77,
      "learning_rate": 2.5399595772890585e-06,
      "loss": 0.7294,
      "step": 5528
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5369366194652356e-06,
      "loss": 0.5643,
      "step": 5529
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5339152002572787e-06,
      "loss": 0.7017,
      "step": 5530
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5308953202880972e-06,
      "loss": 0.5898,
      "step": 5531
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5278769801802807e-06,
      "loss": 0.5547,
      "step": 5532
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5248601805561035e-06,
      "loss": 0.6154,
      "step": 5533
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.521844922037523e-06,
      "loss": 0.6913,
      "step": 5534
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.518831205246174e-06,
      "loss": 0.5942,
      "step": 5535
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5158190308033768e-06,
      "loss": 0.7171,
      "step": 5536
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5128083993301357e-06,
      "loss": 0.6368,
      "step": 5537
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5097993114471375e-06,
      "loss": 0.6699,
      "step": 5538
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.506791767774741e-06,
      "loss": 0.5253,
      "step": 5539
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.503785768932998e-06,
      "loss": 0.6719,
      "step": 5540
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.5007813155416373e-06,
      "loss": 0.6343,
      "step": 5541
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4977784082200728e-06,
      "loss": 0.5744,
      "step": 5542
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.494777047587389e-06,
      "loss": 0.6209,
      "step": 5543
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4917772342623623e-06,
      "loss": 0.6256,
      "step": 5544
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4887789688634477e-06,
      "loss": 0.6711,
      "step": 5545
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.485782252008778e-06,
      "loss": 0.633,
      "step": 5546
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4827870843161706e-06,
      "loss": 0.7084,
      "step": 5547
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4797934664031197e-06,
      "loss": 0.5731,
      "step": 5548
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4768013988868066e-06,
      "loss": 0.6677,
      "step": 5549
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4738108823840814e-06,
      "loss": 0.5973,
      "step": 5550
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4708219175114846e-06,
      "loss": 0.5439,
      "step": 5551
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4678345048852326e-06,
      "loss": 0.6191,
      "step": 5552
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.464848645121227e-06,
      "loss": 0.6793,
      "step": 5553
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4618643388350382e-06,
      "loss": 0.6699,
      "step": 5554
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.458881586641927e-06,
      "loss": 0.6439,
      "step": 5555
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4559003891568312e-06,
      "loss": 0.5183,
      "step": 5556
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4529207469943615e-06,
      "loss": 0.6719,
      "step": 5557
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.449942660768816e-06,
      "loss": 0.6646,
      "step": 5558
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4469661310941707e-06,
      "loss": 0.5981,
      "step": 5559
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.44399115858408e-06,
      "loss": 0.64,
      "step": 5560
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.441017743851872e-06,
      "loss": 0.5999,
      "step": 5561
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4380458875105604e-06,
      "loss": 0.6635,
      "step": 5562
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.435075590172836e-06,
      "loss": 0.6427,
      "step": 5563
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4321068524510673e-06,
      "loss": 0.6318,
      "step": 5564
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4291396749573004e-06,
      "loss": 0.6308,
      "step": 5565
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4261740583032622e-06,
      "loss": 0.6942,
      "step": 5566
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4232100031003593e-06,
      "loss": 0.6263,
      "step": 5567
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4202475099596667e-06,
      "loss": 0.6336,
      "step": 5568
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4172865794919477e-06,
      "loss": 0.6761,
      "step": 5569
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.41432721230764e-06,
      "loss": 0.6367,
      "step": 5570
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4113694090168617e-06,
      "loss": 0.6458,
      "step": 5571
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4084131702294e-06,
      "loss": 0.5789,
      "step": 5572
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4054584965547277e-06,
      "loss": 0.6689,
      "step": 5573
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.4025053886019956e-06,
      "loss": 0.6035,
      "step": 5574
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.399553846980023e-06,
      "loss": 0.623,
      "step": 5575
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.396603872297315e-06,
      "loss": 0.6379,
      "step": 5576
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3936554651620503e-06,
      "loss": 0.5804,
      "step": 5577
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3907086261820845e-06,
      "loss": 0.6358,
      "step": 5578
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3877633559649505e-06,
      "loss": 0.55,
      "step": 5579
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.384819655117856e-06,
      "loss": 0.5943,
      "step": 5580
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.381877524247688e-06,
      "loss": 0.5179,
      "step": 5581
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3789369639610103e-06,
      "loss": 0.5609,
      "step": 5582
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.375997974864056e-06,
      "loss": 0.5594,
      "step": 5583
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3730605575627417e-06,
      "loss": 0.6763,
      "step": 5584
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.370124712662659e-06,
      "loss": 0.6535,
      "step": 5585
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3671904407690704e-06,
      "loss": 0.6281,
      "step": 5586
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3642577424869184e-06,
      "loss": 0.5729,
      "step": 5587
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3613266184208216e-06,
      "loss": 0.5594,
      "step": 5588
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3583970691750745e-06,
      "loss": 0.6223,
      "step": 5589
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3554690953536396e-06,
      "loss": 0.5643,
      "step": 5590
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.352542697560163e-06,
      "loss": 0.7108,
      "step": 5591
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3496178763979615e-06,
      "loss": 0.6509,
      "step": 5592
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.346694632470031e-06,
      "loss": 0.6065,
      "step": 5593
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.343772966379038e-06,
      "loss": 0.5923,
      "step": 5594
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.340852878727324e-06,
      "loss": 0.6132,
      "step": 5595
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.337934370116911e-06,
      "loss": 0.6463,
      "step": 5596
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.3350174411494854e-06,
      "loss": 0.6882,
      "step": 5597
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.332102092426414e-06,
      "loss": 0.6186,
      "step": 5598
    },
    {
      "epoch": 0.78,
      "learning_rate": 2.329188324548739e-06,
      "loss": 0.6497,
      "step": 5599
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.326276138117176e-06,
      "loss": 0.5585,
      "step": 5600
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.323365533732109e-06,
      "loss": 0.5461,
      "step": 5601
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.320456511993603e-06,
      "loss": 0.6943,
      "step": 5602
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.317549073501396e-06,
      "loss": 0.6203,
      "step": 5603
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.314643218854892e-06,
      "loss": 0.6755,
      "step": 5604
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.3117389486531772e-06,
      "loss": 0.6762,
      "step": 5605
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.3088362634950067e-06,
      "loss": 0.5939,
      "step": 5606
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.305935163978815e-06,
      "loss": 0.6167,
      "step": 5607
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.3030356507026974e-06,
      "loss": 0.6077,
      "step": 5608
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.3001377242644296e-06,
      "loss": 0.6207,
      "step": 5609
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2972413852614662e-06,
      "loss": 0.6236,
      "step": 5610
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.294346634290928e-06,
      "loss": 0.6322,
      "step": 5611
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.291453471949603e-06,
      "loss": 0.6168,
      "step": 5612
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2885618988339607e-06,
      "loss": 0.5699,
      "step": 5613
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.285671915540143e-06,
      "loss": 0.6339,
      "step": 5614
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.282783522663955e-06,
      "loss": 0.5278,
      "step": 5615
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2798967208008806e-06,
      "loss": 0.5933,
      "step": 5616
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2770115105460766e-06,
      "loss": 0.628,
      "step": 5617
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2741278924943732e-06,
      "loss": 0.63,
      "step": 5618
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2712458672402613e-06,
      "loss": 0.5044,
      "step": 5619
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.268365435377915e-06,
      "loss": 0.5603,
      "step": 5620
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2654865975011764e-06,
      "loss": 0.6636,
      "step": 5621
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.262609354203561e-06,
      "loss": 0.6106,
      "step": 5622
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2597337060782466e-06,
      "loss": 0.5787,
      "step": 5623
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.256859653718093e-06,
      "loss": 0.6422,
      "step": 5624
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.253987197715626e-06,
      "loss": 0.571,
      "step": 5625
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.251116338663042e-06,
      "loss": 0.6192,
      "step": 5626
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2482470771522113e-06,
      "loss": 0.5617,
      "step": 5627
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.245379413774671e-06,
      "loss": 0.7349,
      "step": 5628
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2425133491216324e-06,
      "loss": 0.6128,
      "step": 5629
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2396488837839723e-06,
      "loss": 0.6343,
      "step": 5630
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2367860183522406e-06,
      "loss": 0.5986,
      "step": 5631
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.233924753416663e-06,
      "loss": 0.5802,
      "step": 5632
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2310650895671216e-06,
      "loss": 0.738,
      "step": 5633
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.22820702739318e-06,
      "loss": 0.6635,
      "step": 5634
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.225350567484069e-06,
      "loss": 0.6083,
      "step": 5635
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2224957104286904e-06,
      "loss": 0.5741,
      "step": 5636
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2196424568156073e-06,
      "loss": 0.6474,
      "step": 5637
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2167908072330614e-06,
      "loss": 0.6519,
      "step": 5638
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.21394076226896e-06,
      "loss": 0.7617,
      "step": 5639
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2110923225108805e-06,
      "loss": 0.664,
      "step": 5640
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.208245488546069e-06,
      "loss": 0.5977,
      "step": 5641
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.20540026096144e-06,
      "loss": 0.6138,
      "step": 5642
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.2025566403435817e-06,
      "loss": 0.5962,
      "step": 5643
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1997146272787383e-06,
      "loss": 0.6214,
      "step": 5644
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.196874222352837e-06,
      "loss": 0.6291,
      "step": 5645
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1940354261514652e-06,
      "loss": 0.5909,
      "step": 5646
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.191198239259884e-06,
      "loss": 0.6668,
      "step": 5647
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.188362662263014e-06,
      "loss": 0.5996,
      "step": 5648
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1855286957454513e-06,
      "loss": 0.6191,
      "step": 5649
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1826963402914604e-06,
      "loss": 0.6328,
      "step": 5650
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1798655964849723e-06,
      "loss": 0.6817,
      "step": 5651
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1770364649095798e-06,
      "loss": 0.7072,
      "step": 5652
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1742089461485504e-06,
      "loss": 0.5766,
      "step": 5653
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.171383040784819e-06,
      "loss": 0.6459,
      "step": 5654
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.168558749400984e-06,
      "loss": 0.6194,
      "step": 5655
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.165736072579313e-06,
      "loss": 0.6777,
      "step": 5656
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1629150109017404e-06,
      "loss": 0.6096,
      "step": 5657
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.160095564949873e-06,
      "loss": 0.5924,
      "step": 5658
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.157277735304971e-06,
      "loss": 0.6192,
      "step": 5659
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1544615225479747e-06,
      "loss": 0.6238,
      "step": 5660
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1516469272594876e-06,
      "loss": 0.4634,
      "step": 5661
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.148833950019773e-06,
      "loss": 0.61,
      "step": 5662
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1460225914087685e-06,
      "loss": 0.5558,
      "step": 5663
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.143212852006076e-06,
      "loss": 0.5995,
      "step": 5664
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.140404732390965e-06,
      "loss": 0.5496,
      "step": 5665
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.137598233142363e-06,
      "loss": 0.7163,
      "step": 5666
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.134793354838873e-06,
      "loss": 0.5753,
      "step": 5667
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1319900980587616e-06,
      "loss": 0.6593,
      "step": 5668
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.12918846337996e-06,
      "loss": 0.6146,
      "step": 5669
    },
    {
      "epoch": 0.79,
      "learning_rate": 2.1263884513800605e-06,
      "loss": 0.6338,
      "step": 5670
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.123590062636328e-06,
      "loss": 0.6466,
      "step": 5671
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.1207932977256894e-06,
      "loss": 0.6091,
      "step": 5672
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.1179981572247368e-06,
      "loss": 0.5487,
      "step": 5673
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.1152046417097292e-06,
      "loss": 0.7132,
      "step": 5674
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.1124127517565885e-06,
      "loss": 0.591,
      "step": 5675
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.1096224879409046e-06,
      "loss": 0.762,
      "step": 5676
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.1068338508379236e-06,
      "loss": 0.5951,
      "step": 5677
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.104046841022568e-06,
      "loss": 0.6196,
      "step": 5678
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.101261459069417e-06,
      "loss": 0.6009,
      "step": 5679
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0984777055527193e-06,
      "loss": 0.6363,
      "step": 5680
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0956955810463798e-06,
      "loss": 0.5966,
      "step": 5681
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0929150861239753e-06,
      "loss": 0.6704,
      "step": 5682
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0901362213587474e-06,
      "loss": 0.646,
      "step": 5683
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.087358987323592e-06,
      "loss": 0.6789,
      "step": 5684
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.084583384591078e-06,
      "loss": 0.6403,
      "step": 5685
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0818094137334355e-06,
      "loss": 0.705,
      "step": 5686
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0790370753225584e-06,
      "loss": 0.6634,
      "step": 5687
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.076266369930002e-06,
      "loss": 0.5618,
      "step": 5688
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.073497298126986e-06,
      "loss": 0.6448,
      "step": 5689
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0707298604843964e-06,
      "loss": 0.7198,
      "step": 5690
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.067964057572779e-06,
      "loss": 0.6557,
      "step": 5691
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.065199889962339e-06,
      "loss": 0.68,
      "step": 5692
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.062437358222952e-06,
      "loss": 0.7635,
      "step": 5693
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.059676462924155e-06,
      "loss": 0.5978,
      "step": 5694
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0569172046351403e-06,
      "loss": 0.6432,
      "step": 5695
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0541595839247696e-06,
      "loss": 0.7583,
      "step": 5696
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.051403601361567e-06,
      "loss": 0.5364,
      "step": 5697
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0486492575137183e-06,
      "loss": 0.6584,
      "step": 5698
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.045896552949067e-06,
      "loss": 0.6062,
      "step": 5699
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.043145488235122e-06,
      "loss": 0.6757,
      "step": 5700
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0403960639390565e-06,
      "loss": 0.6921,
      "step": 5701
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0376482806277022e-06,
      "loss": 0.6147,
      "step": 5702
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0349021388675537e-06,
      "loss": 0.6046,
      "step": 5703
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0321576392247665e-06,
      "loss": 0.6046,
      "step": 5704
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.02941478226516e-06,
      "loss": 0.7481,
      "step": 5705
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0266735685542093e-06,
      "loss": 0.6473,
      "step": 5706
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.023933998657055e-06,
      "loss": 0.6282,
      "step": 5707
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0211960731384995e-06,
      "loss": 0.6728,
      "step": 5708
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0184597925630076e-06,
      "loss": 0.6414,
      "step": 5709
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0157251574946957e-06,
      "loss": 0.5985,
      "step": 5710
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0129921684973506e-06,
      "loss": 0.637,
      "step": 5711
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.010260826134419e-06,
      "loss": 0.6104,
      "step": 5712
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0075311309690014e-06,
      "loss": 0.5916,
      "step": 5713
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0048030835638645e-06,
      "loss": 0.6523,
      "step": 5714
    },
    {
      "epoch": 0.8,
      "learning_rate": 2.0020766844814344e-06,
      "loss": 0.5791,
      "step": 5715
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9993519342837965e-06,
      "loss": 0.7325,
      "step": 5716
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.996628833532697e-06,
      "loss": 0.6191,
      "step": 5717
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9939073827895393e-06,
      "loss": 0.5236,
      "step": 5718
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9911875826153925e-06,
      "loss": 0.5195,
      "step": 5719
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.988469433570982e-06,
      "loss": 0.6564,
      "step": 5720
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9857529362166885e-06,
      "loss": 0.6625,
      "step": 5721
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.983038091112558e-06,
      "loss": 0.5702,
      "step": 5722
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9803248988182967e-06,
      "loss": 0.6798,
      "step": 5723
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9776133598932634e-06,
      "loss": 0.5652,
      "step": 5724
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.974903474896481e-06,
      "loss": 0.6547,
      "step": 5725
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.972195244386632e-06,
      "loss": 0.7448,
      "step": 5726
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9694886689220592e-06,
      "loss": 0.7059,
      "step": 5727
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9667837490607553e-06,
      "loss": 0.6199,
      "step": 5728
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.96408048536038e-06,
      "loss": 0.621,
      "step": 5729
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.961378878378253e-06,
      "loss": 0.6617,
      "step": 5730
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9586789286713416e-06,
      "loss": 0.5484,
      "step": 5731
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.955980636796283e-06,
      "loss": 0.6213,
      "step": 5732
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.953284003309368e-06,
      "loss": 0.4941,
      "step": 5733
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9505890287665454e-06,
      "loss": 0.5072,
      "step": 5734
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9478957137234212e-06,
      "loss": 0.5989,
      "step": 5735
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9452040587352616e-06,
      "loss": 0.6405,
      "step": 5736
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9425140643569895e-06,
      "loss": 0.6556,
      "step": 5737
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9398257311431866e-06,
      "loss": 0.6709,
      "step": 5738
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.9371390596480865e-06,
      "loss": 0.5654,
      "step": 5739
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.934454050425586e-06,
      "loss": 0.5822,
      "step": 5740
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.931770704029241e-06,
      "loss": 0.6669,
      "step": 5741
    },
    {
      "epoch": 0.8,
      "learning_rate": 1.929089021012256e-06,
      "loss": 0.5965,
      "step": 5742
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9264090019275005e-06,
      "loss": 0.6471,
      "step": 5743
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9237306473274987e-06,
      "loss": 0.6691,
      "step": 5744
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9210539577644327e-06,
      "loss": 0.621,
      "step": 5745
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.918378933790135e-06,
      "loss": 0.6572,
      "step": 5746
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9157055759561026e-06,
      "loss": 0.6664,
      "step": 5747
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9130338848134856e-06,
      "loss": 0.616,
      "step": 5748
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9103638609130915e-06,
      "loss": 0.6394,
      "step": 5749
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9076955048053824e-06,
      "loss": 0.5574,
      "step": 5750
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9050288170404774e-06,
      "loss": 0.5758,
      "step": 5751
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.9023637981681563e-06,
      "loss": 0.6313,
      "step": 5752
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8997004487378433e-06,
      "loss": 0.6384,
      "step": 5753
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8970387692986282e-06,
      "loss": 0.7008,
      "step": 5754
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8943787603992548e-06,
      "loss": 0.6353,
      "step": 5755
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8917204225881236e-06,
      "loss": 0.6127,
      "step": 5756
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.889063756413283e-06,
      "loss": 0.5996,
      "step": 5757
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.886408762422446e-06,
      "loss": 0.6278,
      "step": 5758
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8837554411629754e-06,
      "loss": 0.6568,
      "step": 5759
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8811037931818944e-06,
      "loss": 0.699,
      "step": 5760
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8784538190258717e-06,
      "loss": 0.5316,
      "step": 5761
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8758055192412406e-06,
      "loss": 0.572,
      "step": 5762
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8731588943739842e-06,
      "loss": 0.583,
      "step": 5763
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.870513944969743e-06,
      "loss": 0.6681,
      "step": 5764
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8678706715738104e-06,
      "loss": 0.5904,
      "step": 5765
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.865229074731133e-06,
      "loss": 0.7282,
      "step": 5766
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8625891549863174e-06,
      "loss": 0.6138,
      "step": 5767
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8599509128836146e-06,
      "loss": 0.6522,
      "step": 5768
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8573143489669387e-06,
      "loss": 0.6285,
      "step": 5769
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.854679463779856e-06,
      "loss": 0.6287,
      "step": 5770
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8520462578655817e-06,
      "loss": 0.5916,
      "step": 5771
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8494147317669885e-06,
      "loss": 0.6199,
      "step": 5772
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8467848860266047e-06,
      "loss": 0.6814,
      "step": 5773
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8441567211866118e-06,
      "loss": 0.6861,
      "step": 5774
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8415302377888388e-06,
      "loss": 0.5986,
      "step": 5775
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.838905436374775e-06,
      "loss": 0.5606,
      "step": 5776
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8362823174855583e-06,
      "loss": 0.4951,
      "step": 5777
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8336608816619827e-06,
      "loss": 0.6665,
      "step": 5778
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8310411294444964e-06,
      "loss": 0.6102,
      "step": 5779
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8284230613731945e-06,
      "loss": 0.6034,
      "step": 5780
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8258066779878337e-06,
      "loss": 0.5899,
      "step": 5781
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8231919798278131e-06,
      "loss": 0.7024,
      "step": 5782
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8205789674321916e-06,
      "loss": 0.6294,
      "step": 5783
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8179676413396785e-06,
      "loss": 0.6034,
      "step": 5784
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8153580020886385e-06,
      "loss": 0.6325,
      "step": 5785
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8127500502170802e-06,
      "loss": 0.6143,
      "step": 5786
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8101437862626726e-06,
      "loss": 0.4651,
      "step": 5787
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8075392107627333e-06,
      "loss": 0.7457,
      "step": 5788
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.804936324254235e-06,
      "loss": 0.6668,
      "step": 5789
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.8023351272737955e-06,
      "loss": 0.6384,
      "step": 5790
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7997356203576888e-06,
      "loss": 0.5952,
      "step": 5791
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.797137804041844e-06,
      "loss": 0.6142,
      "step": 5792
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.794541678861832e-06,
      "loss": 0.6434,
      "step": 5793
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7919472453528842e-06,
      "loss": 0.6576,
      "step": 5794
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7893545040498772e-06,
      "loss": 0.6423,
      "step": 5795
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7867634554873437e-06,
      "loss": 0.591,
      "step": 5796
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7841741001994638e-06,
      "loss": 0.6056,
      "step": 5797
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7815864387200699e-06,
      "loss": 0.663,
      "step": 5798
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.779000471582647e-06,
      "loss": 0.5981,
      "step": 5799
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7764161993203244e-06,
      "loss": 0.6412,
      "step": 5800
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.773833622465888e-06,
      "loss": 0.5954,
      "step": 5801
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7712527415517745e-06,
      "loss": 0.5484,
      "step": 5802
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7686735571100688e-06,
      "loss": 0.5124,
      "step": 5803
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7660960696725026e-06,
      "loss": 0.6421,
      "step": 5804
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7635202797704632e-06,
      "loss": 0.6463,
      "step": 5805
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7609461879349864e-06,
      "loss": 0.6243,
      "step": 5806
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7583737946967606e-06,
      "loss": 0.6922,
      "step": 5807
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7558031005861153e-06,
      "loss": 0.535,
      "step": 5808
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7532341061330372e-06,
      "loss": 0.7028,
      "step": 5809
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.750666811867162e-06,
      "loss": 0.5684,
      "step": 5810
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7481012183177737e-06,
      "loss": 0.5715,
      "step": 5811
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7455373260138053e-06,
      "loss": 0.621,
      "step": 5812
    },
    {
      "epoch": 0.81,
      "learning_rate": 1.7429751354838388e-06,
      "loss": 0.6815,
      "step": 5813
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.740414647256109e-06,
      "loss": 0.5756,
      "step": 5814
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7378558618584918e-06,
      "loss": 0.6804,
      "step": 5815
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7352987798185195e-06,
      "loss": 0.6987,
      "step": 5816
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7327434016633693e-06,
      "loss": 0.6138,
      "step": 5817
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7301897279198732e-06,
      "loss": 0.5804,
      "step": 5818
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7276377591144998e-06,
      "loss": 0.6574,
      "step": 5819
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7250874957733776e-06,
      "loss": 0.6694,
      "step": 5820
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7225389384222824e-06,
      "loss": 0.6107,
      "step": 5821
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7199920875866284e-06,
      "loss": 0.5865,
      "step": 5822
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7174469437914888e-06,
      "loss": 0.6427,
      "step": 5823
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7149035075615795e-06,
      "loss": 0.6448,
      "step": 5824
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7123617794212677e-06,
      "loss": 0.75,
      "step": 5825
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7098217598945644e-06,
      "loss": 0.5693,
      "step": 5826
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7072834495051327e-06,
      "loss": 0.5889,
      "step": 5827
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7047468487762818e-06,
      "loss": 0.6689,
      "step": 5828
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.7022119582309638e-06,
      "loss": 0.5928,
      "step": 5829
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6996787783917833e-06,
      "loss": 0.6232,
      "step": 5830
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6971473097809932e-06,
      "loss": 0.5808,
      "step": 5831
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6946175529204923e-06,
      "loss": 0.5476,
      "step": 5832
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6920895083318223e-06,
      "loss": 0.6301,
      "step": 5833
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6895631765361754e-06,
      "loss": 0.6426,
      "step": 5834
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6870385580543935e-06,
      "loss": 0.5949,
      "step": 5835
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6845156534069617e-06,
      "loss": 0.5398,
      "step": 5836
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6819944631140094e-06,
      "loss": 0.6638,
      "step": 5837
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6794749876953187e-06,
      "loss": 0.6496,
      "step": 5838
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6769572276703128e-06,
      "loss": 0.5408,
      "step": 5839
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6744411835580643e-06,
      "loss": 0.6107,
      "step": 5840
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6719268558772927e-06,
      "loss": 0.6802,
      "step": 5841
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6694142451463603e-06,
      "loss": 0.5746,
      "step": 5842
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6669033518832811e-06,
      "loss": 0.6436,
      "step": 5843
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6643941766057047e-06,
      "loss": 0.6197,
      "step": 5844
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6618867198309363e-06,
      "loss": 0.5742,
      "step": 5845
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6593809820759244e-06,
      "loss": 0.6746,
      "step": 5846
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6568769638572636e-06,
      "loss": 0.6244,
      "step": 5847
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6543746656911875e-06,
      "loss": 0.6189,
      "step": 5848
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6518740880935834e-06,
      "loss": 0.5911,
      "step": 5849
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6493752315799826e-06,
      "loss": 0.7263,
      "step": 5850
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.646878096665555e-06,
      "loss": 0.5545,
      "step": 5851
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6443826838651222e-06,
      "loss": 0.549,
      "step": 5852
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6418889936931492e-06,
      "loss": 0.577,
      "step": 5853
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6393970266637483e-06,
      "loss": 0.6026,
      "step": 5854
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6369067832906681e-06,
      "loss": 0.6276,
      "step": 5855
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6344182640873108e-06,
      "loss": 0.6188,
      "step": 5856
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6319314695667177e-06,
      "loss": 0.5079,
      "step": 5857
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6294464002415789e-06,
      "loss": 0.5613,
      "step": 5858
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6269630566242257e-06,
      "loss": 0.6009,
      "step": 5859
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.624481439226634e-06,
      "loss": 0.6342,
      "step": 5860
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6220015485604269e-06,
      "loss": 0.5819,
      "step": 5861
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6195233851368641e-06,
      "loss": 0.6227,
      "step": 5862
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.617046949466856e-06,
      "loss": 0.6841,
      "step": 5863
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6145722420609566e-06,
      "loss": 0.6835,
      "step": 5864
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.612099263429362e-06,
      "loss": 0.6173,
      "step": 5865
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6096280140819066e-06,
      "loss": 0.515,
      "step": 5866
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6071584945280783e-06,
      "loss": 0.6386,
      "step": 5867
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.6046907052770034e-06,
      "loss": 0.6826,
      "step": 5868
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.602224646837448e-06,
      "loss": 0.6099,
      "step": 5869
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5997603197178258e-06,
      "loss": 0.6371,
      "step": 5870
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5972977244261945e-06,
      "loss": 0.5836,
      "step": 5871
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5948368614702525e-06,
      "loss": 0.6626,
      "step": 5872
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5923777313573397e-06,
      "loss": 0.6168,
      "step": 5873
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5899203345944425e-06,
      "loss": 0.6362,
      "step": 5874
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.587464671688187e-06,
      "loss": 0.6106,
      "step": 5875
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5850107431448458e-06,
      "loss": 0.7314,
      "step": 5876
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5825585494703254e-06,
      "loss": 0.574,
      "step": 5877
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5801080911701826e-06,
      "loss": 0.596,
      "step": 5878
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5776593687496167e-06,
      "loss": 0.6332,
      "step": 5879
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5752123827134614e-06,
      "loss": 0.6772,
      "step": 5880
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5727671335662e-06,
      "loss": 0.5564,
      "step": 5881
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5703236218119544e-06,
      "loss": 0.5336,
      "step": 5882
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5678818479544922e-06,
      "loss": 0.6544,
      "step": 5883
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.5654418124972148e-06,
      "loss": 0.6147,
      "step": 5884
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5630035159431723e-06,
      "loss": 0.6398,
      "step": 5885
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5605669587950534e-06,
      "loss": 0.5911,
      "step": 5886
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5581321415551898e-06,
      "loss": 0.6258,
      "step": 5887
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.555699064725552e-06,
      "loss": 0.5929,
      "step": 5888
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5532677288077546e-06,
      "loss": 0.6406,
      "step": 5889
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5508381343030532e-06,
      "loss": 0.6182,
      "step": 5890
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5484102817123392e-06,
      "loss": 0.6505,
      "step": 5891
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.54598417153615e-06,
      "loss": 0.6261,
      "step": 5892
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5435598042746625e-06,
      "loss": 0.6666,
      "step": 5893
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5411371804276976e-06,
      "loss": 0.6023,
      "step": 5894
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5387163004947081e-06,
      "loss": 0.7097,
      "step": 5895
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5362971649747938e-06,
      "loss": 0.6321,
      "step": 5896
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.533879774366699e-06,
      "loss": 0.6244,
      "step": 5897
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.531464129168795e-06,
      "loss": 0.7093,
      "step": 5898
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5290502298791042e-06,
      "loss": 0.5934,
      "step": 5899
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5266380769952882e-06,
      "loss": 0.6751,
      "step": 5900
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5242276710146463e-06,
      "loss": 0.5472,
      "step": 5901
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5218190124341136e-06,
      "loss": 0.6751,
      "step": 5902
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5194121017502694e-06,
      "loss": 0.6113,
      "step": 5903
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5170069394593378e-06,
      "loss": 0.6103,
      "step": 5904
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5146035260571745e-06,
      "loss": 0.597,
      "step": 5905
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5122018620392753e-06,
      "loss": 0.7033,
      "step": 5906
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5098019479007775e-06,
      "loss": 0.6366,
      "step": 5907
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5074037841364607e-06,
      "loss": 0.5741,
      "step": 5908
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5050073712407354e-06,
      "loss": 0.5884,
      "step": 5909
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.5026127097076582e-06,
      "loss": 0.7138,
      "step": 5910
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.500219800030921e-06,
      "loss": 0.5268,
      "step": 5911
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4978286427038602e-06,
      "loss": 0.5834,
      "step": 5912
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4954392382194416e-06,
      "loss": 0.544,
      "step": 5913
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4930515870702755e-06,
      "loss": 0.584,
      "step": 5914
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4906656897486117e-06,
      "loss": 0.7352,
      "step": 5915
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4882815467463385e-06,
      "loss": 0.5777,
      "step": 5916
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4858991585549753e-06,
      "loss": 0.6177,
      "step": 5917
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.483518525665688e-06,
      "loss": 0.7069,
      "step": 5918
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4811396485692774e-06,
      "loss": 0.6028,
      "step": 5919
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4787625277561824e-06,
      "loss": 0.715,
      "step": 5920
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4763871637164807e-06,
      "loss": 0.6311,
      "step": 5921
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4740135569398862e-06,
      "loss": 0.6115,
      "step": 5922
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.471641707915754e-06,
      "loss": 0.75,
      "step": 5923
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4692716171330711e-06,
      "loss": 0.6446,
      "step": 5924
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4669032850804654e-06,
      "loss": 0.5497,
      "step": 5925
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.464536712246205e-06,
      "loss": 0.659,
      "step": 5926
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4621718991181888e-06,
      "loss": 0.6041,
      "step": 5927
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4598088461839577e-06,
      "loss": 0.6634,
      "step": 5928
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4574475539306877e-06,
      "loss": 0.578,
      "step": 5929
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4550880228451957e-06,
      "loss": 0.6175,
      "step": 5930
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4527302534139287e-06,
      "loss": 0.5922,
      "step": 5931
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4503742461229742e-06,
      "loss": 0.6318,
      "step": 5932
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.448020001458058e-06,
      "loss": 0.5914,
      "step": 5933
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.44566751990454e-06,
      "loss": 0.5701,
      "step": 5934
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4433168019474187e-06,
      "loss": 0.6237,
      "step": 5935
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4409678480713275e-06,
      "loss": 0.64,
      "step": 5936
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4386206587605368e-06,
      "loss": 0.6185,
      "step": 5937
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4362752344989505e-06,
      "loss": 0.5233,
      "step": 5938
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4339315757701122e-06,
      "loss": 0.6807,
      "step": 5939
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4315896830571996e-06,
      "loss": 0.6683,
      "step": 5940
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.429249556843031e-06,
      "loss": 0.5691,
      "step": 5941
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4269111976100502e-06,
      "loss": 0.6181,
      "step": 5942
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4245746058403464e-06,
      "loss": 0.6334,
      "step": 5943
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.422239782015641e-06,
      "loss": 0.6405,
      "step": 5944
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4199067266172918e-06,
      "loss": 0.61,
      "step": 5945
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4175754401262876e-06,
      "loss": 0.5877,
      "step": 5946
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4152459230232585e-06,
      "loss": 0.6308,
      "step": 5947
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.412918175788467e-06,
      "loss": 0.6029,
      "step": 5948
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4105921989018112e-06,
      "loss": 0.6545,
      "step": 5949
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4082679928428233e-06,
      "loss": 0.6293,
      "step": 5950
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4059455580906711e-06,
      "loss": 0.6931,
      "step": 5951
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4036248951241615e-06,
      "loss": 0.6108,
      "step": 5952
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.4013060044217263e-06,
      "loss": 0.599,
      "step": 5953
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.3989888864614388e-06,
      "loss": 0.6045,
      "step": 5954
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.3966735417210065e-06,
      "loss": 0.5699,
      "step": 5955
    },
    {
      "epoch": 0.83,
      "learning_rate": 1.3943599706777733e-06,
      "loss": 0.6096,
      "step": 5956
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3920481738087089e-06,
      "loss": 0.6111,
      "step": 5957
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3897381515904252e-06,
      "loss": 0.65,
      "step": 5958
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3874299044991691e-06,
      "loss": 0.6346,
      "step": 5959
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.385123433010812e-06,
      "loss": 0.6053,
      "step": 5960
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3828187376008706e-06,
      "loss": 0.5885,
      "step": 5961
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.380515818744488e-06,
      "loss": 0.5487,
      "step": 5962
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.378214676916446e-06,
      "loss": 0.6681,
      "step": 5963
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.375915312591154e-06,
      "loss": 0.6985,
      "step": 5964
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3736177262426597e-06,
      "loss": 0.5964,
      "step": 5965
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3713219183446435e-06,
      "loss": 0.7134,
      "step": 5966
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.369027889370419e-06,
      "loss": 0.618,
      "step": 5967
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.366735639792932e-06,
      "loss": 0.6842,
      "step": 5968
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3644451700847617e-06,
      "loss": 0.5515,
      "step": 5969
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3621564807181242e-06,
      "loss": 0.5504,
      "step": 5970
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3598695721648602e-06,
      "loss": 0.6015,
      "step": 5971
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3575844448964493e-06,
      "loss": 0.5915,
      "step": 5972
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3553010993840043e-06,
      "loss": 0.6444,
      "step": 5973
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3530195360982702e-06,
      "loss": 0.6864,
      "step": 5974
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.350739755509619e-06,
      "loss": 0.7131,
      "step": 5975
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3484617580880633e-06,
      "loss": 0.5603,
      "step": 5976
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3461855443032456e-06,
      "loss": 0.6177,
      "step": 5977
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3439111146244355e-06,
      "loss": 0.5586,
      "step": 5978
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3416384695205398e-06,
      "loss": 0.5816,
      "step": 5979
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3393676094600983e-06,
      "loss": 0.6111,
      "step": 5980
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3370985349112785e-06,
      "loss": 0.5981,
      "step": 5981
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3348312463418845e-06,
      "loss": 0.6581,
      "step": 5982
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3325657442193485e-06,
      "loss": 0.6147,
      "step": 5983
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.330302029010736e-06,
      "loss": 0.5739,
      "step": 5984
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.328040101182747e-06,
      "loss": 0.5438,
      "step": 5985
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.325779961201703e-06,
      "loss": 0.6613,
      "step": 5986
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.323521609533569e-06,
      "loss": 0.5339,
      "step": 5987
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3212650466439358e-06,
      "loss": 0.6151,
      "step": 5988
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3190102729980225e-06,
      "loss": 0.6271,
      "step": 5989
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.316757289060685e-06,
      "loss": 0.5901,
      "step": 5990
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3145060952964061e-06,
      "loss": 0.5496,
      "step": 5991
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.312256692169306e-06,
      "loss": 0.5978,
      "step": 5992
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3100090801431243e-06,
      "loss": 0.6591,
      "step": 5993
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3077632596812407e-06,
      "loss": 0.5503,
      "step": 5994
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3055192312466624e-06,
      "loss": 0.5072,
      "step": 5995
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.3032769953020297e-06,
      "loss": 0.6563,
      "step": 5996
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.301036552309608e-06,
      "loss": 0.6648,
      "step": 5997
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2987979027312992e-06,
      "loss": 0.6481,
      "step": 5998
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2965610470286327e-06,
      "loss": 0.5791,
      "step": 5999
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2943259856627643e-06,
      "loss": 0.6247,
      "step": 6000
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2920927190944855e-06,
      "loss": 0.4021,
      "step": 6001
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2898612477842154e-06,
      "loss": 0.6581,
      "step": 6002
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2876315721920051e-06,
      "loss": 0.6723,
      "step": 6003
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2854036927775316e-06,
      "loss": 0.7125,
      "step": 6004
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2831776100001037e-06,
      "loss": 0.6122,
      "step": 6005
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2809533243186622e-06,
      "loss": 0.6257,
      "step": 6006
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2787308361917716e-06,
      "loss": 0.6379,
      "step": 6007
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2765101460776307e-06,
      "loss": 0.6786,
      "step": 6008
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2742912544340657e-06,
      "loss": 0.553,
      "step": 6009
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2720741617185328e-06,
      "loss": 0.5871,
      "step": 6010
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2698588683881185e-06,
      "loss": 0.6981,
      "step": 6011
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2676453748995344e-06,
      "loss": 0.5458,
      "step": 6012
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.265433681709124e-06,
      "loss": 0.6064,
      "step": 6013
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2632237892728628e-06,
      "loss": 0.6062,
      "step": 6014
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.261015698046345e-06,
      "loss": 0.6457,
      "step": 6015
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2588094084848035e-06,
      "loss": 0.5695,
      "step": 6016
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2566049210430963e-06,
      "loss": 0.5776,
      "step": 6017
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2544022361757069e-06,
      "loss": 0.6019,
      "step": 6018
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2522013543367529e-06,
      "loss": 0.5936,
      "step": 6019
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2500022759799745e-06,
      "loss": 0.6114,
      "step": 6020
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.247805001558746e-06,
      "loss": 0.6214,
      "step": 6021
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2456095315260641e-06,
      "loss": 0.529,
      "step": 6022
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2434158663345553e-06,
      "loss": 0.6278,
      "step": 6023
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2412240064364777e-06,
      "loss": 0.6335,
      "step": 6024
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2390339522837114e-06,
      "loss": 0.5804,
      "step": 6025
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.2368457043277672e-06,
      "loss": 0.5762,
      "step": 6026
    },
    {
      "epoch": 0.84,
      "learning_rate": 1.234659263019784e-06,
      "loss": 0.5207,
      "step": 6027
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2324746288105272e-06,
      "loss": 0.6321,
      "step": 6028
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2302918021503907e-06,
      "loss": 0.5982,
      "step": 6029
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2281107834893947e-06,
      "loss": 0.5311,
      "step": 6030
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.225931573277187e-06,
      "loss": 0.6183,
      "step": 6031
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2237541719630442e-06,
      "loss": 0.5788,
      "step": 6032
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2215785799958647e-06,
      "loss": 0.6033,
      "step": 6033
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2194047978241796e-06,
      "loss": 0.5888,
      "step": 6034
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2172328258961464e-06,
      "loss": 0.6783,
      "step": 6035
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2150626646595442e-06,
      "loss": 0.6562,
      "step": 6036
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2128943145617834e-06,
      "loss": 0.5638,
      "step": 6037
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2107277760499015e-06,
      "loss": 0.6288,
      "step": 6038
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2085630495705625e-06,
      "loss": 0.6345,
      "step": 6039
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2064001355700493e-06,
      "loss": 0.6466,
      "step": 6040
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2042390344942822e-06,
      "loss": 0.6349,
      "step": 6041
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.2020797467888012e-06,
      "loss": 0.6065,
      "step": 6042
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1999222728987736e-06,
      "loss": 0.6588,
      "step": 6043
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1977666132689947e-06,
      "loss": 0.6126,
      "step": 6044
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1956127683438822e-06,
      "loss": 0.6433,
      "step": 6045
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1934607385674845e-06,
      "loss": 0.554,
      "step": 6046
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1913105243834687e-06,
      "loss": 0.6225,
      "step": 6047
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1891621262351349e-06,
      "loss": 0.6465,
      "step": 6048
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1870155445654041e-06,
      "loss": 0.5837,
      "step": 6049
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.184870779816828e-06,
      "loss": 0.6143,
      "step": 6050
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.182727832431574e-06,
      "loss": 0.5451,
      "step": 6051
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1805867028514452e-06,
      "loss": 0.5496,
      "step": 6052
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.178447391517864e-06,
      "loss": 0.6209,
      "step": 6053
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1763098988718823e-06,
      "loss": 0.5747,
      "step": 6054
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.174174225354171e-06,
      "loss": 0.5903,
      "step": 6055
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.172040371405031e-06,
      "loss": 0.6466,
      "step": 6056
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.169908337464386e-06,
      "loss": 0.5305,
      "step": 6057
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1677781239717844e-06,
      "loss": 0.5874,
      "step": 6058
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1656497313664006e-06,
      "loss": 0.6409,
      "step": 6059
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1635231600870334e-06,
      "loss": 0.5944,
      "step": 6060
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1613984105721066e-06,
      "loss": 0.6109,
      "step": 6061
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1592754832596632e-06,
      "loss": 0.5912,
      "step": 6062
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1571543785873763e-06,
      "loss": 0.6035,
      "step": 6063
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.155035096992545e-06,
      "loss": 0.6665,
      "step": 6064
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1529176389120832e-06,
      "loss": 0.5871,
      "step": 6065
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1508020047825385e-06,
      "loss": 0.5726,
      "step": 6066
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1486881950400786e-06,
      "loss": 0.6106,
      "step": 6067
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1465762101204958e-06,
      "loss": 0.5614,
      "step": 6068
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1444660504592031e-06,
      "loss": 0.5488,
      "step": 6069
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1423577164912404e-06,
      "loss": 0.5891,
      "step": 6070
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1402512086512717e-06,
      "loss": 0.6467,
      "step": 6071
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1381465273735825e-06,
      "loss": 0.6142,
      "step": 6072
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1360436730920832e-06,
      "loss": 0.5134,
      "step": 6073
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.133942646240307e-06,
      "loss": 0.7009,
      "step": 6074
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1318434472514117e-06,
      "loss": 0.5947,
      "step": 6075
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1297460765581725e-06,
      "loss": 0.6182,
      "step": 6076
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1276505345929944e-06,
      "loss": 0.5939,
      "step": 6077
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.125556821787903e-06,
      "loss": 0.6493,
      "step": 6078
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1234649385745488e-06,
      "loss": 0.5535,
      "step": 6079
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1213748853841987e-06,
      "loss": 0.5753,
      "step": 6080
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1192866626477495e-06,
      "loss": 0.6151,
      "step": 6081
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1172002707957163e-06,
      "loss": 0.6168,
      "step": 6082
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.115115710258242e-06,
      "loss": 0.5743,
      "step": 6083
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.113032981465083e-06,
      "loss": 0.5882,
      "step": 6084
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1109520848456257e-06,
      "loss": 0.6537,
      "step": 6085
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.108873020828878e-06,
      "loss": 0.6591,
      "step": 6086
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1067957898434644e-06,
      "loss": 0.4711,
      "step": 6087
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1047203923176374e-06,
      "loss": 0.6713,
      "step": 6088
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.10264682867927e-06,
      "loss": 0.6105,
      "step": 6089
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.1005750993558562e-06,
      "loss": 0.6161,
      "step": 6090
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.0985052047745127e-06,
      "loss": 0.6985,
      "step": 6091
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.0964371453619759e-06,
      "loss": 0.5606,
      "step": 6092
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.0943709215446097e-06,
      "loss": 0.6407,
      "step": 6093
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.0923065337483896e-06,
      "loss": 0.5798,
      "step": 6094
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.0902439823989208e-06,
      "loss": 0.7289,
      "step": 6095
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.0881832679214276e-06,
      "loss": 0.5901,
      "step": 6096
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.086124390740757e-06,
      "loss": 0.6261,
      "step": 6097
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.0840673512813716e-06,
      "loss": 0.5825,
      "step": 6098
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.082012149967362e-06,
      "loss": 0.5706,
      "step": 6099
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0799587872224359e-06,
      "loss": 0.6366,
      "step": 6100
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.077907263469925e-06,
      "loss": 0.6223,
      "step": 6101
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0758575791327763e-06,
      "loss": 0.5577,
      "step": 6102
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.073809734633564e-06,
      "loss": 0.6357,
      "step": 6103
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0717637303944783e-06,
      "loss": 0.6518,
      "step": 6104
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.069719566837334e-06,
      "loss": 0.5856,
      "step": 6105
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0676772443835626e-06,
      "loss": 0.725,
      "step": 6106
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0656367634542185e-06,
      "loss": 0.5885,
      "step": 6107
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0635981244699767e-06,
      "loss": 0.6028,
      "step": 6108
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0615613278511283e-06,
      "loss": 0.5629,
      "step": 6109
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0595263740175898e-06,
      "loss": 0.5705,
      "step": 6110
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0574932633888945e-06,
      "loss": 0.6202,
      "step": 6111
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0554619963842005e-06,
      "loss": 0.6175,
      "step": 6112
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0534325734222773e-06,
      "loss": 0.6005,
      "step": 6113
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.051404994921521e-06,
      "loss": 0.6406,
      "step": 6114
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0493792612999476e-06,
      "loss": 0.6608,
      "step": 6115
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0473553729751874e-06,
      "loss": 0.6502,
      "step": 6116
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0453333303644941e-06,
      "loss": 0.5885,
      "step": 6117
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0433131338847413e-06,
      "loss": 0.5471,
      "step": 6118
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0412947839524213e-06,
      "loss": 0.6458,
      "step": 6119
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0392782809836445e-06,
      "loss": 0.5681,
      "step": 6120
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0372636253941415e-06,
      "loss": 0.6692,
      "step": 6121
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0352508175992625e-06,
      "loss": 0.4666,
      "step": 6122
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.033239858013979e-06,
      "loss": 0.6082,
      "step": 6123
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0312307470528737e-06,
      "loss": 0.6755,
      "step": 6124
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0292234851301542e-06,
      "loss": 0.5206,
      "step": 6125
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0272180726596504e-06,
      "loss": 0.6098,
      "step": 6126
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0252145100548006e-06,
      "loss": 0.6347,
      "step": 6127
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0232127977286698e-06,
      "loss": 0.5232,
      "step": 6128
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0212129360939393e-06,
      "loss": 0.6006,
      "step": 6129
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0192149255629114e-06,
      "loss": 0.5695,
      "step": 6130
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0172187665474987e-06,
      "loss": 0.5779,
      "step": 6131
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0152244594592409e-06,
      "loss": 0.6572,
      "step": 6132
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0132320047092947e-06,
      "loss": 0.6919,
      "step": 6133
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0112414027084262e-06,
      "loss": 0.6225,
      "step": 6134
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.009252653867031e-06,
      "loss": 0.6744,
      "step": 6135
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0072657585951185e-06,
      "loss": 0.5937,
      "step": 6136
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.005280717302315e-06,
      "loss": 0.6378,
      "step": 6137
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0032975303978608e-06,
      "loss": 0.6499,
      "step": 6138
    },
    {
      "epoch": 0.86,
      "learning_rate": 1.0013161982906216e-06,
      "loss": 0.5442,
      "step": 6139
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.993367213890749e-07,
      "loss": 0.6421,
      "step": 6140
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.973591001013204e-07,
      "loss": 0.5796,
      "step": 6141
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.953833348350707e-07,
      "loss": 0.6207,
      "step": 6142
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.934094259976569e-07,
      "loss": 0.5801,
      "step": 6143
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.914373739960314e-07,
      "loss": 0.6779,
      "step": 6144
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.894671792367562e-07,
      "loss": 0.6665,
      "step": 6145
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.874988421260168e-07,
      "loss": 0.5776,
      "step": 6146
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.855323630696146e-07,
      "loss": 0.6353,
      "step": 6147
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.835677424729672e-07,
      "loss": 0.6621,
      "step": 6148
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.816049807411076e-07,
      "loss": 0.6723,
      "step": 6149
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.796440782786865e-07,
      "loss": 0.6495,
      "step": 6150
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.776850354899715e-07,
      "loss": 0.5857,
      "step": 6151
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.757278527788483e-07,
      "loss": 0.6119,
      "step": 6152
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.737725305488176e-07,
      "loss": 0.6863,
      "step": 6153
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.71819069202996e-07,
      "loss": 0.6521,
      "step": 6154
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.698674691441202e-07,
      "loss": 0.5939,
      "step": 6155
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.679177307745335e-07,
      "loss": 0.5988,
      "step": 6156
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.65969854496207e-07,
      "loss": 0.6029,
      "step": 6157
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.640238407107217e-07,
      "loss": 0.5148,
      "step": 6158
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.620796898192776e-07,
      "loss": 0.6734,
      "step": 6159
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.60137402222685e-07,
      "loss": 0.585,
      "step": 6160
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.581969783213762e-07,
      "loss": 0.6049,
      "step": 6161
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.562584185153977e-07,
      "loss": 0.641,
      "step": 6162
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.5432172320441e-07,
      "loss": 0.7085,
      "step": 6163
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.523868927876889e-07,
      "loss": 0.6515,
      "step": 6164
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.504539276641278e-07,
      "loss": 0.6241,
      "step": 6165
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.485228282322356e-07,
      "loss": 0.6331,
      "step": 6166
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.465935948901361e-07,
      "loss": 0.6204,
      "step": 6167
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.446662280355667e-07,
      "loss": 0.7429,
      "step": 6168
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.427407280658818e-07,
      "loss": 0.6909,
      "step": 6169
    },
    {
      "epoch": 0.86,
      "learning_rate": 9.408170953780526e-07,
      "loss": 0.6674,
      "step": 6170
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.388953303686587e-07,
      "loss": 0.5701,
      "step": 6171
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.36975433433901e-07,
      "loss": 0.6686,
      "step": 6172
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.35057404969596e-07,
      "loss": 0.5894,
      "step": 6173
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.331412453711686e-07,
      "loss": 0.6382,
      "step": 6174
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.312269550336628e-07,
      "loss": 0.534,
      "step": 6175
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.293145343517374e-07,
      "loss": 0.6509,
      "step": 6176
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.274039837196669e-07,
      "loss": 0.607,
      "step": 6177
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.254953035313352e-07,
      "loss": 0.5876,
      "step": 6178
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.235884941802442e-07,
      "loss": 0.555,
      "step": 6179
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.216835560595094e-07,
      "loss": 0.6925,
      "step": 6180
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.197804895618623e-07,
      "loss": 0.6468,
      "step": 6181
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.178792950796455e-07,
      "loss": 0.6019,
      "step": 6182
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.159799730048168e-07,
      "loss": 0.6306,
      "step": 6183
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.140825237289519e-07,
      "loss": 0.6412,
      "step": 6184
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.121869476432322e-07,
      "loss": 0.6315,
      "step": 6185
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.102932451384583e-07,
      "loss": 0.664,
      "step": 6186
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.084014166050447e-07,
      "loss": 0.6646,
      "step": 6187
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.065114624330207e-07,
      "loss": 0.5441,
      "step": 6188
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.046233830120232e-07,
      "loss": 0.5953,
      "step": 6189
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.027371787313077e-07,
      "loss": 0.5759,
      "step": 6190
    },
    {
      "epoch": 0.87,
      "learning_rate": 9.008528499797431e-07,
      "loss": 0.669,
      "step": 6191
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.989703971458085e-07,
      "loss": 0.6616,
      "step": 6192
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.970898206175993e-07,
      "loss": 0.669,
      "step": 6193
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.952111207828218e-07,
      "loss": 0.5881,
      "step": 6194
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.933342980287995e-07,
      "loss": 0.5859,
      "step": 6195
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.914593527424609e-07,
      "loss": 0.6288,
      "step": 6196
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.895862853103565e-07,
      "loss": 0.5083,
      "step": 6197
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.87715096118642e-07,
      "loss": 0.6415,
      "step": 6198
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.858457855530955e-07,
      "loss": 0.6164,
      "step": 6199
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.839783539990965e-07,
      "loss": 0.5972,
      "step": 6200
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.821128018416436e-07,
      "loss": 0.6177,
      "step": 6201
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.802491294653481e-07,
      "loss": 0.5605,
      "step": 6202
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.783873372544305e-07,
      "loss": 0.5076,
      "step": 6203
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.765274255927259e-07,
      "loss": 0.686,
      "step": 6204
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.746693948636819e-07,
      "loss": 0.5668,
      "step": 6205
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.728132454503601e-07,
      "loss": 0.6003,
      "step": 6206
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.709589777354277e-07,
      "loss": 0.5885,
      "step": 6207
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.691065921011687e-07,
      "loss": 0.621,
      "step": 6208
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.672560889294812e-07,
      "loss": 0.7566,
      "step": 6209
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.654074686018721e-07,
      "loss": 0.5047,
      "step": 6210
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.635607314994577e-07,
      "loss": 0.5671,
      "step": 6211
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.617158780029711e-07,
      "loss": 0.668,
      "step": 6212
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.598729084927537e-07,
      "loss": 0.6295,
      "step": 6213
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.580318233487617e-07,
      "loss": 0.6158,
      "step": 6214
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.561926229505601e-07,
      "loss": 0.4979,
      "step": 6215
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.543553076773248e-07,
      "loss": 0.5576,
      "step": 6216
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.525198779078469e-07,
      "loss": 0.6425,
      "step": 6217
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.506863340205229e-07,
      "loss": 0.6551,
      "step": 6218
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.488546763933647e-07,
      "loss": 0.5237,
      "step": 6219
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.470249054039947e-07,
      "loss": 0.6572,
      "step": 6220
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.45197021429649e-07,
      "loss": 0.6247,
      "step": 6221
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.43371024847166e-07,
      "loss": 0.6099,
      "step": 6222
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.415469160330048e-07,
      "loss": 0.643,
      "step": 6223
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.39724695363231e-07,
      "loss": 0.509,
      "step": 6224
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.379043632135187e-07,
      "loss": 0.6703,
      "step": 6225
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.360859199591553e-07,
      "loss": 0.5552,
      "step": 6226
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.3426936597504e-07,
      "loss": 0.7275,
      "step": 6227
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.324547016356821e-07,
      "loss": 0.7326,
      "step": 6228
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.306419273151978e-07,
      "loss": 0.565,
      "step": 6229
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.28831043387317e-07,
      "loss": 0.6071,
      "step": 6230
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.270220502253812e-07,
      "loss": 0.609,
      "step": 6231
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.252149482023363e-07,
      "loss": 0.6013,
      "step": 6232
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.234097376907435e-07,
      "loss": 0.6202,
      "step": 6233
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.216064190627715e-07,
      "loss": 0.6085,
      "step": 6234
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.19804992690203e-07,
      "loss": 0.68,
      "step": 6235
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.180054589444242e-07,
      "loss": 0.638,
      "step": 6236
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.16207818196435e-07,
      "loss": 0.5965,
      "step": 6237
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.144120708168446e-07,
      "loss": 0.6144,
      "step": 6238
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.126182171758734e-07,
      "loss": 0.6378,
      "step": 6239
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.108262576433479e-07,
      "loss": 0.6339,
      "step": 6240
    },
    {
      "epoch": 0.87,
      "learning_rate": 8.090361925887047e-07,
      "loss": 0.7226,
      "step": 6241
    },
    {
      "epoch": 0.88,
      "learning_rate": 8.072480223809931e-07,
      "loss": 0.6133,
      "step": 6242
    },
    {
      "epoch": 0.88,
      "learning_rate": 8.054617473888682e-07,
      "loss": 0.7075,
      "step": 6243
    },
    {
      "epoch": 0.88,
      "learning_rate": 8.036773679805976e-07,
      "loss": 0.6776,
      "step": 6244
    },
    {
      "epoch": 0.88,
      "learning_rate": 8.018948845240538e-07,
      "loss": 0.716,
      "step": 6245
    },
    {
      "epoch": 0.88,
      "learning_rate": 8.001142973867248e-07,
      "loss": 0.7278,
      "step": 6246
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.983356069357007e-07,
      "loss": 0.5509,
      "step": 6247
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.965588135376822e-07,
      "loss": 0.5366,
      "step": 6248
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.947839175589845e-07,
      "loss": 0.6576,
      "step": 6249
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.930109193655255e-07,
      "loss": 0.5729,
      "step": 6250
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.912398193228332e-07,
      "loss": 0.5453,
      "step": 6251
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.894706177960443e-07,
      "loss": 0.6297,
      "step": 6252
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.87703315149908e-07,
      "loss": 0.6778,
      "step": 6253
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.859379117487753e-07,
      "loss": 0.6665,
      "step": 6254
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.841744079566093e-07,
      "loss": 0.6752,
      "step": 6255
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.824128041369827e-07,
      "loss": 0.5917,
      "step": 6256
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.806531006530749e-07,
      "loss": 0.6429,
      "step": 6257
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.788952978676722e-07,
      "loss": 0.622,
      "step": 6258
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.771393961431717e-07,
      "loss": 0.5763,
      "step": 6259
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.753853958415769e-07,
      "loss": 0.6629,
      "step": 6260
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.736332973244986e-07,
      "loss": 0.5976,
      "step": 6261
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.71883100953159e-07,
      "loss": 0.6151,
      "step": 6262
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.701348070883841e-07,
      "loss": 0.5423,
      "step": 6263
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.683884160906119e-07,
      "loss": 0.6117,
      "step": 6264
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.666439283198812e-07,
      "loss": 0.5957,
      "step": 6265
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.649013441358466e-07,
      "loss": 0.5407,
      "step": 6266
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.631606638977629e-07,
      "loss": 0.6324,
      "step": 6267
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.614218879645008e-07,
      "loss": 0.6468,
      "step": 6268
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.596850166945291e-07,
      "loss": 0.5958,
      "step": 6269
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.579500504459291e-07,
      "loss": 0.5743,
      "step": 6270
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.562169895763916e-07,
      "loss": 0.6601,
      "step": 6271
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.544858344432082e-07,
      "loss": 0.4987,
      "step": 6272
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.527565854032803e-07,
      "loss": 0.4637,
      "step": 6273
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.510292428131205e-07,
      "loss": 0.7247,
      "step": 6274
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.493038070288428e-07,
      "loss": 0.6623,
      "step": 6275
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.475802784061703e-07,
      "loss": 0.6237,
      "step": 6276
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.458586573004323e-07,
      "loss": 0.5631,
      "step": 6277
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.44138944066567e-07,
      "loss": 0.5697,
      "step": 6278
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.424211390591174e-07,
      "loss": 0.5736,
      "step": 6279
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.407052426322303e-07,
      "loss": 0.6355,
      "step": 6280
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.38991255139665e-07,
      "loss": 0.6626,
      "step": 6281
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.372791769347843e-07,
      "loss": 0.6764,
      "step": 6282
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.355690083705547e-07,
      "loss": 0.6293,
      "step": 6283
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.338607497995531e-07,
      "loss": 0.541,
      "step": 6284
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.321544015739612e-07,
      "loss": 0.6598,
      "step": 6285
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.304499640455687e-07,
      "loss": 0.6179,
      "step": 6286
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.287474375657655e-07,
      "loss": 0.6339,
      "step": 6287
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.270468224855532e-07,
      "loss": 0.6188,
      "step": 6288
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.253481191555389e-07,
      "loss": 0.6549,
      "step": 6289
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.236513279259316e-07,
      "loss": 0.6593,
      "step": 6290
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.219564491465513e-07,
      "loss": 0.6029,
      "step": 6291
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.202634831668209e-07,
      "loss": 0.592,
      "step": 6292
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.185724303357689e-07,
      "loss": 0.5858,
      "step": 6293
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.168832910020285e-07,
      "loss": 0.5714,
      "step": 6294
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.151960655138401e-07,
      "loss": 0.6284,
      "step": 6295
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.1351075421905e-07,
      "loss": 0.568,
      "step": 6296
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.118273574651091e-07,
      "loss": 0.5158,
      "step": 6297
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.10145875599072e-07,
      "loss": 0.638,
      "step": 6298
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.084663089676003e-07,
      "loss": 0.6559,
      "step": 6299
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.067886579169625e-07,
      "loss": 0.6177,
      "step": 6300
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.051129227930264e-07,
      "loss": 0.5624,
      "step": 6301
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.034391039412702e-07,
      "loss": 0.6593,
      "step": 6302
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.017672017067755e-07,
      "loss": 0.6003,
      "step": 6303
    },
    {
      "epoch": 0.88,
      "learning_rate": 7.000972164342279e-07,
      "loss": 0.5892,
      "step": 6304
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.984291484679195e-07,
      "loss": 0.6862,
      "step": 6305
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.967629981517454e-07,
      "loss": 0.6608,
      "step": 6306
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.950987658292063e-07,
      "loss": 0.5511,
      "step": 6307
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.934364518434089e-07,
      "loss": 0.7374,
      "step": 6308
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.917760565370579e-07,
      "loss": 0.6117,
      "step": 6309
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.901175802524718e-07,
      "loss": 0.5825,
      "step": 6310
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.884610233315681e-07,
      "loss": 0.5805,
      "step": 6311
    },
    {
      "epoch": 0.88,
      "learning_rate": 6.868063861158669e-07,
      "loss": 0.6532,
      "step": 6312
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.851536689464966e-07,
      "loss": 0.5411,
      "step": 6313
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.835028721641878e-07,
      "loss": 0.634,
      "step": 6314
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.818539961092774e-07,
      "loss": 0.6771,
      "step": 6315
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.802070411217021e-07,
      "loss": 0.6169,
      "step": 6316
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.78562007541006e-07,
      "loss": 0.6117,
      "step": 6317
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.769188957063356e-07,
      "loss": 0.5954,
      "step": 6318
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.752777059564431e-07,
      "loss": 0.5883,
      "step": 6319
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.736384386296812e-07,
      "loss": 0.5202,
      "step": 6320
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.720010940640076e-07,
      "loss": 0.5879,
      "step": 6321
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.703656725969842e-07,
      "loss": 0.6174,
      "step": 6322
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.687321745657782e-07,
      "loss": 0.587,
      "step": 6323
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.671006003071567e-07,
      "loss": 0.6159,
      "step": 6324
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.654709501574919e-07,
      "loss": 0.6844,
      "step": 6325
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.638432244527604e-07,
      "loss": 0.5451,
      "step": 6326
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.622174235285394e-07,
      "loss": 0.6549,
      "step": 6327
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.605935477200098e-07,
      "loss": 0.6537,
      "step": 6328
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.589715973619604e-07,
      "loss": 0.6302,
      "step": 6329
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.573515727887747e-07,
      "loss": 0.6623,
      "step": 6330
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.557334743344445e-07,
      "loss": 0.6469,
      "step": 6331
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.541173023325664e-07,
      "loss": 0.6674,
      "step": 6332
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.52503057116336e-07,
      "loss": 0.6457,
      "step": 6333
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.508907390185504e-07,
      "loss": 0.6322,
      "step": 6334
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.492803483716126e-07,
      "loss": 0.6162,
      "step": 6335
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.476718855075293e-07,
      "loss": 0.5487,
      "step": 6336
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.460653507579063e-07,
      "loss": 0.6152,
      "step": 6337
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.444607444539541e-07,
      "loss": 0.6286,
      "step": 6338
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.428580669264838e-07,
      "loss": 0.6322,
      "step": 6339
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.412573185059135e-07,
      "loss": 0.6066,
      "step": 6340
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.396584995222554e-07,
      "loss": 0.5512,
      "step": 6341
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.380616103051296e-07,
      "loss": 0.6453,
      "step": 6342
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.364666511837603e-07,
      "loss": 0.6492,
      "step": 6343
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.34873622486969e-07,
      "loss": 0.6317,
      "step": 6344
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.332825245431795e-07,
      "loss": 0.6404,
      "step": 6345
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.316933576804207e-07,
      "loss": 0.5948,
      "step": 6346
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.301061222263216e-07,
      "loss": 0.6201,
      "step": 6347
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.285208185081159e-07,
      "loss": 0.5693,
      "step": 6348
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.269374468526313e-07,
      "loss": 0.5494,
      "step": 6349
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.253560075863041e-07,
      "loss": 0.5864,
      "step": 6350
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.237765010351715e-07,
      "loss": 0.6576,
      "step": 6351
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.221989275248697e-07,
      "loss": 0.6385,
      "step": 6352
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.206232873806384e-07,
      "loss": 0.6677,
      "step": 6353
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.19049580927319e-07,
      "loss": 0.6468,
      "step": 6354
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.17477808489354e-07,
      "loss": 0.6124,
      "step": 6355
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.159079703907823e-07,
      "loss": 0.5561,
      "step": 6356
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.143400669552513e-07,
      "loss": 0.6076,
      "step": 6357
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.127740985060071e-07,
      "loss": 0.5534,
      "step": 6358
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.112100653658936e-07,
      "loss": 0.5576,
      "step": 6359
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.096479678573608e-07,
      "loss": 0.666,
      "step": 6360
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.080878063024543e-07,
      "loss": 0.5838,
      "step": 6361
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.065295810228277e-07,
      "loss": 0.6438,
      "step": 6362
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.049732923397267e-07,
      "loss": 0.6403,
      "step": 6363
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.034189405740043e-07,
      "loss": 0.5832,
      "step": 6364
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.018665260461121e-07,
      "loss": 0.5554,
      "step": 6365
    },
    {
      "epoch": 0.89,
      "learning_rate": 6.003160490761018e-07,
      "loss": 0.5669,
      "step": 6366
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.987675099836265e-07,
      "loss": 0.601,
      "step": 6367
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.972209090879389e-07,
      "loss": 0.55,
      "step": 6368
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.956762467078947e-07,
      "loss": 0.6438,
      "step": 6369
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.94133523161945e-07,
      "loss": 0.6675,
      "step": 6370
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.925927387681441e-07,
      "loss": 0.5203,
      "step": 6371
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.910538938441479e-07,
      "loss": 0.5605,
      "step": 6372
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.895169887072117e-07,
      "loss": 0.5853,
      "step": 6373
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.879820236741884e-07,
      "loss": 0.653,
      "step": 6374
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.86448999061533e-07,
      "loss": 0.6462,
      "step": 6375
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.849179151853012e-07,
      "loss": 0.5454,
      "step": 6376
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.833887723611476e-07,
      "loss": 0.5609,
      "step": 6377
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.818615709043241e-07,
      "loss": 0.5281,
      "step": 6378
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.803363111296878e-07,
      "loss": 0.5878,
      "step": 6379
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.788129933516918e-07,
      "loss": 0.5981,
      "step": 6380
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.772916178843879e-07,
      "loss": 0.6212,
      "step": 6381
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.757721850414299e-07,
      "loss": 0.5906,
      "step": 6382
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.742546951360716e-07,
      "loss": 0.5905,
      "step": 6383
    },
    {
      "epoch": 0.89,
      "learning_rate": 5.72739148481164e-07,
      "loss": 0.6015,
      "step": 6384
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.71225545389158e-07,
      "loss": 0.6114,
      "step": 6385
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.697138861721052e-07,
      "loss": 0.6294,
      "step": 6386
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.682041711416553e-07,
      "loss": 0.6209,
      "step": 6387
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.666964006090591e-07,
      "loss": 0.6058,
      "step": 6388
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.651905748851605e-07,
      "loss": 0.5821,
      "step": 6389
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.636866942804087e-07,
      "loss": 0.6792,
      "step": 6390
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.621847591048524e-07,
      "loss": 0.6644,
      "step": 6391
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.606847696681339e-07,
      "loss": 0.6044,
      "step": 6392
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.591867262794969e-07,
      "loss": 0.5565,
      "step": 6393
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.576906292477857e-07,
      "loss": 0.6728,
      "step": 6394
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.561964788814423e-07,
      "loss": 0.5968,
      "step": 6395
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.547042754885046e-07,
      "loss": 0.6397,
      "step": 6396
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.532140193766134e-07,
      "loss": 0.5373,
      "step": 6397
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.51725710853005e-07,
      "loss": 0.6576,
      "step": 6398
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.502393502245151e-07,
      "loss": 0.6117,
      "step": 6399
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.487549377975787e-07,
      "loss": 0.7155,
      "step": 6400
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.472724738782287e-07,
      "loss": 0.6152,
      "step": 6401
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.457919587720961e-07,
      "loss": 0.5422,
      "step": 6402
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.44313392784408e-07,
      "loss": 0.6883,
      "step": 6403
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.428367762199927e-07,
      "loss": 0.7134,
      "step": 6404
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.413621093832766e-07,
      "loss": 0.6129,
      "step": 6405
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.398893925782822e-07,
      "loss": 0.6764,
      "step": 6406
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.3841862610863e-07,
      "loss": 0.609,
      "step": 6407
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.369498102775406e-07,
      "loss": 0.5964,
      "step": 6408
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.354829453878319e-07,
      "loss": 0.5944,
      "step": 6409
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.340180317419163e-07,
      "loss": 0.6831,
      "step": 6410
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.325550696418069e-07,
      "loss": 0.6228,
      "step": 6411
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.310940593891156e-07,
      "loss": 0.6043,
      "step": 6412
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.296350012850493e-07,
      "loss": 0.6015,
      "step": 6413
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.281778956304129e-07,
      "loss": 0.5609,
      "step": 6414
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.267227427256106e-07,
      "loss": 0.6125,
      "step": 6415
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.252695428706422e-07,
      "loss": 0.6064,
      "step": 6416
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.238182963651062e-07,
      "loss": 0.4426,
      "step": 6417
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.223690035081963e-07,
      "loss": 0.6353,
      "step": 6418
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.209216645987036e-07,
      "loss": 0.5855,
      "step": 6419
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.194762799350206e-07,
      "loss": 0.5846,
      "step": 6420
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.18032849815131e-07,
      "loss": 0.6206,
      "step": 6421
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.165913745366191e-07,
      "loss": 0.6102,
      "step": 6422
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.151518543966661e-07,
      "loss": 0.639,
      "step": 6423
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.1371428969205e-07,
      "loss": 0.6955,
      "step": 6424
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.122786807191426e-07,
      "loss": 0.5781,
      "step": 6425
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.108450277739152e-07,
      "loss": 0.6168,
      "step": 6426
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.094133311519389e-07,
      "loss": 0.5398,
      "step": 6427
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.079835911483754e-07,
      "loss": 0.6628,
      "step": 6428
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.065558080579836e-07,
      "loss": 0.6562,
      "step": 6429
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.051299821751254e-07,
      "loss": 0.6311,
      "step": 6430
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.03706113793756e-07,
      "loss": 0.5794,
      "step": 6431
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.022842032074204e-07,
      "loss": 0.5636,
      "step": 6432
    },
    {
      "epoch": 0.9,
      "learning_rate": 5.008642507092698e-07,
      "loss": 0.5844,
      "step": 6433
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.994462565920454e-07,
      "loss": 0.6344,
      "step": 6434
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.980302211480892e-07,
      "loss": 0.6603,
      "step": 6435
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.966161446693329e-07,
      "loss": 0.6559,
      "step": 6436
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.952040274473114e-07,
      "loss": 0.6691,
      "step": 6437
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.937938697731537e-07,
      "loss": 0.5456,
      "step": 6438
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.923856719375797e-07,
      "loss": 0.6121,
      "step": 6439
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.909794342309115e-07,
      "loss": 0.6382,
      "step": 6440
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.895751569430641e-07,
      "loss": 0.5992,
      "step": 6441
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.881728403635521e-07,
      "loss": 0.6354,
      "step": 6442
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.867724847814781e-07,
      "loss": 0.6729,
      "step": 6443
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.853740904855486e-07,
      "loss": 0.6331,
      "step": 6444
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.839776577640598e-07,
      "loss": 0.6083,
      "step": 6445
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.825831869049092e-07,
      "loss": 0.5975,
      "step": 6446
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.811906781955833e-07,
      "loss": 0.5365,
      "step": 6447
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.798001319231704e-07,
      "loss": 0.6133,
      "step": 6448
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.784115483743501e-07,
      "loss": 0.68,
      "step": 6449
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.770249278353977e-07,
      "loss": 0.5965,
      "step": 6450
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.756402705921848e-07,
      "loss": 0.569,
      "step": 6451
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.7425757693017935e-07,
      "loss": 0.6556,
      "step": 6452
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.728768471344425e-07,
      "loss": 0.6584,
      "step": 6453
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.714980814896297e-07,
      "loss": 0.6137,
      "step": 6454
    },
    {
      "epoch": 0.9,
      "learning_rate": 4.701212802799948e-07,
      "loss": 0.5665,
      "step": 6455
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.687464437893852e-07,
      "loss": 0.6265,
      "step": 6456
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.6737357230124067e-07,
      "loss": 0.6438,
      "step": 6457
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.6600266609859834e-07,
      "loss": 0.6602,
      "step": 6458
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.64633725464092e-07,
      "loss": 0.6326,
      "step": 6459
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.6326675067994597e-07,
      "loss": 0.5918,
      "step": 6460
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.6190174202798257e-07,
      "loss": 0.6764,
      "step": 6461
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.6053869978961773e-07,
      "loss": 0.6803,
      "step": 6462
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.591776242458601e-07,
      "loss": 0.7128,
      "step": 6463
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.578185156773185e-07,
      "loss": 0.6706,
      "step": 6464
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.564613743641877e-07,
      "loss": 0.5319,
      "step": 6465
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.55106200586265e-07,
      "loss": 0.6101,
      "step": 6466
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.537529946229369e-07,
      "loss": 0.5458,
      "step": 6467
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.5240175675318574e-07,
      "loss": 0.6783,
      "step": 6468
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.5105248725558883e-07,
      "loss": 0.5877,
      "step": 6469
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.4970518640831687e-07,
      "loss": 0.6162,
      "step": 6470
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.4835985448913657e-07,
      "loss": 0.6276,
      "step": 6471
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.4701649177540384e-07,
      "loss": 0.6293,
      "step": 6472
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.456750985440739e-07,
      "loss": 0.7502,
      "step": 6473
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.443356750716943e-07,
      "loss": 0.5645,
      "step": 6474
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.429982216344053e-07,
      "loss": 0.6967,
      "step": 6475
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.4166273850794086e-07,
      "loss": 0.6293,
      "step": 6476
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.403292259676317e-07,
      "loss": 0.591,
      "step": 6477
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.389976842884014e-07,
      "loss": 0.6231,
      "step": 6478
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.3766811374476135e-07,
      "loss": 0.6688,
      "step": 6479
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.363405146108257e-07,
      "loss": 0.6233,
      "step": 6480
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.350148871602944e-07,
      "loss": 0.6466,
      "step": 6481
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.3369123166646763e-07,
      "loss": 0.6867,
      "step": 6482
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.3236954840223276e-07,
      "loss": 0.5794,
      "step": 6483
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.3104983764007514e-07,
      "loss": 0.5386,
      "step": 6484
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.2973209965207044e-07,
      "loss": 0.6742,
      "step": 6485
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.284163347098913e-07,
      "loss": 0.4919,
      "step": 6486
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.271025430847986e-07,
      "loss": 0.5835,
      "step": 6487
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.257907250476501e-07,
      "loss": 0.5874,
      "step": 6488
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.2448088086889716e-07,
      "loss": 0.6742,
      "step": 6489
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.2317301081857943e-07,
      "loss": 0.5885,
      "step": 6490
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.218671151663345e-07,
      "loss": 0.5575,
      "step": 6491
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.2056319418139146e-07,
      "loss": 0.6264,
      "step": 6492
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.1926124813257197e-07,
      "loss": 0.6291,
      "step": 6493
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.1796127728828903e-07,
      "loss": 0.6641,
      "step": 6494
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.166632819165528e-07,
      "loss": 0.7221,
      "step": 6495
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.153672622849625e-07,
      "loss": 0.6086,
      "step": 6496
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.140732186607088e-07,
      "loss": 0.6722,
      "step": 6497
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.127811513105784e-07,
      "loss": 0.5818,
      "step": 6498
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.1149106050094923e-07,
      "loss": 0.6802,
      "step": 6499
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.102029464977941e-07,
      "loss": 0.5084,
      "step": 6500
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.0891680956667177e-07,
      "loss": 0.5083,
      "step": 6501
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.0763264997273897e-07,
      "loss": 0.5604,
      "step": 6502
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.0635046798074396e-07,
      "loss": 0.6808,
      "step": 6503
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.0507026385502747e-07,
      "loss": 0.6681,
      "step": 6504
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.037920378595195e-07,
      "loss": 0.6561,
      "step": 6505
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.025157902577448e-07,
      "loss": 0.5974,
      "step": 6506
    },
    {
      "epoch": 0.91,
      "learning_rate": 4.012415213128218e-07,
      "loss": 0.639,
      "step": 6507
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.99969231287457e-07,
      "loss": 0.6156,
      "step": 6508
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.9869892044395177e-07,
      "loss": 0.5531,
      "step": 6509
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.9743058904419765e-07,
      "loss": 0.5818,
      "step": 6510
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.9616423734968213e-07,
      "loss": 0.5962,
      "step": 6511
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.948998656214775e-07,
      "loss": 0.6682,
      "step": 6512
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.9363747412025424e-07,
      "loss": 0.5935,
      "step": 6513
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.923770631062718e-07,
      "loss": 0.6097,
      "step": 6514
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.911186328393823e-07,
      "loss": 0.65,
      "step": 6515
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.8986218357902617e-07,
      "loss": 0.6483,
      "step": 6516
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.886077155842416e-07,
      "loss": 0.6257,
      "step": 6517
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.8735522911365287e-07,
      "loss": 0.5764,
      "step": 6518
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.8610472442547786e-07,
      "loss": 0.6682,
      "step": 6519
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.848562017775259e-07,
      "loss": 0.6231,
      "step": 6520
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.836096614271989e-07,
      "loss": 0.7058,
      "step": 6521
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.823651036314868e-07,
      "loss": 0.6037,
      "step": 6522
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.811225286469733e-07,
      "loss": 0.6267,
      "step": 6523
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.798819367298334e-07,
      "loss": 0.5035,
      "step": 6524
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.786433281358326e-07,
      "loss": 0.6203,
      "step": 6525
    },
    {
      "epoch": 0.91,
      "learning_rate": 3.774067031203277e-07,
      "loss": 0.6511,
      "step": 6526
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.761720619382647e-07,
      "loss": 0.6689,
      "step": 6527
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.749394048441835e-07,
      "loss": 0.6268,
      "step": 6528
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.7370873209221614e-07,
      "loss": 0.5749,
      "step": 6529
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.724800439360787e-07,
      "loss": 0.5696,
      "step": 6530
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.7125334062908527e-07,
      "loss": 0.6236,
      "step": 6531
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.7002862242413673e-07,
      "loss": 0.6239,
      "step": 6532
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.68805889573729e-07,
      "loss": 0.5704,
      "step": 6533
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.675851423299415e-07,
      "loss": 0.6887,
      "step": 6534
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.6636638094445065e-07,
      "loss": 0.6945,
      "step": 6535
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.651496056685222e-07,
      "loss": 0.661,
      "step": 6536
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.639348167530099e-07,
      "loss": 0.6517,
      "step": 6537
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.6272201444836006e-07,
      "loss": 0.5887,
      "step": 6538
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.615111990046094e-07,
      "loss": 0.6084,
      "step": 6539
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.6030237067138593e-07,
      "loss": 0.6348,
      "step": 6540
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.5909552969790376e-07,
      "loss": 0.6354,
      "step": 6541
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.5789067633297146e-07,
      "loss": 0.6101,
      "step": 6542
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.5668781082498716e-07,
      "loss": 0.5944,
      "step": 6543
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.554869334219391e-07,
      "loss": 0.5279,
      "step": 6544
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.5428804437140254e-07,
      "loss": 0.5586,
      "step": 6545
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.5309114392054753e-07,
      "loss": 0.6296,
      "step": 6546
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.5189623231613235e-07,
      "loss": 0.654,
      "step": 6547
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.507033098045032e-07,
      "loss": 0.686,
      "step": 6548
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.4951237663159885e-07,
      "loss": 0.6128,
      "step": 6549
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.4832343304294637e-07,
      "loss": 0.6466,
      "step": 6550
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.471364792836651e-07,
      "loss": 0.6968,
      "step": 6551
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.459515155984594e-07,
      "loss": 0.5437,
      "step": 6552
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.4476854223162824e-07,
      "loss": 0.6149,
      "step": 6553
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.4358755942705655e-07,
      "loss": 0.7013,
      "step": 6554
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.424085674282229e-07,
      "loss": 0.5731,
      "step": 6555
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.412315664781929e-07,
      "loss": 0.5418,
      "step": 6556
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.4005655681962015e-07,
      "loss": 0.5091,
      "step": 6557
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.38883538694752e-07,
      "loss": 0.6296,
      "step": 6558
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.377125123454195e-07,
      "loss": 0.6974,
      "step": 6559
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.365434780130483e-07,
      "loss": 0.7052,
      "step": 6560
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.3537643593865133e-07,
      "loss": 0.6158,
      "step": 6561
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.3421138636283045e-07,
      "loss": 0.5841,
      "step": 6562
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.330483295257769e-07,
      "loss": 0.62,
      "step": 6563
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.3188726566727114e-07,
      "loss": 0.6514,
      "step": 6564
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.3072819502668383e-07,
      "loss": 0.5969,
      "step": 6565
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.2957111784297167e-07,
      "loss": 0.6074,
      "step": 6566
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.284160343546849e-07,
      "loss": 0.6553,
      "step": 6567
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.272629447999587e-07,
      "loss": 0.6621,
      "step": 6568
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.2611184941651944e-07,
      "loss": 0.5849,
      "step": 6569
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.2496274844168065e-07,
      "loss": 0.6301,
      "step": 6570
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.238156421123473e-07,
      "loss": 0.6534,
      "step": 6571
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.226705306650113e-07,
      "loss": 0.5817,
      "step": 6572
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.2152741433575384e-07,
      "loss": 0.6129,
      "step": 6573
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.2038629336024197e-07,
      "loss": 0.588,
      "step": 6574
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.192471679737363e-07,
      "loss": 0.6317,
      "step": 6575
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.181100384110836e-07,
      "loss": 0.6268,
      "step": 6576
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.1697490490671834e-07,
      "loss": 0.6123,
      "step": 6577
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.158417676946635e-07,
      "loss": 0.6068,
      "step": 6578
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.1471062700853316e-07,
      "loss": 0.534,
      "step": 6579
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.1358148308152757e-07,
      "loss": 0.653,
      "step": 6580
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.124543361464338e-07,
      "loss": 0.6125,
      "step": 6581
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.1132918643563157e-07,
      "loss": 0.628,
      "step": 6582
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.102060341810842e-07,
      "loss": 0.5496,
      "step": 6583
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.090848796143475e-07,
      "loss": 0.5225,
      "step": 6584
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.079657229665611e-07,
      "loss": 0.5673,
      "step": 6585
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.0684856446845713e-07,
      "loss": 0.5396,
      "step": 6586
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.0573340435035346e-07,
      "loss": 0.6188,
      "step": 6587
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.046202428421541e-07,
      "loss": 0.6881,
      "step": 6588
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.0350908017335423e-07,
      "loss": 0.6821,
      "step": 6589
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.0239991657303623e-07,
      "loss": 0.5975,
      "step": 6590
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.012927522698694e-07,
      "loss": 0.6241,
      "step": 6591
    },
    {
      "epoch": 0.92,
      "learning_rate": 3.001875874921101e-07,
      "loss": 0.5487,
      "step": 6592
    },
    {
      "epoch": 0.92,
      "learning_rate": 2.990844224676048e-07,
      "loss": 0.6255,
      "step": 6593
    },
    {
      "epoch": 0.92,
      "learning_rate": 2.979832574237884e-07,
      "loss": 0.5952,
      "step": 6594
    },
    {
      "epoch": 0.92,
      "learning_rate": 2.9688409258767703e-07,
      "loss": 0.6594,
      "step": 6595
    },
    {
      "epoch": 0.92,
      "learning_rate": 2.957869281858827e-07,
      "loss": 0.6795,
      "step": 6596
    },
    {
      "epoch": 0.92,
      "learning_rate": 2.946917644446001e-07,
      "loss": 0.5476,
      "step": 6597
    },
    {
      "epoch": 0.92,
      "learning_rate": 2.9359860158961306e-07,
      "loss": 0.6218,
      "step": 6598
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.9250743984629237e-07,
      "loss": 0.6046,
      "step": 6599
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.9141827943959586e-07,
      "loss": 0.6016,
      "step": 6600
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.9033112059407065e-07,
      "loss": 0.5899,
      "step": 6601
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.892459635338496e-07,
      "loss": 0.6781,
      "step": 6602
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.881628084826515e-07,
      "loss": 0.6621,
      "step": 6603
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.8708165566378565e-07,
      "loss": 0.6144,
      "step": 6604
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.8600250530014695e-07,
      "loss": 0.577,
      "step": 6605
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.8492535761421635e-07,
      "loss": 0.6684,
      "step": 6606
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.8385021282806403e-07,
      "loss": 0.6312,
      "step": 6607
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.82777071163346e-07,
      "loss": 0.6325,
      "step": 6608
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.8170593284130633e-07,
      "loss": 0.6851,
      "step": 6609
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.80636798082774e-07,
      "loss": 0.5973,
      "step": 6610
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.79569667108166e-07,
      "loss": 0.5505,
      "step": 6611
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.785045401374875e-07,
      "loss": 0.6911,
      "step": 6612
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.774414173903306e-07,
      "loss": 0.5353,
      "step": 6613
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.7638029908587105e-07,
      "loss": 0.5793,
      "step": 6614
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.753211854428728e-07,
      "loss": 0.5744,
      "step": 6615
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.742640766796889e-07,
      "loss": 0.6674,
      "step": 6616
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.732089730142562e-07,
      "loss": 0.6087,
      "step": 6617
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.7215587466409954e-07,
      "loss": 0.6328,
      "step": 6618
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.7110478184633083e-07,
      "loss": 0.6015,
      "step": 6619
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.7005569477764673e-07,
      "loss": 0.672,
      "step": 6620
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.69008613674332e-07,
      "loss": 0.6396,
      "step": 6621
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.67963538752255e-07,
      "loss": 0.6779,
      "step": 6622
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.6692047022687684e-07,
      "loss": 0.613,
      "step": 6623
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.6587940831323656e-07,
      "loss": 0.5735,
      "step": 6624
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.648403532259669e-07,
      "loss": 0.6246,
      "step": 6625
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.6380330517928097e-07,
      "loss": 0.6066,
      "step": 6626
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.627682643869833e-07,
      "loss": 0.6201,
      "step": 6627
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.6173523106246103e-07,
      "loss": 0.6106,
      "step": 6628
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.6070420541868924e-07,
      "loss": 0.6484,
      "step": 6629
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.5967518766822685e-07,
      "loss": 0.638,
      "step": 6630
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.5864817802322195e-07,
      "loss": 0.6022,
      "step": 6631
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.5762317669540625e-07,
      "loss": 0.5887,
      "step": 6632
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.5660018389609853e-07,
      "loss": 0.6094,
      "step": 6633
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.555791998362045e-07,
      "loss": 0.5715,
      "step": 6634
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.545602247262113e-07,
      "loss": 0.615,
      "step": 6635
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.535432587761977e-07,
      "loss": 0.5987,
      "step": 6636
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.525283021958247e-07,
      "loss": 0.7169,
      "step": 6637
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.5151535519434165e-07,
      "loss": 0.5495,
      "step": 6638
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.5050441798057823e-07,
      "loss": 0.5771,
      "step": 6639
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.494954907629565e-07,
      "loss": 0.5466,
      "step": 6640
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.484885737494791e-07,
      "loss": 0.6883,
      "step": 6641
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.4748366714773875e-07,
      "loss": 0.6382,
      "step": 6642
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.4648077116490753e-07,
      "loss": 0.6172,
      "step": 6643
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.45479886007749e-07,
      "loss": 0.6087,
      "step": 6644
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.4448101188260906e-07,
      "loss": 0.5954,
      "step": 6645
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.4348414899541985e-07,
      "loss": 0.6252,
      "step": 6646
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.42489297551699e-07,
      "loss": 0.6256,
      "step": 6647
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.414964577565493e-07,
      "loss": 0.6791,
      "step": 6648
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.405056298146591e-07,
      "loss": 0.5873,
      "step": 6649
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.3951681393030057e-07,
      "loss": 0.6654,
      "step": 6650
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.385300103073318e-07,
      "loss": 0.5931,
      "step": 6651
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.375452191491967e-07,
      "loss": 0.5179,
      "step": 6652
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.365624406589251e-07,
      "loss": 0.5747,
      "step": 6653
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.3558167503912822e-07,
      "loss": 0.5642,
      "step": 6654
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.3460292249200545e-07,
      "loss": 0.4812,
      "step": 6655
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.3362618321934316e-07,
      "loss": 0.608,
      "step": 6656
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.3265145742250694e-07,
      "loss": 0.6007,
      "step": 6657
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.316787453024505e-07,
      "loss": 0.6139,
      "step": 6658
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.307080470597134e-07,
      "loss": 0.585,
      "step": 6659
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2973936289441778e-07,
      "loss": 0.5534,
      "step": 6660
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.287726930062728e-07,
      "loss": 0.5848,
      "step": 6661
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2780803759456903e-07,
      "loss": 0.5945,
      "step": 6662
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2684539685818742e-07,
      "loss": 0.6555,
      "step": 6663
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2588477099558582e-07,
      "loss": 0.6194,
      "step": 6664
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.249261602048125e-07,
      "loss": 0.6554,
      "step": 6665
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2396956468349939e-07,
      "loss": 0.5957,
      "step": 6666
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2301498462886207e-07,
      "loss": 0.6277,
      "step": 6667
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2206242023769863e-07,
      "loss": 0.6777,
      "step": 6668
    },
    {
      "epoch": 0.93,
      "learning_rate": 2.2111187170639648e-07,
      "loss": 0.6671,
      "step": 6669
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.2016333923092214e-07,
      "loss": 0.6214,
      "step": 6670
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1921682300683144e-07,
      "loss": 0.5908,
      "step": 6671
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1827232322925938e-07,
      "loss": 0.6775,
      "step": 6672
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1732984009292913e-07,
      "loss": 0.5663,
      "step": 6673
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1638937379214852e-07,
      "loss": 0.698,
      "step": 6674
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1545092452080586e-07,
      "loss": 0.6471,
      "step": 6675
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1451449247237632e-07,
      "loss": 0.6459,
      "step": 6676
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1358007783991774e-07,
      "loss": 0.622,
      "step": 6677
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1264768081607378e-07,
      "loss": 0.6715,
      "step": 6678
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.117173015930718e-07,
      "loss": 0.6095,
      "step": 6679
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.1078894036272168e-07,
      "loss": 0.6437,
      "step": 6680
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0986259731641921e-07,
      "loss": 0.5985,
      "step": 6681
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0893827264514166e-07,
      "loss": 0.5796,
      "step": 6682
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0801596653945322e-07,
      "loss": 0.6544,
      "step": 6683
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0709567918949847e-07,
      "loss": 0.577,
      "step": 6684
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0617741078501008e-07,
      "loss": 0.605,
      "step": 6685
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0526116151529885e-07,
      "loss": 0.6661,
      "step": 6686
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0434693156926478e-07,
      "loss": 0.5939,
      "step": 6687
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.034347211353893e-07,
      "loss": 0.5962,
      "step": 6688
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0252453040173646e-07,
      "loss": 0.7067,
      "step": 6689
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0161635955595505e-07,
      "loss": 0.6515,
      "step": 6690
    },
    {
      "epoch": 0.94,
      "learning_rate": 2.0071020878527857e-07,
      "loss": 0.6206,
      "step": 6691
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9980607827652097e-07,
      "loss": 0.6045,
      "step": 6692
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9890396821608203e-07,
      "loss": 0.5847,
      "step": 6693
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9800387878994521e-07,
      "loss": 0.6351,
      "step": 6694
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9710581018367646e-07,
      "loss": 0.5095,
      "step": 6695
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.962097625824255e-07,
      "loss": 0.4921,
      "step": 6696
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9531573617092457e-07,
      "loss": 0.5628,
      "step": 6697
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9442373113348956e-07,
      "loss": 0.7478,
      "step": 6698
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.935337476540211e-07,
      "loss": 0.5599,
      "step": 6699
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9264578591600137e-07,
      "loss": 0.5572,
      "step": 6700
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9175984610249497e-07,
      "loss": 0.7098,
      "step": 6701
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.9087592839615254e-07,
      "loss": 0.558,
      "step": 6702
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8999403297920604e-07,
      "loss": 0.6458,
      "step": 6703
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8911416003346895e-07,
      "loss": 0.6362,
      "step": 6704
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8823630974034168e-07,
      "loss": 0.6097,
      "step": 6705
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8736048228080395e-07,
      "loss": 0.6012,
      "step": 6706
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.864866778354213e-07,
      "loss": 0.6592,
      "step": 6707
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8561489658433963e-07,
      "loss": 0.6849,
      "step": 6708
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.847451387072885e-07,
      "loss": 0.5611,
      "step": 6709
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8387740438358338e-07,
      "loss": 0.5984,
      "step": 6710
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.830116937921178e-07,
      "loss": 0.6752,
      "step": 6711
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8214800711137014e-07,
      "loss": 0.5953,
      "step": 6712
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.812863445194024e-07,
      "loss": 0.6435,
      "step": 6713
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.8042670619385916e-07,
      "loss": 0.6401,
      "step": 6714
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7956909231196417e-07,
      "loss": 0.6914,
      "step": 6715
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7871350305052937e-07,
      "loss": 0.5984,
      "step": 6716
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7785993858594586e-07,
      "loss": 0.6607,
      "step": 6717
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7700839909418843e-07,
      "loss": 0.5913,
      "step": 6718
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7615888475081333e-07,
      "loss": 0.6288,
      "step": 6719
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7531139573095934e-07,
      "loss": 0.5623,
      "step": 6720
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7446593220934894e-07,
      "loss": 0.5373,
      "step": 6721
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7362249436028712e-07,
      "loss": 0.6238,
      "step": 6722
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7278108235765812e-07,
      "loss": 0.5992,
      "step": 6723
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7194169637493318e-07,
      "loss": 0.5999,
      "step": 6724
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.711043365851639e-07,
      "loss": 0.5749,
      "step": 6725
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.7026900316098217e-07,
      "loss": 0.6718,
      "step": 6726
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6943569627460466e-07,
      "loss": 0.5676,
      "step": 6727
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.686044160978284e-07,
      "loss": 0.6861,
      "step": 6728
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6777516280203632e-07,
      "loss": 0.63,
      "step": 6729
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.669479365581872e-07,
      "loss": 0.6048,
      "step": 6730
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6612273753682572e-07,
      "loss": 0.6782,
      "step": 6731
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6529956590808138e-07,
      "loss": 0.5895,
      "step": 6732
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6447842184166063e-07,
      "loss": 0.5652,
      "step": 6733
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.636593055068525e-07,
      "loss": 0.6036,
      "step": 6734
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.628422170725319e-07,
      "loss": 0.6473,
      "step": 6735
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6202715670715184e-07,
      "loss": 0.6682,
      "step": 6736
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6121412457874908e-07,
      "loss": 0.6876,
      "step": 6737
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.6040312085494058e-07,
      "loss": 0.6391,
      "step": 6738
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.595941457029271e-07,
      "loss": 0.5698,
      "step": 6739
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.587871992894907e-07,
      "loss": 0.5975,
      "step": 6740
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5798228178099395e-07,
      "loss": 0.6279,
      "step": 6741
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5717939334338184e-07,
      "loss": 0.6179,
      "step": 6742
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5637853414218306e-07,
      "loss": 0.5961,
      "step": 6743
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5557970434250336e-07,
      "loss": 0.6514,
      "step": 6744
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.547829041090343e-07,
      "loss": 0.5559,
      "step": 6745
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.539881336060467e-07,
      "loss": 0.6204,
      "step": 6746
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5319539299739504e-07,
      "loss": 0.6079,
      "step": 6747
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5240468244651308e-07,
      "loss": 0.6645,
      "step": 6748
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5161600211641592e-07,
      "loss": 0.5654,
      "step": 6749
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5082935216970351e-07,
      "loss": 0.6684,
      "step": 6750
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.5004473276855391e-07,
      "loss": 0.64,
      "step": 6751
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.492621440747255e-07,
      "loss": 0.6408,
      "step": 6752
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4848158624956256e-07,
      "loss": 0.5942,
      "step": 6753
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4770305945398632e-07,
      "loss": 0.6367,
      "step": 6754
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.469265638485029e-07,
      "loss": 0.6555,
      "step": 6755
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4615209959319643e-07,
      "loss": 0.6255,
      "step": 6756
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4537966684773474e-07,
      "loss": 0.6307,
      "step": 6757
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.446092657713649e-07,
      "loss": 0.6493,
      "step": 6758
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4384089652291544e-07,
      "loss": 0.6895,
      "step": 6759
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4307455926079739e-07,
      "loss": 0.5177,
      "step": 6760
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4231025414300325e-07,
      "loss": 0.5868,
      "step": 6761
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.4154798132710258e-07,
      "loss": 0.5764,
      "step": 6762
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.407877409702496e-07,
      "loss": 0.6156,
      "step": 6763
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.40029533229179e-07,
      "loss": 0.6999,
      "step": 6764
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3927335826020795e-07,
      "loss": 0.6813,
      "step": 6765
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3851921621922837e-07,
      "loss": 0.6098,
      "step": 6766
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3776710726172038e-07,
      "loss": 0.6082,
      "step": 6767
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3701703154274104e-07,
      "loss": 0.5326,
      "step": 6768
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3626898921692887e-07,
      "loss": 0.6326,
      "step": 6769
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3552298043850387e-07,
      "loss": 0.5282,
      "step": 6770
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.347790053612663e-07,
      "loss": 0.7181,
      "step": 6771
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3403706413859684e-07,
      "loss": 0.6321,
      "step": 6772
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3329715692345646e-07,
      "loss": 0.7056,
      "step": 6773
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3255928386838756e-07,
      "loss": 0.5884,
      "step": 6774
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.3182344512551403e-07,
      "loss": 0.6438,
      "step": 6775
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.310896408465401e-07,
      "loss": 0.64,
      "step": 6776
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.30357871182748e-07,
      "loss": 0.6925,
      "step": 6777
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.296281362850027e-07,
      "loss": 0.6531,
      "step": 6778
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2890043630375048e-07,
      "loss": 0.7332,
      "step": 6779
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.281747713890158e-07,
      "loss": 0.5574,
      "step": 6780
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2745114169040563e-07,
      "loss": 0.5607,
      "step": 6781
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2672954735710617e-07,
      "loss": 0.5665,
      "step": 6782
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2600998853788404e-07,
      "loss": 0.5736,
      "step": 6783
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2529246538108608e-07,
      "loss": 0.5622,
      "step": 6784
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2457697803464065e-07,
      "loss": 0.5921,
      "step": 6785
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2386352664605527e-07,
      "loss": 0.6452,
      "step": 6786
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2315211136241678e-07,
      "loss": 0.5726,
      "step": 6787
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2244273233039562e-07,
      "loss": 0.6032,
      "step": 6788
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2173538969623922e-07,
      "loss": 0.6884,
      "step": 6789
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.210300836057776e-07,
      "loss": 0.6748,
      "step": 6790
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.2032681420441671e-07,
      "loss": 0.673,
      "step": 6791
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.196255816371472e-07,
      "loss": 0.6564,
      "step": 6792
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1892638604853901e-07,
      "loss": 0.6748,
      "step": 6793
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1822922758274013e-07,
      "loss": 0.6822,
      "step": 6794
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1753410638347785e-07,
      "loss": 0.5831,
      "step": 6795
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1684102259406416e-07,
      "loss": 0.574,
      "step": 6796
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1614997635738701e-07,
      "loss": 0.5777,
      "step": 6797
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1546096781591575e-07,
      "loss": 0.7692,
      "step": 6798
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1477399711169679e-07,
      "loss": 0.5866,
      "step": 6799
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1408906438636236e-07,
      "loss": 0.6841,
      "step": 6800
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.134061697811184e-07,
      "loss": 0.6489,
      "step": 6801
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1272531343675452e-07,
      "loss": 0.6466,
      "step": 6802
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1204649549363845e-07,
      "loss": 0.5554,
      "step": 6803
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1136971609171821e-07,
      "loss": 0.622,
      "step": 6804
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.106949753705222e-07,
      "loss": 0.5801,
      "step": 6805
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.1002227346915695e-07,
      "loss": 0.6558,
      "step": 6806
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.0935161052630816e-07,
      "loss": 0.5649,
      "step": 6807
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.0868298668024523e-07,
      "loss": 0.5712,
      "step": 6808
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.0801640206881237e-07,
      "loss": 0.6022,
      "step": 6809
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.0735185682943628e-07,
      "loss": 0.613,
      "step": 6810
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.0668935109912182e-07,
      "loss": 0.6378,
      "step": 6811
    },
    {
      "epoch": 0.95,
      "learning_rate": 1.0602888501445419e-07,
      "loss": 0.5713,
      "step": 6812
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.053704587115978e-07,
      "loss": 0.6475,
      "step": 6813
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.0471407232629627e-07,
      "loss": 0.5771,
      "step": 6814
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.040597259938736e-07,
      "loss": 0.5531,
      "step": 6815
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.0340741984923075e-07,
      "loss": 0.6727,
      "step": 6816
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.0275715402685237e-07,
      "loss": 0.5964,
      "step": 6817
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.0210892866079902e-07,
      "loss": 0.6209,
      "step": 6818
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.0146274388471045e-07,
      "loss": 0.6479,
      "step": 6819
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.0081859983180786e-07,
      "loss": 0.5142,
      "step": 6820
    },
    {
      "epoch": 0.96,
      "learning_rate": 1.0017649663488949e-07,
      "loss": 0.6126,
      "step": 6821
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.95364344263361e-08,
      "loss": 0.6279,
      "step": 6822
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.889841333810324e-08,
      "loss": 0.6293,
      "step": 6823
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.826243350173015e-08,
      "loss": 0.6434,
      "step": 6824
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.762849504833083e-08,
      "loss": 0.6513,
      "step": 6825
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.699659810860184e-08,
      "loss": 0.5475,
      "step": 6826
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.636674281281788e-08,
      "loss": 0.6575,
      "step": 6827
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.573892929083173e-08,
      "loss": 0.5727,
      "step": 6828
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.511315767207652e-08,
      "loss": 0.6143,
      "step": 6829
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.44894280855635e-08,
      "loss": 0.6394,
      "step": 6830
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.386774065988314e-08,
      "loss": 0.6253,
      "step": 6831
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.324809552320625e-08,
      "loss": 0.6768,
      "step": 6832
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.263049280328063e-08,
      "loss": 0.615,
      "step": 6833
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.201493262743444e-08,
      "loss": 0.6367,
      "step": 6834
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.140141512257284e-08,
      "loss": 0.6323,
      "step": 6835
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.078994041518241e-08,
      "loss": 0.6275,
      "step": 6836
    },
    {
      "epoch": 0.96,
      "learning_rate": 9.018050863132566e-08,
      "loss": 0.5799,
      "step": 6837
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.957311989664764e-08,
      "loss": 0.6243,
      "step": 6838
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.896777433636927e-08,
      "loss": 0.5555,
      "step": 6839
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.836447207529075e-08,
      "loss": 0.6587,
      "step": 6840
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.776321323779147e-08,
      "loss": 0.6411,
      "step": 6841
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.716399794782893e-08,
      "loss": 0.5977,
      "step": 6842
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.656682632893987e-08,
      "loss": 0.6123,
      "step": 6843
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.597169850424136e-08,
      "loss": 0.6387,
      "step": 6844
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.537861459642638e-08,
      "loss": 0.5683,
      "step": 6845
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.478757472776599e-08,
      "loss": 0.6883,
      "step": 6846
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.419857902011386e-08,
      "loss": 0.6196,
      "step": 6847
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.361162759489728e-08,
      "loss": 0.5863,
      "step": 6848
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.302672057312721e-08,
      "loss": 0.5668,
      "step": 6849
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.244385807538835e-08,
      "loss": 0.5849,
      "step": 6850
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.186304022184788e-08,
      "loss": 0.6395,
      "step": 6851
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.128426713224891e-08,
      "loss": 0.6904,
      "step": 6852
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.070753892591265e-08,
      "loss": 0.5984,
      "step": 6853
    },
    {
      "epoch": 0.96,
      "learning_rate": 8.013285572174068e-08,
      "loss": 0.6724,
      "step": 6854
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.956021763821153e-08,
      "loss": 0.627,
      "step": 6855
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.898962479338301e-08,
      "loss": 0.6344,
      "step": 6856
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.842107730489102e-08,
      "loss": 0.6086,
      "step": 6857
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.785457528994955e-08,
      "loss": 0.5944,
      "step": 6858
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.729011886535186e-08,
      "loss": 0.5994,
      "step": 6859
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.672770814746711e-08,
      "loss": 0.6354,
      "step": 6860
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.616734325224473e-08,
      "loss": 0.6583,
      "step": 6861
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.560902429521122e-08,
      "loss": 0.6914,
      "step": 6862
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.505275139147339e-08,
      "loss": 0.5164,
      "step": 6863
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.449852465571284e-08,
      "loss": 0.5661,
      "step": 6864
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.394634420219371e-08,
      "loss": 0.6778,
      "step": 6865
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.339621014475384e-08,
      "loss": 0.6075,
      "step": 6866
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.28481225968114e-08,
      "loss": 0.6633,
      "step": 6867
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.230208167136376e-08,
      "loss": 0.5818,
      "step": 6868
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.175808748098312e-08,
      "loss": 0.6742,
      "step": 6869
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.121614013782307e-08,
      "loss": 0.5127,
      "step": 6870
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.067623975361204e-08,
      "loss": 0.6806,
      "step": 6871
    },
    {
      "epoch": 0.96,
      "learning_rate": 7.013838643965986e-08,
      "loss": 0.5812,
      "step": 6872
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.960258030685119e-08,
      "loss": 0.571,
      "step": 6873
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.906882146565097e-08,
      "loss": 0.5854,
      "step": 6874
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.853711002610119e-08,
      "loss": 0.6061,
      "step": 6875
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.800744609782084e-08,
      "loss": 0.6829,
      "step": 6876
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.7479829790007e-08,
      "loss": 0.6423,
      "step": 6877
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.69542612114371e-08,
      "loss": 0.5901,
      "step": 6878
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.64307404704645e-08,
      "loss": 0.5704,
      "step": 6879
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.590926767501837e-08,
      "loss": 0.5921,
      "step": 6880
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.538984293260941e-08,
      "loss": 0.6464,
      "step": 6881
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.487246635032418e-08,
      "loss": 0.613,
      "step": 6882
    },
    {
      "epoch": 0.96,
      "learning_rate": 6.435713803482623e-08,
      "loss": 0.693,
      "step": 6883
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.384385809235838e-08,
      "loss": 0.6177,
      "step": 6884
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.333262662874151e-08,
      "loss": 0.6187,
      "step": 6885
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.282344374937133e-08,
      "loss": 0.6572,
      "step": 6886
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.231630955922385e-08,
      "loss": 0.6313,
      "step": 6887
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.181122416285323e-08,
      "loss": 0.654,
      "step": 6888
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.130818766438728e-08,
      "loss": 0.6605,
      "step": 6889
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.080720016753639e-08,
      "loss": 0.6687,
      "step": 6890
    },
    {
      "epoch": 0.97,
      "learning_rate": 6.030826177558457e-08,
      "loss": 0.6473,
      "step": 6891
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.981137259139624e-08,
      "loss": 0.657,
      "step": 6892
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.9316532717411665e-08,
      "loss": 0.5854,
      "step": 6893
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.882374225564924e-08,
      "loss": 0.6348,
      "step": 6894
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.833300130770436e-08,
      "loss": 0.6787,
      "step": 6895
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.784430997475165e-08,
      "loss": 0.5676,
      "step": 6896
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.735766835753942e-08,
      "loss": 0.6307,
      "step": 6897
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.687307655639629e-08,
      "loss": 0.7346,
      "step": 6898
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.639053467122901e-08,
      "loss": 0.6195,
      "step": 6899
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.591004280151912e-08,
      "loss": 0.6867,
      "step": 6900
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.5431601046327387e-08,
      "loss": 0.7336,
      "step": 6901
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.495520950429045e-08,
      "loss": 0.6245,
      "step": 6902
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.448086827362531e-08,
      "loss": 0.6878,
      "step": 6903
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.4008577452121516e-08,
      "loss": 0.597,
      "step": 6904
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.3538337137150064e-08,
      "loss": 0.5606,
      "step": 6905
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.307014742565675e-08,
      "loss": 0.6868,
      "step": 6906
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.2604008414166575e-08,
      "loss": 0.6545,
      "step": 6907
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.2139920198780445e-08,
      "loss": 0.547,
      "step": 6908
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.167788287517517e-08,
      "loss": 0.6178,
      "step": 6909
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.121789653860787e-08,
      "loss": 0.5641,
      "step": 6910
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.0759961283911584e-08,
      "loss": 0.7639,
      "step": 6911
    },
    {
      "epoch": 0.97,
      "learning_rate": 5.030407720549413e-08,
      "loss": 0.5207,
      "step": 6912
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.985024439734365e-08,
      "loss": 0.6277,
      "step": 6913
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.939846295302531e-08,
      "loss": 0.6348,
      "step": 6914
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.894873296567793e-08,
      "loss": 0.6235,
      "step": 6915
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.8501054528021787e-08,
      "loss": 0.5792,
      "step": 6916
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.805542773235084e-08,
      "loss": 0.6538,
      "step": 6917
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.761185267053714e-08,
      "loss": 0.6351,
      "step": 6918
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.717032943403088e-08,
      "loss": 0.6273,
      "step": 6919
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.6730858113858133e-08,
      "loss": 0.7561,
      "step": 6920
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.6293438800621984e-08,
      "loss": 0.6496,
      "step": 6921
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.585807158450251e-08,
      "loss": 0.6537,
      "step": 6922
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.5424756555255686e-08,
      "loss": 0.5907,
      "step": 6923
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.499349380221785e-08,
      "loss": 0.607,
      "step": 6924
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.456428341429786e-08,
      "loss": 0.614,
      "step": 6925
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.413712547998494e-08,
      "loss": 0.6645,
      "step": 6926
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.37120200873431e-08,
      "loss": 0.5005,
      "step": 6927
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.3288967324013334e-08,
      "loss": 0.7057,
      "step": 6928
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.286796727721476e-08,
      "loss": 0.5537,
      "step": 6929
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.24490200337424e-08,
      "loss": 0.6136,
      "step": 6930
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.203212567996717e-08,
      "loss": 0.57,
      "step": 6931
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.161728430184031e-08,
      "loss": 0.6995,
      "step": 6932
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.120449598488341e-08,
      "loss": 0.6087,
      "step": 6933
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.079376081420172e-08,
      "loss": 0.5895,
      "step": 6934
    },
    {
      "epoch": 0.97,
      "learning_rate": 4.038507887447196e-08,
      "loss": 0.6872,
      "step": 6935
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.997845024995117e-08,
      "loss": 0.561,
      "step": 6936
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.957387502447119e-08,
      "loss": 0.5737,
      "step": 6937
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.9171353281440835e-08,
      "loss": 0.6705,
      "step": 6938
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.877088510384486e-08,
      "loss": 0.6156,
      "step": 6939
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.83724705742472e-08,
      "loss": 0.6418,
      "step": 6940
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.79761097747855e-08,
      "loss": 0.6664,
      "step": 6941
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.758180278717438e-08,
      "loss": 0.6317,
      "step": 6942
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.7189549692707716e-08,
      "loss": 0.5995,
      "step": 6943
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.6799350572253034e-08,
      "loss": 0.4981,
      "step": 6944
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.6411205506254874e-08,
      "loss": 0.6589,
      "step": 6945
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.602511457473479e-08,
      "loss": 0.5922,
      "step": 6946
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.5641077857292425e-08,
      "loss": 0.6313,
      "step": 6947
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.525909543310002e-08,
      "loss": 0.6458,
      "step": 6948
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.487916738091124e-08,
      "loss": 0.5914,
      "step": 6949
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.4501293779052316e-08,
      "loss": 0.651,
      "step": 6950
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.4125474705426484e-08,
      "loss": 0.6498,
      "step": 6951
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.375171023751511e-08,
      "loss": 0.6898,
      "step": 6952
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.338000045237433e-08,
      "loss": 0.5137,
      "step": 6953
    },
    {
      "epoch": 0.97,
      "learning_rate": 3.301034542663839e-08,
      "loss": 0.6034,
      "step": 6954
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.264274523651523e-08,
      "loss": 0.6363,
      "step": 6955
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.2277199957793105e-08,
      "loss": 0.6215,
      "step": 6956
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.191370966583285e-08,
      "loss": 0.5984,
      "step": 6957
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.1552274435573404e-08,
      "loss": 0.6463,
      "step": 6958
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.119289434152961e-08,
      "loss": 0.6668,
      "step": 6959
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.0835569457793313e-08,
      "loss": 0.6444,
      "step": 6960
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.0480299858032244e-08,
      "loss": 0.6698,
      "step": 6961
    },
    {
      "epoch": 0.98,
      "learning_rate": 3.012708561548894e-08,
      "loss": 0.6278,
      "step": 6962
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.9775926802984022e-08,
      "loss": 0.5621,
      "step": 6963
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.9426823492914038e-08,
      "loss": 0.582,
      "step": 6964
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.9079775757251406e-08,
      "loss": 0.6223,
      "step": 6965
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.8734783667545563e-08,
      "loss": 0.6455,
      "step": 6966
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.8391847294920727e-08,
      "loss": 0.7048,
      "step": 6967
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.805096671007812e-08,
      "loss": 0.6014,
      "step": 6968
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.771214198329597e-08,
      "loss": 0.5276,
      "step": 6969
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.737537318442618e-08,
      "loss": 0.6185,
      "step": 6970
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.7040660382899875e-08,
      "loss": 0.5873,
      "step": 6971
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.670800364772297e-08,
      "loss": 0.6237,
      "step": 6972
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.6377403047476158e-08,
      "loss": 0.6356,
      "step": 6973
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.6048858650317144e-08,
      "loss": 0.5375,
      "step": 6974
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.5722370523981744e-08,
      "loss": 0.5829,
      "step": 6975
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.5397938735779448e-08,
      "loss": 0.5988,
      "step": 6976
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.5075563352594533e-08,
      "loss": 0.6488,
      "step": 6977
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.4755244440892723e-08,
      "loss": 0.5817,
      "step": 6978
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.443698206670897e-08,
      "loss": 0.5846,
      "step": 6979
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.4120776295659675e-08,
      "loss": 0.6309,
      "step": 6980
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.3806627192933806e-08,
      "loss": 0.569,
      "step": 6981
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.3494534823299554e-08,
      "loss": 0.6296,
      "step": 6982
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.318449925109656e-08,
      "loss": 0.6266,
      "step": 6983
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.2876520540244806e-08,
      "loss": 0.6525,
      "step": 6984
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.257059875423795e-08,
      "loss": 0.6205,
      "step": 6985
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.2266733956145536e-08,
      "loss": 0.6118,
      "step": 6986
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.1964926208615233e-08,
      "loss": 0.5956,
      "step": 6987
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.166517557386727e-08,
      "loss": 0.6267,
      "step": 6988
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.136748211369999e-08,
      "loss": 0.6435,
      "step": 6989
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.107184588948763e-08,
      "loss": 0.543,
      "step": 6990
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.0778266962179216e-08,
      "loss": 0.5709,
      "step": 6991
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.0486745392300777e-08,
      "loss": 0.6646,
      "step": 6992
    },
    {
      "epoch": 0.98,
      "learning_rate": 2.0197281239952015e-08,
      "loss": 0.6389,
      "step": 6993
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.990987456481186e-08,
      "loss": 0.6954,
      "step": 6994
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.962452542613291e-08,
      "loss": 0.6441,
      "step": 6995
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.934123388274367e-08,
      "loss": 0.6634,
      "step": 6996
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.905999999304853e-08,
      "loss": 0.6003,
      "step": 6997
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.878082381502666e-08,
      "loss": 0.6383,
      "step": 6998
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.8503705406236472e-08,
      "loss": 0.6322,
      "step": 6999
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.8228644823808928e-08,
      "loss": 0.671,
      "step": 7000
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.795564212445089e-08,
      "loss": 0.6272,
      "step": 7001
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.7684697364446224e-08,
      "loss": 0.5985,
      "step": 7002
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.7415810599654693e-08,
      "loss": 0.6148,
      "step": 7003
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.714898188551084e-08,
      "loss": 0.6368,
      "step": 7004
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.6884211277024e-08,
      "loss": 0.6537,
      "step": 7005
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.662149882878161e-08,
      "loss": 0.6675,
      "step": 7006
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.6360844594945913e-08,
      "loss": 0.6211,
      "step": 7007
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.6102248629252803e-08,
      "loss": 0.7022,
      "step": 7008
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.5845710985016304e-08,
      "loss": 0.695,
      "step": 7009
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.5591231715125222e-08,
      "loss": 0.6505,
      "step": 7010
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.5338810872045362e-08,
      "loss": 0.6201,
      "step": 7011
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.50884485078151e-08,
      "loss": 0.5833,
      "step": 7012
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.4840144674050926e-08,
      "loss": 0.6749,
      "step": 7013
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.4593899421943003e-08,
      "loss": 0.5832,
      "step": 7014
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.4349712802259608e-08,
      "loss": 0.5755,
      "step": 7015
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.4107584865343804e-08,
      "loss": 0.6347,
      "step": 7016
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.386751566111233e-08,
      "loss": 0.5639,
      "step": 7017
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.3629505239058927e-08,
      "loss": 0.6536,
      "step": 7018
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.3393553648254343e-08,
      "loss": 0.6286,
      "step": 7019
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.3159660937340779e-08,
      "loss": 0.6956,
      "step": 7020
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.2927827154540774e-08,
      "loss": 0.5313,
      "step": 7021
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.2698052347649426e-08,
      "loss": 0.607,
      "step": 7022
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.2470336564037732e-08,
      "loss": 0.6896,
      "step": 7023
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.2244679850651475e-08,
      "loss": 0.6033,
      "step": 7024
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.2021082254015659e-08,
      "loss": 0.5644,
      "step": 7025
    },
    {
      "epoch": 0.98,
      "learning_rate": 1.1799543820226745e-08,
      "loss": 0.6176,
      "step": 7026
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.1580064594957086e-08,
      "loss": 0.6931,
      "step": 7027
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.1362644623456043e-08,
      "loss": 0.5678,
      "step": 7028
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.114728395054776e-08,
      "loss": 0.6827,
      "step": 7029
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.0933982620633388e-08,
      "loss": 0.5884,
      "step": 7030
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.0722740677685529e-08,
      "loss": 0.6682,
      "step": 7031
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.0513558165257121e-08,
      "loss": 0.6203,
      "step": 7032
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.0306435126471448e-08,
      "loss": 0.7385,
      "step": 7033
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.0101371604032128e-08,
      "loss": 0.5626,
      "step": 7034
    },
    {
      "epoch": 0.99,
      "learning_rate": 9.898367640215344e-09,
      "loss": 0.6056,
      "step": 7035
    },
    {
      "epoch": 0.99,
      "learning_rate": 9.697423276872065e-09,
      "loss": 0.5568,
      "step": 7036
    },
    {
      "epoch": 0.99,
      "learning_rate": 9.49853855543137e-09,
      "loss": 0.508,
      "step": 7037
    },
    {
      "epoch": 0.99,
      "learning_rate": 9.301713516894905e-09,
      "loss": 0.5826,
      "step": 7038
    },
    {
      "epoch": 0.99,
      "learning_rate": 9.106948201841326e-09,
      "loss": 0.5273,
      "step": 7039
    },
    {
      "epoch": 0.99,
      "learning_rate": 8.914242650424066e-09,
      "loss": 0.5751,
      "step": 7040
    },
    {
      "epoch": 0.99,
      "learning_rate": 8.723596902373566e-09,
      "loss": 0.7029,
      "step": 7041
    },
    {
      "epoch": 0.99,
      "learning_rate": 8.535010996992831e-09,
      "loss": 0.7034,
      "step": 7042
    },
    {
      "epoch": 0.99,
      "learning_rate": 8.348484973160764e-09,
      "loss": 0.6554,
      "step": 7043
    },
    {
      "epoch": 0.99,
      "learning_rate": 8.164018869334379e-09,
      "loss": 0.6339,
      "step": 7044
    },
    {
      "epoch": 0.99,
      "learning_rate": 7.981612723542143e-09,
      "loss": 0.561,
      "step": 7045
    },
    {
      "epoch": 0.99,
      "learning_rate": 7.801266573390642e-09,
      "loss": 0.573,
      "step": 7046
    },
    {
      "epoch": 0.99,
      "learning_rate": 7.622980456060136e-09,
      "loss": 0.6858,
      "step": 7047
    },
    {
      "epoch": 0.99,
      "learning_rate": 7.4467544083067776e-09,
      "loss": 0.6708,
      "step": 7048
    },
    {
      "epoch": 0.99,
      "learning_rate": 7.272588466462616e-09,
      "loss": 0.6097,
      "step": 7049
    },
    {
      "epoch": 0.99,
      "learning_rate": 7.100482666434483e-09,
      "loss": 0.6338,
      "step": 7050
    },
    {
      "epoch": 0.99,
      "learning_rate": 6.930437043705107e-09,
      "loss": 0.5894,
      "step": 7051
    },
    {
      "epoch": 0.99,
      "learning_rate": 6.762451633329781e-09,
      "loss": 0.656,
      "step": 7052
    },
    {
      "epoch": 0.99,
      "learning_rate": 6.596526469941911e-09,
      "loss": 0.5997,
      "step": 7053
    },
    {
      "epoch": 0.99,
      "learning_rate": 6.432661587750799e-09,
      "loss": 0.6935,
      "step": 7054
    },
    {
      "epoch": 0.99,
      "learning_rate": 6.2708570205372025e-09,
      "loss": 0.6224,
      "step": 7055
    },
    {
      "epoch": 0.99,
      "learning_rate": 6.111112801661101e-09,
      "loss": 0.6426,
      "step": 7056
    },
    {
      "epoch": 0.99,
      "learning_rate": 5.953428964055042e-09,
      "loss": 0.5938,
      "step": 7057
    },
    {
      "epoch": 0.99,
      "learning_rate": 5.7978055402285734e-09,
      "loss": 0.6589,
      "step": 7058
    },
    {
      "epoch": 0.99,
      "learning_rate": 5.644242562264923e-09,
      "loss": 0.6824,
      "step": 7059
    },
    {
      "epoch": 0.99,
      "learning_rate": 5.49274006182321e-09,
      "loss": 0.5966,
      "step": 7060
    },
    {
      "epoch": 0.99,
      "learning_rate": 5.3432980701384475e-09,
      "loss": 0.6071,
      "step": 7061
    },
    {
      "epoch": 0.99,
      "learning_rate": 5.1959166180204354e-09,
      "loss": 0.5742,
      "step": 7062
    },
    {
      "epoch": 0.99,
      "learning_rate": 5.050595735852648e-09,
      "loss": 0.5844,
      "step": 7063
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.907335453595563e-09,
      "loss": 0.6313,
      "step": 7064
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.766135800785554e-09,
      "loss": 0.5641,
      "step": 7065
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.626996806531558e-09,
      "loss": 0.5582,
      "step": 7066
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.4899184995195186e-09,
      "loss": 0.5451,
      "step": 7067
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.354900908010162e-09,
      "loss": 0.6498,
      "step": 7068
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.22194405983789e-09,
      "loss": 0.6405,
      "step": 7069
    },
    {
      "epoch": 0.99,
      "learning_rate": 4.091047982416329e-09,
      "loss": 0.6707,
      "step": 7070
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.962212702729451e-09,
      "loss": 0.66,
      "step": 7071
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.83543824733823e-09,
      "loss": 0.5652,
      "step": 7072
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.7107246423806475e-09,
      "loss": 0.6121,
      "step": 7073
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.5880719135683583e-09,
      "loss": 0.5973,
      "step": 7074
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.467480086185582e-09,
      "loss": 0.6235,
      "step": 7075
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.3489491850957624e-09,
      "loss": 0.549,
      "step": 7076
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.232479234734909e-09,
      "loss": 0.6701,
      "step": 7077
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.118070259116035e-09,
      "loss": 0.6145,
      "step": 7078
    },
    {
      "epoch": 0.99,
      "learning_rate": 3.0057222818258292e-09,
      "loss": 0.5579,
      "step": 7079
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.8954353260257638e-09,
      "loss": 0.6513,
      "step": 7080
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.787209414453207e-09,
      "loss": 0.6468,
      "step": 7081
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.68104456942031e-09,
      "loss": 0.6945,
      "step": 7082
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.5769408128151207e-09,
      "loss": 0.6735,
      "step": 7083
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.47489816610047e-09,
      "loss": 0.6028,
      "step": 7084
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.374916650312864e-09,
      "loss": 0.6456,
      "step": 7085
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.2769962860647032e-09,
      "loss": 0.6234,
      "step": 7086
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.1811370935442835e-09,
      "loss": 0.6172,
      "step": 7087
    },
    {
      "epoch": 0.99,
      "learning_rate": 2.0873390925146843e-09,
      "loss": 0.666,
      "step": 7088
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.9956023023126604e-09,
      "loss": 0.6129,
      "step": 7089
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.905926741851971e-09,
      "loss": 0.704,
      "step": 7090
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.8183124296200505e-09,
      "loss": 0.5913,
      "step": 7091
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.732759383680227e-09,
      "loss": 0.6269,
      "step": 7092
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.6492676216695036e-09,
      "loss": 0.6435,
      "step": 7093
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.5678371608029986e-09,
      "loss": 0.5217,
      "step": 7094
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.4884680178661737e-09,
      "loss": 0.5953,
      "step": 7095
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.4111602092226062e-09,
      "loss": 0.7184,
      "step": 7096
    },
    {
      "epoch": 0.99,
      "learning_rate": 1.3359137508117681e-09,
      "loss": 0.6266,
      "step": 7097
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.2627286581468057e-09,
      "loss": 0.5908,
      "step": 7098
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.1916049463134293e-09,
      "loss": 0.5905,
      "step": 7099
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.1225426299776854e-09,
      "loss": 0.561,
      "step": 7100
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.0555417233759634e-09,
      "loss": 0.5911,
      "step": 7101
    },
    {
      "epoch": 1.0,
      "learning_rate": 9.906022403216586e-10,
      "loss": 0.7701,
      "step": 7102
    },
    {
      "epoch": 1.0,
      "learning_rate": 9.277241942040605e-10,
      "loss": 0.5559,
      "step": 7103
    },
    {
      "epoch": 1.0,
      "learning_rate": 8.669075979850228e-10,
      "loss": 0.6483,
      "step": 7104
    },
    {
      "epoch": 1.0,
      "learning_rate": 8.081524642045146e-10,
      "loss": 0.5796,
      "step": 7105
    },
    {
      "epoch": 1.0,
      "learning_rate": 7.514588049728489e-10,
      "loss": 0.6331,
      "step": 7106
    },
    {
      "epoch": 1.0,
      "learning_rate": 6.968266319806738e-10,
      "loss": 0.6903,
      "step": 7107
    },
    {
      "epoch": 1.0,
      "learning_rate": 6.442559564912021e-10,
      "loss": 0.6478,
      "step": 7108
    },
    {
      "epoch": 1.0,
      "learning_rate": 5.937467893402105e-10,
      "loss": 0.5928,
      "step": 7109
    },
    {
      "epoch": 1.0,
      "learning_rate": 5.452991409438113e-10,
      "loss": 0.5615,
      "step": 7110
    },
    {
      "epoch": 1.0,
      "learning_rate": 4.989130212884608e-10,
      "loss": 0.5777,
      "step": 7111
    },
    {
      "epoch": 1.0,
      "learning_rate": 4.5458843993761994e-10,
      "loss": 0.5652,
      "step": 7112
    },
    {
      "epoch": 1.0,
      "learning_rate": 4.1232540602953455e-10,
      "loss": 0.6071,
      "step": 7113
    },
    {
      "epoch": 1.0,
      "learning_rate": 3.7212392827723485e-10,
      "loss": 0.6976,
      "step": 7114
    },
    {
      "epoch": 1.0,
      "learning_rate": 3.3398401496964606e-10,
      "loss": 0.6391,
      "step": 7115
    },
    {
      "epoch": 1.0,
      "learning_rate": 2.9790567396825734e-10,
      "loss": 0.6947,
      "step": 7116
    },
    {
      "epoch": 1.0,
      "learning_rate": 2.6388891271156294e-10,
      "loss": 0.6433,
      "step": 7117
    },
    {
      "epoch": 1.0,
      "learning_rate": 2.3193373821395194e-10,
      "loss": 0.6331,
      "step": 7118
    },
    {
      "epoch": 1.0,
      "learning_rate": 2.0204015706237757e-10,
      "loss": 0.6324,
      "step": 7119
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.7420817541968781e-10,
      "loss": 0.5916,
      "step": 7120
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.484377990246255e-10,
      "loss": 0.6725,
      "step": 7121
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.247290331884976e-10,
      "loss": 0.553,
      "step": 7122
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.0308188280072629e-10,
      "loss": 0.6091,
      "step": 7123
    },
    {
      "epoch": 1.0,
      "learning_rate": 8.349635232440811e-11,
      "loss": 0.6073,
      "step": 7124
    },
    {
      "epoch": 1.0,
      "learning_rate": 6.597244579631401e-11,
      "loss": 0.5981,
      "step": 7125
    },
    {
      "epoch": 1.0,
      "learning_rate": 5.0510166829109695e-11,
      "loss": 0.6628,
      "step": 7126
    },
    {
      "epoch": 1.0,
      "learning_rate": 3.71095186113557e-11,
      "loss": 0.6657,
      "step": 7127
    },
    {
      "epoch": 1.0,
      "learning_rate": 2.5770503906397126e-11,
      "loss": 0.5847,
      "step": 7128
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.649312505014322e-11,
      "loss": 0.4595,
      "step": 7129
    },
    {
      "epoch": 1.0,
      "learning_rate": 9.27738395661848e-12,
      "loss": 0.647,
      "step": 7130
    },
    {
      "epoch": 1.0,
      "learning_rate": 4.123282112411531e-12,
      "loss": 0.6341,
      "step": 7131
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.030820581116032e-12,
      "loss": 0.57,
      "step": 7132
    },
    {
      "epoch": 1.0,
      "learning_rate": 0.0,
      "loss": 0.6393,
      "step": 7133
    },
    {
      "epoch": 1.0,
      "step": 7133,
      "total_flos": 3425827097935872.0,
      "train_loss": 0.6731399065830188,
      "train_runtime": 128955.7117,
      "train_samples_per_second": 7.079,
      "train_steps_per_second": 0.055
    }
  ],
  "logging_steps": 1.0,
  "max_steps": 7133,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 1,
  "save_steps": 10000,
  "total_flos": 3425827097935872.0,
  "train_batch_size": 16,
  "trial_name": null,
  "trial_params": null
}