xlm-roberta-large-lemma-es / trainer_state.json

uploading model files

6b46ae3 verified about 1 year ago

10.5 kB

	{
	"best_metric": 0.9590698631546456,
	"best_model_checkpoint": ".//debugged_es_gsd_ses_udpipe_8_0.1_0.00002_20_04-22-24_22-38/checkpoint-32020",
	"epoch": 19.99968779269435,
	"global_step": 32020,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 1.0,
	"learning_rate": 1.6659729448491154e-05,
	"loss": 0.9658,
	"step": 1601
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.9632624280173934,
	"eval_f1": 0.9191161314259801,
	"eval_loss": 0.153659850358963,
	"eval_precision": 0.9176029962546817,
	"eval_recall": 0.9206342651856134,
	"eval_runtime": 12.5305,
	"eval_samples_per_second": 127.848,
	"eval_steps_per_second": 16.041,
	"step": 1601
	},
	{
	"epoch": 2.0,
	"learning_rate": 1.9149445145856868e-05,
	"loss": 0.118,
	"step": 3202
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.9749441767540251,
	"eval_f1": 0.9426544669476715,
	"eval_loss": 0.09417378902435303,
	"eval_precision": 0.9387746744205094,
	"eval_recall": 0.9465664615765784,
	"eval_runtime": 12.5537,
	"eval_samples_per_second": 127.612,
	"eval_steps_per_second": 16.011,
	"step": 3202
	},
	{
	"epoch": 3.0,
	"learning_rate": 1.8085587082198154e-05,
	"loss": 0.0727,
	"step": 4803
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.9784228463979316,
	"eval_f1": 0.9501459044017919,
	"eval_loss": 0.07907041162252426,
	"eval_precision": 0.9457148701165883,
	"eval_recall": 0.9546186563158112,
	"eval_runtime": 12.5508,
	"eval_samples_per_second": 127.642,
	"eval_steps_per_second": 16.015,
	"step": 4803
	},
	{
	"epoch": 4.0,
	"learning_rate": 1.702172901853944e-05,
	"loss": 0.0479,
	"step": 6404
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.9803267128922317,
	"eval_f1": 0.9543441998393706,
	"eval_loss": 0.07787933200597763,
	"eval_precision": 0.9518938460274423,
	"eval_recall": 0.9568072015526283,
	"eval_runtime": 12.5524,
	"eval_samples_per_second": 127.625,
	"eval_steps_per_second": 16.013,
	"step": 6404
	},
	{
	"epoch": 5.0,
	"learning_rate": 1.5957870954880726e-05,
	"loss": 0.0342,
	"step": 8005
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.9791984957104243,
	"eval_f1": 0.951995205720072,
	"eval_loss": 0.08329462260007858,
	"eval_precision": 0.9528418962521717,
	"eval_recall": 0.9511500185819879,
	"eval_runtime": 12.5712,
	"eval_samples_per_second": 127.435,
	"eval_steps_per_second": 15.989,
	"step": 8005
	},
	{
	"epoch": 6.0,
	"learning_rate": 1.489401289122201e-05,
	"loss": 0.0233,
	"step": 9606
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.9811023622047244,
	"eval_f1": 0.956315778633658,
	"eval_loss": 0.08429370075464249,
	"eval_precision": 0.9539776462853385,
	"eval_recall": 0.9586654003386051,
	"eval_runtime": 12.5589,
	"eval_samples_per_second": 127.559,
	"eval_steps_per_second": 16.005,
	"step": 9606
	},
	{
	"epoch": 7.0,
	"learning_rate": 1.3830154827563293e-05,
	"loss": 0.0168,
	"step": 11207
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.9807262898107886,
	"eval_f1": 0.9542881840821619,
	"eval_loss": 0.09856697916984558,
	"eval_precision": 0.9512925728354534,
	"eval_recall": 0.9573027212288888,
	"eval_runtime": 12.7018,
	"eval_samples_per_second": 126.124,
	"eval_steps_per_second": 15.825,
	"step": 11207
	},
	{
	"epoch": 8.0,
	"learning_rate": 1.276629676390458e-05,
	"loss": 0.0121,
	"step": 12808
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.9815254436479022,
	"eval_f1": 0.9566986580077682,
	"eval_loss": 0.10770849883556366,
	"eval_precision": 0.9522952295229523,
	"eval_recall": 0.9611429987199075,
	"eval_runtime": 12.5218,
	"eval_samples_per_second": 127.937,
	"eval_steps_per_second": 16.052,
	"step": 12808
	},
	{
	"epoch": 9.0,
	"learning_rate": 1.1702438700245863e-05,
	"loss": 0.0102,
	"step": 14409
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.9800916676460218,
	"eval_f1": 0.9545660129106535,
	"eval_loss": 0.12106840312480927,
	"eval_precision": 0.9505015353121802,
	"eval_recall": 0.9586654003386051,
	"eval_runtime": 12.5371,
	"eval_samples_per_second": 127.781,
	"eval_steps_per_second": 16.032,
	"step": 14409
	},
	{
	"epoch": 10.0,
	"learning_rate": 1.063858063658715e-05,
	"loss": 0.0073,
	"step": 16010
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.9807732988600305,
	"eval_f1": 0.9554837514663813,
	"eval_loss": 0.12773701548576355,
	"eval_precision": 0.9524454291810274,
	"eval_recall": 0.95854152041954,
	"eval_runtime": 12.7247,
	"eval_samples_per_second": 125.897,
	"eval_steps_per_second": 15.796,
	"step": 16010
	},
	{
	"epoch": 11.0,
	"learning_rate": 9.574722572928434e-06,
	"loss": 0.0068,
	"step": 17611
	},
	{
	"epoch": 11.0,
	"eval_accuracy": 0.9810083441062405,
	"eval_f1": 0.9555354647817867,
	"eval_loss": 0.13228633999824524,
	"eval_precision": 0.9509631507913787,
	"eval_recall": 0.9601519593673865,
	"eval_runtime": 12.7411,
	"eval_samples_per_second": 125.735,
	"eval_steps_per_second": 15.776,
	"step": 17611
	},
	{
	"epoch": 12.0,
	"learning_rate": 8.51086450926972e-06,
	"loss": 0.0051,
	"step": 19212
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.9815724526971442,
	"eval_f1": 0.95762694407251,
	"eval_loss": 0.12687553465366364,
	"eval_precision": 0.9554422887208155,
	"eval_recall": 0.9598216129165462,
	"eval_runtime": 12.7033,
	"eval_samples_per_second": 126.109,
	"eval_steps_per_second": 15.823,
	"step": 19212
	},
	{
	"epoch": 13.0,
	"learning_rate": 7.447006445611005e-06,
	"loss": 0.0035,
	"step": 20813
	},
	{
	"epoch": 13.0,
	"eval_accuracy": 0.982089552238806,
	"eval_f1": 0.9584635630860339,
	"eval_loss": 0.13741779327392578,
	"eval_precision": 0.9545771042391972,
	"eval_recall": 0.9623817979105587,
	"eval_runtime": 12.6726,
	"eval_samples_per_second": 126.414,
	"eval_steps_per_second": 15.861,
	"step": 20813
	},
	{
	"epoch": 14.0,
	"learning_rate": 6.38314838195229e-06,
	"loss": 0.0027,
	"step": 22414
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.9823481020096368,
	"eval_f1": 0.9589226973684211,
	"eval_loss": 0.14472806453704834,
	"eval_precision": 0.9548785980428285,
	"eval_recall": 0.9630011975058843,
	"eval_runtime": 12.6834,
	"eval_samples_per_second": 126.306,
	"eval_steps_per_second": 15.847,
	"step": 22414
	},
	{
	"epoch": 15.0,
	"learning_rate": 5.319290318293575e-06,
	"loss": 0.003,
	"step": 24015
	},
	{
	"epoch": 15.0,
	"eval_accuracy": 0.9819015160418381,
	"eval_f1": 0.9580811200329422,
	"eval_loss": 0.1390347182750702,
	"eval_precision": 0.955405904816655,
	"eval_recall": 0.9607713589627122,
	"eval_runtime": 13.4492,
	"eval_samples_per_second": 119.115,
	"eval_steps_per_second": 14.945,
	"step": 24015
	},
	{
	"epoch": 16.0,
	"learning_rate": 4.25543225463486e-06,
	"loss": 0.0025,
	"step": 25616
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.9812433893524504,
	"eval_f1": 0.9562028758600799,
	"eval_loss": 0.1537328064441681,
	"eval_precision": 0.9540801644398766,
	"eval_recall": 0.9583350538877647,
	"eval_runtime": 12.9219,
	"eval_samples_per_second": 123.976,
	"eval_steps_per_second": 15.555,
	"step": 25616
	},
	{
	"epoch": 17.0,
	"learning_rate": 3.191574190976145e-06,
	"loss": 0.0029,
	"step": 27217
	},
	{
	"epoch": 17.0,
	"eval_accuracy": 0.982207074861911,
	"eval_f1": 0.9580219463487947,
	"eval_loss": 0.15050023794174194,
	"eval_precision": 0.9552882246674331,
	"eval_recall": 0.9607713589627122,
	"eval_runtime": 12.7344,
	"eval_samples_per_second": 125.801,
	"eval_steps_per_second": 15.784,
	"step": 27217
	},
	{
	"epoch": 18.0,
	"learning_rate": 2.12771612731743e-06,
	"loss": 0.0022,
	"step": 28818
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.9823245974850159,
	"eval_f1": 0.9589283509609449,
	"eval_loss": 0.14898641407489777,
	"eval_precision": 0.955703211517165,
	"eval_recall": 0.9621753313787835,
	"eval_runtime": 12.8609,
	"eval_samples_per_second": 124.563,
	"eval_steps_per_second": 15.629,
	"step": 28818
	},
	{
	"epoch": 19.0,
	"learning_rate": 1.063858063658715e-06,
	"loss": 0.0021,
	"step": 30419
	},
	{
	"epoch": 19.0,
	"eval_accuracy": 0.982019038664943,
	"eval_f1": 0.9582288369033425,
	"eval_loss": 0.15266422927379608,
	"eval_precision": 0.954070981210856,
	"eval_recall": 0.9624230912169137,
	"eval_runtime": 12.7956,
	"eval_samples_per_second": 125.199,
	"eval_steps_per_second": 15.709,
	"step": 30419
	},
	{
	"epoch": 20.0,
	"learning_rate": 0.0,
	"loss": 0.0018,
	"step": 32020
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.9824421201081208,
	"eval_f1": 0.9590698631546456,
	"eval_loss": 0.15378834307193756,
	"eval_precision": 0.9559028632373452,
	"eval_recall": 0.9622579179914936,
	"eval_runtime": 12.9229,
	"eval_samples_per_second": 123.966,
	"eval_steps_per_second": 15.554,
	"step": 32020
	},
	{
	"epoch": 20.0,
	"step": 32020,
	"total_flos": 2.8281562629741216e+16,
	"train_loss": 0.06704426395528247,
	"train_runtime": 9262.2202,
	"train_samples_per_second": 27.663,
	"train_steps_per_second": 3.457
	}
	],
	"max_steps": 32020,
	"num_train_epochs": 20,
	"total_flos": 2.8281562629741216e+16,
	"trial_name": null,
	"trial_params": null
	}