paul

End of training

351d245 almost 2 years ago

37.4 kB

	{
	"best_metric": 0.8440366972477065,
	"best_model_checkpoint": "microsoft-resnet-50-cartoon-emotion-detection/checkpoint-528",
	"epoch": 79.96969696969697,
	"global_step": 640,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.97,
	"eval_accuracy": 0.22935779816513763,
	"eval_f1": 0.21647331951741566,
	"eval_loss": 1.3854628801345825,
	"eval_precision": 0.2697355008315897,
	"eval_recall": 0.22935779816513763,
	"eval_runtime": 6.0845,
	"eval_samples_per_second": 17.914,
	"eval_steps_per_second": 0.329,
	"step": 8
	},
	{
	"epoch": 1.24,
	"learning_rate": 1.8750000000000002e-05,
	"loss": 1.4222,
	"step": 10
	},
	{
	"epoch": 1.97,
	"eval_accuracy": 0.25688073394495414,
	"eval_f1": 0.25434987070599063,
	"eval_loss": 1.3791918754577637,
	"eval_precision": 0.2807708571335123,
	"eval_recall": 0.25688073394495414,
	"eval_runtime": 4.2925,
	"eval_samples_per_second": 25.393,
	"eval_steps_per_second": 0.466,
	"step": 16
	},
	{
	"epoch": 2.48,
	"learning_rate": 3.7500000000000003e-05,
	"loss": 1.4183,
	"step": 20
	},
	{
	"epoch": 2.97,
	"eval_accuracy": 0.3853211009174312,
	"eval_f1": 0.3511144563688655,
	"eval_loss": 1.3646042346954346,
	"eval_precision": 0.4102155235182758,
	"eval_recall": 0.3853211009174312,
	"eval_runtime": 4.3579,
	"eval_samples_per_second": 25.012,
	"eval_steps_per_second": 0.459,
	"step": 24
	},
	{
	"epoch": 3.73,
	"learning_rate": 5.625e-05,
	"loss": 1.4097,
	"step": 30
	},
	{
	"epoch": 3.97,
	"eval_accuracy": 0.41284403669724773,
	"eval_f1": 0.32452248836490605,
	"eval_loss": 1.3562716245651245,
	"eval_precision": 0.5062447369587377,
	"eval_recall": 0.41284403669724773,
	"eval_runtime": 4.3612,
	"eval_samples_per_second": 24.993,
	"eval_steps_per_second": 0.459,
	"step": 32
	},
	{
	"epoch": 4.97,
	"learning_rate": 7.500000000000001e-05,
	"loss": 1.3944,
	"step": 40
	},
	{
	"epoch": 4.97,
	"eval_accuracy": 0.4036697247706422,
	"eval_f1": 0.293905028882093,
	"eval_loss": 1.3461558818817139,
	"eval_precision": 0.3927443217900042,
	"eval_recall": 0.4036697247706422,
	"eval_runtime": 4.4159,
	"eval_samples_per_second": 24.684,
	"eval_steps_per_second": 0.453,
	"step": 40
	},
	{
	"epoch": 5.97,
	"eval_accuracy": 0.4036697247706422,
	"eval_f1": 0.2840541721275666,
	"eval_loss": 1.322252631187439,
	"eval_precision": 0.5152005756431013,
	"eval_recall": 0.4036697247706422,
	"eval_runtime": 4.2725,
	"eval_samples_per_second": 25.512,
	"eval_steps_per_second": 0.468,
	"step": 48
	},
	{
	"epoch": 6.24,
	"learning_rate": 9.375e-05,
	"loss": 1.411,
	"step": 50
	},
	{
	"epoch": 6.97,
	"eval_accuracy": 0.41284403669724773,
	"eval_f1": 0.29851761513413444,
	"eval_loss": 1.304025411605835,
	"eval_precision": 0.44039013993142434,
	"eval_recall": 0.41284403669724773,
	"eval_runtime": 4.4737,
	"eval_samples_per_second": 24.365,
	"eval_steps_per_second": 0.447,
	"step": 56
	},
	{
	"epoch": 7.48,
	"learning_rate": 0.0001125,
	"loss": 1.346,
	"step": 60
	},
	{
	"epoch": 7.97,
	"eval_accuracy": 0.4954128440366973,
	"eval_f1": 0.4092687533729088,
	"eval_loss": 1.2699785232543945,
	"eval_precision": 0.49603902723168775,
	"eval_recall": 0.4954128440366973,
	"eval_runtime": 4.5079,
	"eval_samples_per_second": 24.18,
	"eval_steps_per_second": 0.444,
	"step": 64
	},
	{
	"epoch": 8.73,
	"learning_rate": 0.00011875000000000001,
	"loss": 1.3031,
	"step": 70
	},
	{
	"epoch": 8.97,
	"eval_accuracy": 0.5596330275229358,
	"eval_f1": 0.46723852012270245,
	"eval_loss": 1.2149937152862549,
	"eval_precision": 0.5440134711415631,
	"eval_recall": 0.5596330275229358,
	"eval_runtime": 4.3712,
	"eval_samples_per_second": 24.936,
	"eval_steps_per_second": 0.458,
	"step": 72
	},
	{
	"epoch": 9.97,
	"learning_rate": 0.00011666666666666667,
	"loss": 1.2371,
	"step": 80
	},
	{
	"epoch": 9.97,
	"eval_accuracy": 0.5963302752293578,
	"eval_f1": 0.5100508405791544,
	"eval_loss": 1.1580270528793335,
	"eval_precision": 0.5659333353788879,
	"eval_recall": 0.5963302752293578,
	"eval_runtime": 4.2133,
	"eval_samples_per_second": 25.87,
	"eval_steps_per_second": 0.475,
	"step": 80
	},
	{
	"epoch": 10.97,
	"eval_accuracy": 0.6055045871559633,
	"eval_f1": 0.5211004609031267,
	"eval_loss": 1.066982388496399,
	"eval_precision": 0.7279186904119446,
	"eval_recall": 0.6055045871559633,
	"eval_runtime": 14.5277,
	"eval_samples_per_second": 7.503,
	"eval_steps_per_second": 0.138,
	"step": 88
	},
	{
	"epoch": 11.24,
	"learning_rate": 0.00011458333333333334,
	"loss": 1.1736,
	"step": 90
	},
	{
	"epoch": 11.97,
	"eval_accuracy": 0.6605504587155964,
	"eval_f1": 0.5771675777046106,
	"eval_loss": 0.9855989813804626,
	"eval_precision": 0.5536726213674042,
	"eval_recall": 0.6605504587155964,
	"eval_runtime": 4.2828,
	"eval_samples_per_second": 25.451,
	"eval_steps_per_second": 0.467,
	"step": 96
	},
	{
	"epoch": 12.48,
	"learning_rate": 0.0001125,
	"loss": 1.0457,
	"step": 100
	},
	{
	"epoch": 12.97,
	"eval_accuracy": 0.6697247706422018,
	"eval_f1": 0.5964926350313968,
	"eval_loss": 0.896264374256134,
	"eval_precision": 0.763141515721791,
	"eval_recall": 0.6697247706422018,
	"eval_runtime": 4.2315,
	"eval_samples_per_second": 25.759,
	"eval_steps_per_second": 0.473,
	"step": 104
	},
	{
	"epoch": 13.73,
	"learning_rate": 0.00011041666666666666,
	"loss": 0.953,
	"step": 110
	},
	{
	"epoch": 13.97,
	"eval_accuracy": 0.6697247706422018,
	"eval_f1": 0.6081464096911078,
	"eval_loss": 0.8546512722969055,
	"eval_precision": 0.6884856947005512,
	"eval_recall": 0.6697247706422018,
	"eval_runtime": 4.4534,
	"eval_samples_per_second": 24.476,
	"eval_steps_per_second": 0.449,
	"step": 112
	},
	{
	"epoch": 14.97,
	"learning_rate": 0.00010833333333333334,
	"loss": 0.8579,
	"step": 120
	},
	{
	"epoch": 14.97,
	"eval_accuracy": 0.7155963302752294,
	"eval_f1": 0.6643295304342026,
	"eval_loss": 0.7848823070526123,
	"eval_precision": 0.7396182317656428,
	"eval_recall": 0.7155963302752294,
	"eval_runtime": 4.1662,
	"eval_samples_per_second": 26.163,
	"eval_steps_per_second": 0.48,
	"step": 120
	},
	{
	"epoch": 15.97,
	"eval_accuracy": 0.7431192660550459,
	"eval_f1": 0.711852075310986,
	"eval_loss": 0.7563745379447937,
	"eval_precision": 0.7371817784661822,
	"eval_recall": 0.7431192660550459,
	"eval_runtime": 4.2674,
	"eval_samples_per_second": 25.542,
	"eval_steps_per_second": 0.469,
	"step": 128
	},
	{
	"epoch": 16.24,
	"learning_rate": 0.00010625,
	"loss": 0.8167,
	"step": 130
	},
	{
	"epoch": 16.97,
	"eval_accuracy": 0.7614678899082569,
	"eval_f1": 0.7210716889645992,
	"eval_loss": 0.7132583260536194,
	"eval_precision": 0.7506553079947577,
	"eval_recall": 0.7614678899082569,
	"eval_runtime": 4.1418,
	"eval_samples_per_second": 26.317,
	"eval_steps_per_second": 0.483,
	"step": 136
	},
	{
	"epoch": 17.48,
	"learning_rate": 0.00010416666666666667,
	"loss": 0.7273,
	"step": 140
	},
	{
	"epoch": 17.97,
	"eval_accuracy": 0.7522935779816514,
	"eval_f1": 0.7202155642522615,
	"eval_loss": 0.6887747645378113,
	"eval_precision": 0.7378685592291271,
	"eval_recall": 0.7522935779816514,
	"eval_runtime": 4.5118,
	"eval_samples_per_second": 24.159,
	"eval_steps_per_second": 0.443,
	"step": 144
	},
	{
	"epoch": 18.73,
	"learning_rate": 0.00010208333333333334,
	"loss": 0.6547,
	"step": 150
	},
	{
	"epoch": 18.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7576525411387797,
	"eval_loss": 0.659186065196991,
	"eval_precision": 0.7772903701802784,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.3816,
	"eval_samples_per_second": 24.877,
	"eval_steps_per_second": 0.456,
	"step": 152
	},
	{
	"epoch": 19.97,
	"learning_rate": 0.0001,
	"loss": 0.5963,
	"step": 160
	},
	{
	"epoch": 19.97,
	"eval_accuracy": 0.7706422018348624,
	"eval_f1": 0.7550663564666461,
	"eval_loss": 0.6136144399642944,
	"eval_precision": 0.764159781184113,
	"eval_recall": 0.7706422018348624,
	"eval_runtime": 4.2561,
	"eval_samples_per_second": 25.61,
	"eval_steps_per_second": 0.47,
	"step": 160
	},
	{
	"epoch": 20.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7786916064255194,
	"eval_loss": 0.5723462700843811,
	"eval_precision": 0.7801645588430826,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 5.2546,
	"eval_samples_per_second": 20.744,
	"eval_steps_per_second": 0.381,
	"step": 168
	},
	{
	"epoch": 21.24,
	"learning_rate": 9.791666666666667e-05,
	"loss": 0.551,
	"step": 170
	},
	{
	"epoch": 21.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7780894219567608,
	"eval_loss": 0.5686229467391968,
	"eval_precision": 0.776092121476891,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.3144,
	"eval_samples_per_second": 25.264,
	"eval_steps_per_second": 0.464,
	"step": 176
	},
	{
	"epoch": 22.48,
	"learning_rate": 9.583333333333334e-05,
	"loss": 0.4929,
	"step": 180
	},
	{
	"epoch": 22.97,
	"eval_accuracy": 0.7706422018348624,
	"eval_f1": 0.7651464296127533,
	"eval_loss": 0.5596823692321777,
	"eval_precision": 0.7649127896435436,
	"eval_recall": 0.7706422018348624,
	"eval_runtime": 4.4326,
	"eval_samples_per_second": 24.59,
	"eval_steps_per_second": 0.451,
	"step": 184
	},
	{
	"epoch": 23.73,
	"learning_rate": 9.375e-05,
	"loss": 0.4309,
	"step": 190
	},
	{
	"epoch": 23.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.781022184850044,
	"eval_loss": 0.5233965516090393,
	"eval_precision": 0.7774110647118855,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.3167,
	"eval_samples_per_second": 25.251,
	"eval_steps_per_second": 0.463,
	"step": 192
	},
	{
	"epoch": 24.97,
	"learning_rate": 9.166666666666667e-05,
	"loss": 0.3945,
	"step": 200
	},
	{
	"epoch": 24.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7812909567496724,
	"eval_loss": 0.5007840991020203,
	"eval_precision": 0.7836723839914905,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.3513,
	"eval_samples_per_second": 25.05,
	"eval_steps_per_second": 0.46,
	"step": 200
	},
	{
	"epoch": 25.97,
	"eval_accuracy": 0.7522935779816514,
	"eval_f1": 0.7528893125223401,
	"eval_loss": 0.5289302468299866,
	"eval_precision": 0.7537344154316632,
	"eval_recall": 0.7522935779816514,
	"eval_runtime": 4.3647,
	"eval_samples_per_second": 24.973,
	"eval_steps_per_second": 0.458,
	"step": 208
	},
	{
	"epoch": 26.24,
	"learning_rate": 8.958333333333333e-05,
	"loss": 0.3704,
	"step": 210
	},
	{
	"epoch": 26.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.7962706746091569,
	"eval_loss": 0.4399118423461914,
	"eval_precision": 0.7957732392169626,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.2147,
	"eval_samples_per_second": 25.862,
	"eval_steps_per_second": 0.475,
	"step": 216
	},
	{
	"epoch": 27.48,
	"learning_rate": 8.75e-05,
	"loss": 0.3267,
	"step": 220
	},
	{
	"epoch": 27.97,
	"eval_accuracy": 0.8073394495412844,
	"eval_f1": 0.8005365278178692,
	"eval_loss": 0.4539415240287781,
	"eval_precision": 0.7983420088683247,
	"eval_recall": 0.8073394495412844,
	"eval_runtime": 4.2272,
	"eval_samples_per_second": 25.785,
	"eval_steps_per_second": 0.473,
	"step": 224
	},
	{
	"epoch": 28.73,
	"learning_rate": 8.541666666666668e-05,
	"loss": 0.2966,
	"step": 230
	},
	{
	"epoch": 28.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7837137974455839,
	"eval_loss": 0.4734969735145569,
	"eval_precision": 0.789241175758926,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.2368,
	"eval_samples_per_second": 25.727,
	"eval_steps_per_second": 0.472,
	"step": 232
	},
	{
	"epoch": 29.97,
	"learning_rate": 8.333333333333333e-05,
	"loss": 0.2645,
	"step": 240
	},
	{
	"epoch": 29.97,
	"eval_accuracy": 0.7706422018348624,
	"eval_f1": 0.7706422018348624,
	"eval_loss": 0.4594463109970093,
	"eval_precision": 0.7706422018348624,
	"eval_recall": 0.7706422018348624,
	"eval_runtime": 4.3943,
	"eval_samples_per_second": 24.805,
	"eval_steps_per_second": 0.455,
	"step": 240
	},
	{
	"epoch": 30.97,
	"eval_accuracy": 0.7522935779816514,
	"eval_f1": 0.7533140030125614,
	"eval_loss": 0.4698648750782013,
	"eval_precision": 0.7554437319096274,
	"eval_recall": 0.7522935779816514,
	"eval_runtime": 4.1296,
	"eval_samples_per_second": 26.394,
	"eval_steps_per_second": 0.484,
	"step": 248
	},
	{
	"epoch": 31.24,
	"learning_rate": 8.125000000000001e-05,
	"loss": 0.2527,
	"step": 250
	},
	{
	"epoch": 31.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7856523955147808,
	"eval_loss": 0.45513755083084106,
	"eval_precision": 0.785609816323817,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.1348,
	"eval_samples_per_second": 26.361,
	"eval_steps_per_second": 0.484,
	"step": 256
	},
	{
	"epoch": 32.48,
	"learning_rate": 7.916666666666666e-05,
	"loss": 0.2202,
	"step": 260
	},
	{
	"epoch": 32.97,
	"eval_accuracy": 0.8165137614678899,
	"eval_f1": 0.8170336224601304,
	"eval_loss": 0.4457748532295227,
	"eval_precision": 0.8197900424266599,
	"eval_recall": 0.8165137614678899,
	"eval_runtime": 5.1689,
	"eval_samples_per_second": 21.087,
	"eval_steps_per_second": 0.387,
	"step": 264
	},
	{
	"epoch": 33.73,
	"learning_rate": 7.708333333333334e-05,
	"loss": 0.2006,
	"step": 270
	},
	{
	"epoch": 33.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7850412357933325,
	"eval_loss": 0.46321260929107666,
	"eval_precision": 0.7940749153601442,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.2326,
	"eval_samples_per_second": 25.752,
	"eval_steps_per_second": 0.473,
	"step": 272
	},
	{
	"epoch": 34.97,
	"learning_rate": 7.500000000000001e-05,
	"loss": 0.1589,
	"step": 280
	},
	{
	"epoch": 34.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7925041274199247,
	"eval_loss": 0.46511203050613403,
	"eval_precision": 0.7993275970140749,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.1566,
	"eval_samples_per_second": 26.223,
	"eval_steps_per_second": 0.481,
	"step": 280
	},
	{
	"epoch": 35.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7803733958918072,
	"eval_loss": 0.45948973298072815,
	"eval_precision": 0.7823930357635982,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.3202,
	"eval_samples_per_second": 25.23,
	"eval_steps_per_second": 0.463,
	"step": 288
	},
	{
	"epoch": 36.24,
	"learning_rate": 7.291666666666666e-05,
	"loss": 0.153,
	"step": 290
	},
	{
	"epoch": 36.97,
	"eval_accuracy": 0.7614678899082569,
	"eval_f1": 0.7632546001327497,
	"eval_loss": 0.458363801240921,
	"eval_precision": 0.7690950187958565,
	"eval_recall": 0.7614678899082569,
	"eval_runtime": 4.4275,
	"eval_samples_per_second": 24.619,
	"eval_steps_per_second": 0.452,
	"step": 296
	},
	{
	"epoch": 37.48,
	"learning_rate": 7.083333333333334e-05,
	"loss": 0.1427,
	"step": 300
	},
	{
	"epoch": 37.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7796360891921739,
	"eval_loss": 0.46078726649284363,
	"eval_precision": 0.782995656118911,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.4461,
	"eval_samples_per_second": 24.516,
	"eval_steps_per_second": 0.45,
	"step": 304
	},
	{
	"epoch": 38.73,
	"learning_rate": 6.874999999999999e-05,
	"loss": 0.113,
	"step": 310
	},
	{
	"epoch": 38.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7898954921921011,
	"eval_loss": 0.45713570713996887,
	"eval_precision": 0.7922270390160299,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.3087,
	"eval_samples_per_second": 25.297,
	"eval_steps_per_second": 0.464,
	"step": 312
	},
	{
	"epoch": 39.97,
	"learning_rate": 6.666666666666667e-05,
	"loss": 0.1146,
	"step": 320
	},
	{
	"epoch": 39.97,
	"eval_accuracy": 0.7614678899082569,
	"eval_f1": 0.7612891030218949,
	"eval_loss": 0.5269873142242432,
	"eval_precision": 0.765128347697155,
	"eval_recall": 0.7614678899082569,
	"eval_runtime": 4.2908,
	"eval_samples_per_second": 25.403,
	"eval_steps_per_second": 0.466,
	"step": 320
	},
	{
	"epoch": 40.97,
	"eval_accuracy": 0.7706422018348624,
	"eval_f1": 0.7709516996486127,
	"eval_loss": 0.48878130316734314,
	"eval_precision": 0.7781771515945828,
	"eval_recall": 0.7706422018348624,
	"eval_runtime": 4.3303,
	"eval_samples_per_second": 25.171,
	"eval_steps_per_second": 0.462,
	"step": 328
	},
	{
	"epoch": 41.24,
	"learning_rate": 6.458333333333334e-05,
	"loss": 0.1275,
	"step": 330
	},
	{
	"epoch": 41.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7836706749228535,
	"eval_loss": 0.4523099958896637,
	"eval_precision": 0.780905883107718,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.2033,
	"eval_samples_per_second": 25.932,
	"eval_steps_per_second": 0.476,
	"step": 336
	},
	{
	"epoch": 42.48,
	"learning_rate": 6.25e-05,
	"loss": 0.0959,
	"step": 340
	},
	{
	"epoch": 42.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7767063396275014,
	"eval_loss": 0.46965503692626953,
	"eval_precision": 0.7753268138589239,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.3242,
	"eval_samples_per_second": 25.207,
	"eval_steps_per_second": 0.463,
	"step": 344
	},
	{
	"epoch": 43.73,
	"learning_rate": 6.041666666666667e-05,
	"loss": 0.0882,
	"step": 350
	},
	{
	"epoch": 43.97,
	"eval_accuracy": 0.7706422018348624,
	"eval_f1": 0.7685729724992435,
	"eval_loss": 0.4286104738712311,
	"eval_precision": 0.7685932721712537,
	"eval_recall": 0.7706422018348624,
	"eval_runtime": 4.4175,
	"eval_samples_per_second": 24.675,
	"eval_steps_per_second": 0.453,
	"step": 352
	},
	{
	"epoch": 44.97,
	"learning_rate": 5.833333333333333e-05,
	"loss": 0.0847,
	"step": 360
	},
	{
	"epoch": 44.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7925041274199247,
	"eval_loss": 0.5317460298538208,
	"eval_precision": 0.7993275970140749,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 6.0042,
	"eval_samples_per_second": 18.154,
	"eval_steps_per_second": 0.333,
	"step": 360
	},
	{
	"epoch": 45.97,
	"eval_accuracy": 0.7614678899082569,
	"eval_f1": 0.7646893115457605,
	"eval_loss": 0.5431071519851685,
	"eval_precision": 0.7699552364490537,
	"eval_recall": 0.7614678899082569,
	"eval_runtime": 4.3547,
	"eval_samples_per_second": 25.03,
	"eval_steps_per_second": 0.459,
	"step": 368
	},
	{
	"epoch": 46.24,
	"learning_rate": 5.625e-05,
	"loss": 0.0813,
	"step": 370
	},
	{
	"epoch": 46.97,
	"eval_accuracy": 0.8256880733944955,
	"eval_f1": 0.8284158367266842,
	"eval_loss": 0.44316479563713074,
	"eval_precision": 0.843538901662607,
	"eval_recall": 0.8256880733944955,
	"eval_runtime": 4.2714,
	"eval_samples_per_second": 25.519,
	"eval_steps_per_second": 0.468,
	"step": 376
	},
	{
	"epoch": 47.48,
	"learning_rate": 5.416666666666667e-05,
	"loss": 0.0768,
	"step": 380
	},
	{
	"epoch": 47.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.7955546490941502,
	"eval_loss": 0.4885597229003906,
	"eval_precision": 0.8005162605636117,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.2576,
	"eval_samples_per_second": 25.602,
	"eval_steps_per_second": 0.47,
	"step": 384
	},
	{
	"epoch": 48.73,
	"learning_rate": 5.208333333333334e-05,
	"loss": 0.0627,
	"step": 390
	},
	{
	"epoch": 48.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.8009727230444837,
	"eval_loss": 0.5372528433799744,
	"eval_precision": 0.8071912929511652,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.3763,
	"eval_samples_per_second": 24.907,
	"eval_steps_per_second": 0.457,
	"step": 392
	},
	{
	"epoch": 49.97,
	"learning_rate": 5e-05,
	"loss": 0.0688,
	"step": 400
	},
	{
	"epoch": 49.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7822443312570955,
	"eval_loss": 0.5896694660186768,
	"eval_precision": 0.789232725399693,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.3692,
	"eval_samples_per_second": 24.947,
	"eval_steps_per_second": 0.458,
	"step": 400
	},
	{
	"epoch": 50.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.7992371326578404,
	"eval_loss": 0.5114642977714539,
	"eval_precision": 0.8014849021031709,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.3028,
	"eval_samples_per_second": 25.332,
	"eval_steps_per_second": 0.465,
	"step": 408
	},
	{
	"epoch": 51.24,
	"learning_rate": 4.791666666666667e-05,
	"loss": 0.0676,
	"step": 410
	},
	{
	"epoch": 51.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.7977993643940755,
	"eval_loss": 0.4881470799446106,
	"eval_precision": 0.7998301588132414,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.3212,
	"eval_samples_per_second": 25.224,
	"eval_steps_per_second": 0.463,
	"step": 416
	},
	{
	"epoch": 52.48,
	"learning_rate": 4.5833333333333334e-05,
	"loss": 0.0539,
	"step": 420
	},
	{
	"epoch": 52.97,
	"eval_accuracy": 0.8073394495412844,
	"eval_f1": 0.807691055721277,
	"eval_loss": 0.4819609224796295,
	"eval_precision": 0.8138503399273244,
	"eval_recall": 0.8073394495412844,
	"eval_runtime": 4.3125,
	"eval_samples_per_second": 25.276,
	"eval_steps_per_second": 0.464,
	"step": 424
	},
	{
	"epoch": 53.73,
	"learning_rate": 4.375e-05,
	"loss": 0.0596,
	"step": 430
	},
	{
	"epoch": 53.97,
	"eval_accuracy": 0.8256880733944955,
	"eval_f1": 0.8244465797713664,
	"eval_loss": 0.4449571669101715,
	"eval_precision": 0.8245908379614004,
	"eval_recall": 0.8256880733944955,
	"eval_runtime": 5.8195,
	"eval_samples_per_second": 18.73,
	"eval_steps_per_second": 0.344,
	"step": 432
	},
	{
	"epoch": 54.97,
	"learning_rate": 4.1666666666666665e-05,
	"loss": 0.0611,
	"step": 440
	},
	{
	"epoch": 54.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7924465793472197,
	"eval_loss": 0.5057494044303894,
	"eval_precision": 0.8008019735410222,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.6616,
	"eval_samples_per_second": 23.383,
	"eval_steps_per_second": 0.429,
	"step": 440
	},
	{
	"epoch": 55.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.8008031371900772,
	"eval_loss": 0.4918478727340698,
	"eval_precision": 0.8056331161636306,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.8639,
	"eval_samples_per_second": 22.41,
	"eval_steps_per_second": 0.411,
	"step": 448
	},
	{
	"epoch": 56.24,
	"learning_rate": 3.958333333333333e-05,
	"loss": 0.0643,
	"step": 450
	},
	{
	"epoch": 56.97,
	"eval_accuracy": 0.7522935779816514,
	"eval_f1": 0.7545272459450874,
	"eval_loss": 0.5946044325828552,
	"eval_precision": 0.7587394976605187,
	"eval_recall": 0.7522935779816514,
	"eval_runtime": 4.4153,
	"eval_samples_per_second": 24.687,
	"eval_steps_per_second": 0.453,
	"step": 456
	},
	{
	"epoch": 57.48,
	"learning_rate": 3.7500000000000003e-05,
	"loss": 0.0605,
	"step": 460
	},
	{
	"epoch": 57.97,
	"eval_accuracy": 0.8073394495412844,
	"eval_f1": 0.8120936083458042,
	"eval_loss": 0.4887966513633728,
	"eval_precision": 0.8238645162528876,
	"eval_recall": 0.8073394495412844,
	"eval_runtime": 6.6734,
	"eval_samples_per_second": 16.334,
	"eval_steps_per_second": 0.3,
	"step": 464
	},
	{
	"epoch": 58.73,
	"learning_rate": 3.541666666666667e-05,
	"loss": 0.063,
	"step": 470
	},
	{
	"epoch": 58.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7936673558168583,
	"eval_loss": 0.5916518568992615,
	"eval_precision": 0.8051419661311963,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.2726,
	"eval_samples_per_second": 25.511,
	"eval_steps_per_second": 0.468,
	"step": 472
	},
	{
	"epoch": 59.97,
	"learning_rate": 3.3333333333333335e-05,
	"loss": 0.0595,
	"step": 480
	},
	{
	"epoch": 59.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7894285298217145,
	"eval_loss": 0.5117025375366211,
	"eval_precision": 0.7904302906815871,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.4288,
	"eval_samples_per_second": 24.612,
	"eval_steps_per_second": 0.452,
	"step": 480
	},
	{
	"epoch": 60.97,
	"eval_accuracy": 0.7614678899082569,
	"eval_f1": 0.7635438011331693,
	"eval_loss": 0.549720048904419,
	"eval_precision": 0.769159484755815,
	"eval_recall": 0.7614678899082569,
	"eval_runtime": 4.2635,
	"eval_samples_per_second": 25.566,
	"eval_steps_per_second": 0.469,
	"step": 488
	},
	{
	"epoch": 61.24,
	"learning_rate": 3.125e-05,
	"loss": 0.0554,
	"step": 490
	},
	{
	"epoch": 61.97,
	"eval_accuracy": 0.8165137614678899,
	"eval_f1": 0.812552773801982,
	"eval_loss": 0.4742366075515747,
	"eval_precision": 0.8100926678908328,
	"eval_recall": 0.8165137614678899,
	"eval_runtime": 4.3801,
	"eval_samples_per_second": 24.885,
	"eval_steps_per_second": 0.457,
	"step": 496
	},
	{
	"epoch": 62.48,
	"learning_rate": 2.9166666666666666e-05,
	"loss": 0.0557,
	"step": 500
	},
	{
	"epoch": 62.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7886246853481453,
	"eval_loss": 0.5369319915771484,
	"eval_precision": 0.7886251828214332,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.4776,
	"eval_samples_per_second": 24.343,
	"eval_steps_per_second": 0.447,
	"step": 504
	},
	{
	"epoch": 63.73,
	"learning_rate": 2.7083333333333335e-05,
	"loss": 0.0539,
	"step": 510
	},
	{
	"epoch": 63.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7898954921921011,
	"eval_loss": 0.5439756512641907,
	"eval_precision": 0.7922270390160299,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.4228,
	"eval_samples_per_second": 24.645,
	"eval_steps_per_second": 0.452,
	"step": 512
	},
	{
	"epoch": 64.97,
	"learning_rate": 2.5e-05,
	"loss": 0.048,
	"step": 520
	},
	{
	"epoch": 64.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7882784673502429,
	"eval_loss": 0.5923751592636108,
	"eval_precision": 0.7878178107535906,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 5.5392,
	"eval_samples_per_second": 19.678,
	"eval_steps_per_second": 0.361,
	"step": 520
	},
	{
	"epoch": 65.97,
	"eval_accuracy": 0.8440366972477065,
	"eval_f1": 0.8440366972477065,
	"eval_loss": 0.486260324716568,
	"eval_precision": 0.8440366972477065,
	"eval_recall": 0.8440366972477065,
	"eval_runtime": 4.2084,
	"eval_samples_per_second": 25.9,
	"eval_steps_per_second": 0.475,
	"step": 528
	},
	{
	"epoch": 66.24,
	"learning_rate": 2.2916666666666667e-05,
	"loss": 0.045,
	"step": 530
	},
	{
	"epoch": 66.97,
	"eval_accuracy": 0.8073394495412844,
	"eval_f1": 0.8046694749207712,
	"eval_loss": 0.5849686861038208,
	"eval_precision": 0.8076432996157767,
	"eval_recall": 0.8073394495412844,
	"eval_runtime": 4.3405,
	"eval_samples_per_second": 25.112,
	"eval_steps_per_second": 0.461,
	"step": 536
	},
	{
	"epoch": 67.48,
	"learning_rate": 2.0833333333333333e-05,
	"loss": 0.047,
	"step": 540
	},
	{
	"epoch": 67.97,
	"eval_accuracy": 0.8256880733944955,
	"eval_f1": 0.8227139701424718,
	"eval_loss": 0.4938836991786957,
	"eval_precision": 0.8211639886949021,
	"eval_recall": 0.8256880733944955,
	"eval_runtime": 4.2943,
	"eval_samples_per_second": 25.382,
	"eval_steps_per_second": 0.466,
	"step": 544
	},
	{
	"epoch": 68.73,
	"learning_rate": 1.8750000000000002e-05,
	"loss": 0.0412,
	"step": 550
	},
	{
	"epoch": 68.97,
	"eval_accuracy": 0.7889908256880734,
	"eval_f1": 0.7899819010172877,
	"eval_loss": 0.4850451946258545,
	"eval_precision": 0.7911629060252914,
	"eval_recall": 0.7889908256880734,
	"eval_runtime": 4.3733,
	"eval_samples_per_second": 24.924,
	"eval_steps_per_second": 0.457,
	"step": 552
	},
	{
	"epoch": 69.97,
	"learning_rate": 1.6666666666666667e-05,
	"loss": 0.0392,
	"step": 560
	},
	{
	"epoch": 69.97,
	"eval_accuracy": 0.8256880733944955,
	"eval_f1": 0.8257529642156887,
	"eval_loss": 0.5065794587135315,
	"eval_precision": 0.8264957264957264,
	"eval_recall": 0.8256880733944955,
	"eval_runtime": 4.2901,
	"eval_samples_per_second": 25.407,
	"eval_steps_per_second": 0.466,
	"step": 560
	},
	{
	"epoch": 70.97,
	"eval_accuracy": 0.8073394495412844,
	"eval_f1": 0.8058135764557783,
	"eval_loss": 0.49649733304977417,
	"eval_precision": 0.8053007135575942,
	"eval_recall": 0.8073394495412844,
	"eval_runtime": 4.1424,
	"eval_samples_per_second": 26.313,
	"eval_steps_per_second": 0.483,
	"step": 568
	},
	{
	"epoch": 71.24,
	"learning_rate": 1.4583333333333333e-05,
	"loss": 0.0423,
	"step": 570
	},
	{
	"epoch": 71.97,
	"eval_accuracy": 0.8348623853211009,
	"eval_f1": 0.8350885030999028,
	"eval_loss": 0.47168704867362976,
	"eval_precision": 0.8376424034680915,
	"eval_recall": 0.8348623853211009,
	"eval_runtime": 4.1897,
	"eval_samples_per_second": 26.016,
	"eval_steps_per_second": 0.477,
	"step": 576
	},
	{
	"epoch": 72.48,
	"learning_rate": 1.25e-05,
	"loss": 0.0471,
	"step": 580
	},
	{
	"epoch": 72.97,
	"eval_accuracy": 0.8256880733944955,
	"eval_f1": 0.8295520158325865,
	"eval_loss": 0.48450949788093567,
	"eval_precision": 0.837811160528748,
	"eval_recall": 0.8256880733944955,
	"eval_runtime": 4.2446,
	"eval_samples_per_second": 25.68,
	"eval_steps_per_second": 0.471,
	"step": 584
	},
	{
	"epoch": 73.73,
	"learning_rate": 1.0416666666666666e-05,
	"loss": 0.0322,
	"step": 590
	},
	{
	"epoch": 73.97,
	"eval_accuracy": 0.7706422018348624,
	"eval_f1": 0.7692886041532689,
	"eval_loss": 0.5188109278678894,
	"eval_precision": 0.7689271840647987,
	"eval_recall": 0.7706422018348624,
	"eval_runtime": 4.4833,
	"eval_samples_per_second": 24.313,
	"eval_steps_per_second": 0.446,
	"step": 592
	},
	{
	"epoch": 74.97,
	"learning_rate": 8.333333333333334e-06,
	"loss": 0.042,
	"step": 600
	},
	{
	"epoch": 74.97,
	"eval_accuracy": 0.7706422018348624,
	"eval_f1": 0.7700888306392893,
	"eval_loss": 0.5242283940315247,
	"eval_precision": 0.7698942959712803,
	"eval_recall": 0.7706422018348624,
	"eval_runtime": 4.4923,
	"eval_samples_per_second": 24.264,
	"eval_steps_per_second": 0.445,
	"step": 600
	},
	{
	"epoch": 75.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7803733958918072,
	"eval_loss": 0.5945499539375305,
	"eval_precision": 0.7823930357635982,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 5.1633,
	"eval_samples_per_second": 21.111,
	"eval_steps_per_second": 0.387,
	"step": 608
	},
	{
	"epoch": 76.24,
	"learning_rate": 6.25e-06,
	"loss": 0.0416,
	"step": 610
	},
	{
	"epoch": 76.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.7993445642022374,
	"eval_loss": 0.5432426929473877,
	"eval_precision": 0.8038185145085823,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.2234,
	"eval_samples_per_second": 25.809,
	"eval_steps_per_second": 0.474,
	"step": 616
	},
	{
	"epoch": 77.48,
	"learning_rate": 4.166666666666667e-06,
	"loss": 0.0399,
	"step": 620
	},
	{
	"epoch": 77.97,
	"eval_accuracy": 0.7981651376146789,
	"eval_f1": 0.7994120087594209,
	"eval_loss": 0.5381362438201904,
	"eval_precision": 0.8072242548450546,
	"eval_recall": 0.7981651376146789,
	"eval_runtime": 4.2152,
	"eval_samples_per_second": 25.859,
	"eval_steps_per_second": 0.474,
	"step": 624
	},
	{
	"epoch": 78.73,
	"learning_rate": 2.0833333333333334e-06,
	"loss": 0.0439,
	"step": 630
	},
	{
	"epoch": 78.97,
	"eval_accuracy": 0.7798165137614679,
	"eval_f1": 0.7827462243679189,
	"eval_loss": 0.6181262135505676,
	"eval_precision": 0.7877941763063422,
	"eval_recall": 0.7798165137614679,
	"eval_runtime": 4.2424,
	"eval_samples_per_second": 25.693,
	"eval_steps_per_second": 0.471,
	"step": 632
	},
	{
	"epoch": 79.97,
	"learning_rate": 0.0,
	"loss": 0.0462,
	"step": 640
	},
	{
	"epoch": 79.97,
	"eval_accuracy": 0.8165137614678899,
	"eval_f1": 0.8172526992448356,
	"eval_loss": 0.48008766770362854,
	"eval_precision": 0.8181998512273742,
	"eval_recall": 0.8165137614678899,
	"eval_runtime": 4.18,
	"eval_samples_per_second": 26.076,
	"eval_steps_per_second": 0.478,
	"step": 640
	},
	{
	"epoch": 79.97,
	"step": 640,
	"total_flos": 3.5167284631649157e+18,
	"train_loss": 0.37728101573884487,
	"train_runtime": 2345.4183,
	"train_samples_per_second": 70.606,
	"train_steps_per_second": 0.273
	}
	],
	"max_steps": 640,
	"num_train_epochs": 80,
	"total_flos": 3.5167284631649157e+18,
	"trial_name": null,
	"trial_params": null
	}