|
{ |
|
"best_metric": 0.5741885625965997, |
|
"best_model_checkpoint": "resnet50-finetuned-memes/checkpoint-400", |
|
"epoch": 9.987654320987655, |
|
"global_step": 400, |
|
"is_hyper_param_search": false, |
|
"is_local_process_zero": true, |
|
"is_world_process_zero": true, |
|
"log_history": [ |
|
{ |
|
"epoch": 0.25, |
|
"learning_rate": 3e-05, |
|
"loss": 1.5889, |
|
"step": 10 |
|
}, |
|
{ |
|
"epoch": 0.49, |
|
"learning_rate": 6e-05, |
|
"loss": 1.5731, |
|
"step": 20 |
|
}, |
|
{ |
|
"epoch": 0.74, |
|
"learning_rate": 9e-05, |
|
"loss": 1.5334, |
|
"step": 30 |
|
}, |
|
{ |
|
"epoch": 0.99, |
|
"learning_rate": 0.00012, |
|
"loss": 1.4795, |
|
"step": 40 |
|
}, |
|
{ |
|
"epoch": 0.99, |
|
"eval_accuracy": 0.4381761978361669, |
|
"eval_loss": 1.464142084121704, |
|
"eval_runtime": 356.2702, |
|
"eval_samples_per_second": 3.632, |
|
"eval_steps_per_second": 0.115, |
|
"step": 40 |
|
}, |
|
{ |
|
"epoch": 1.25, |
|
"learning_rate": 0.00011666666666666667, |
|
"loss": 1.5199, |
|
"step": 50 |
|
}, |
|
{ |
|
"epoch": 1.49, |
|
"learning_rate": 0.00011333333333333333, |
|
"loss": 1.3721, |
|
"step": 60 |
|
}, |
|
{ |
|
"epoch": 1.74, |
|
"learning_rate": 0.00011, |
|
"loss": 1.3598, |
|
"step": 70 |
|
}, |
|
{ |
|
"epoch": 1.99, |
|
"learning_rate": 0.00010666666666666667, |
|
"loss": 1.3455, |
|
"step": 80 |
|
}, |
|
{ |
|
"epoch": 1.99, |
|
"eval_accuracy": 0.43894899536321486, |
|
"eval_loss": 1.328090786933899, |
|
"eval_runtime": 11.0632, |
|
"eval_samples_per_second": 116.965, |
|
"eval_steps_per_second": 3.706, |
|
"step": 80 |
|
}, |
|
{ |
|
"epoch": 2.25, |
|
"learning_rate": 0.00010333333333333334, |
|
"loss": 1.3903, |
|
"step": 90 |
|
}, |
|
{ |
|
"epoch": 2.49, |
|
"learning_rate": 0.0001, |
|
"loss": 1.2656, |
|
"step": 100 |
|
}, |
|
{ |
|
"epoch": 2.74, |
|
"learning_rate": 9.666666666666667e-05, |
|
"loss": 1.2454, |
|
"step": 110 |
|
}, |
|
{ |
|
"epoch": 2.99, |
|
"learning_rate": 9.333333333333334e-05, |
|
"loss": 1.262, |
|
"step": 120 |
|
}, |
|
{ |
|
"epoch": 2.99, |
|
"eval_accuracy": 0.45826893353941267, |
|
"eval_loss": 1.2583322525024414, |
|
"eval_runtime": 10.8015, |
|
"eval_samples_per_second": 119.798, |
|
"eval_steps_per_second": 3.796, |
|
"step": 120 |
|
}, |
|
{ |
|
"epoch": 3.25, |
|
"learning_rate": 9e-05, |
|
"loss": 1.2804, |
|
"step": 130 |
|
}, |
|
{ |
|
"epoch": 3.49, |
|
"learning_rate": 8.666666666666667e-05, |
|
"loss": 1.2069, |
|
"step": 140 |
|
}, |
|
{ |
|
"epoch": 3.74, |
|
"learning_rate": 8.333333333333333e-05, |
|
"loss": 1.165, |
|
"step": 150 |
|
}, |
|
{ |
|
"epoch": 3.99, |
|
"learning_rate": 7.999999999999999e-05, |
|
"loss": 1.1975, |
|
"step": 160 |
|
}, |
|
{ |
|
"epoch": 3.99, |
|
"eval_accuracy": 0.48763523956723337, |
|
"eval_loss": 1.1978484392166138, |
|
"eval_runtime": 10.8724, |
|
"eval_samples_per_second": 119.017, |
|
"eval_steps_per_second": 3.771, |
|
"step": 160 |
|
}, |
|
{ |
|
"epoch": 4.25, |
|
"learning_rate": 7.666666666666667e-05, |
|
"loss": 1.2468, |
|
"step": 170 |
|
}, |
|
{ |
|
"epoch": 4.49, |
|
"learning_rate": 7.333333333333334e-05, |
|
"loss": 1.1397, |
|
"step": 180 |
|
}, |
|
{ |
|
"epoch": 4.74, |
|
"learning_rate": 7.000000000000001e-05, |
|
"loss": 1.1458, |
|
"step": 190 |
|
}, |
|
{ |
|
"epoch": 4.99, |
|
"learning_rate": 6.666666666666667e-05, |
|
"loss": 1.1358, |
|
"step": 200 |
|
}, |
|
{ |
|
"epoch": 4.99, |
|
"eval_accuracy": 0.5139103554868625, |
|
"eval_loss": 1.1613554954528809, |
|
"eval_runtime": 10.8401, |
|
"eval_samples_per_second": 119.372, |
|
"eval_steps_per_second": 3.782, |
|
"step": 200 |
|
}, |
|
{ |
|
"epoch": 5.25, |
|
"learning_rate": 6.333333333333333e-05, |
|
"loss": 1.1519, |
|
"step": 210 |
|
}, |
|
{ |
|
"epoch": 5.49, |
|
"learning_rate": 6e-05, |
|
"loss": 1.1357, |
|
"step": 220 |
|
}, |
|
{ |
|
"epoch": 5.74, |
|
"learning_rate": 5.6666666666666664e-05, |
|
"loss": 1.0866, |
|
"step": 230 |
|
}, |
|
{ |
|
"epoch": 5.99, |
|
"learning_rate": 5.333333333333333e-05, |
|
"loss": 1.1273, |
|
"step": 240 |
|
}, |
|
{ |
|
"epoch": 5.99, |
|
"eval_accuracy": 0.5378670788253478, |
|
"eval_loss": 1.1315844058990479, |
|
"eval_runtime": 10.9479, |
|
"eval_samples_per_second": 118.196, |
|
"eval_steps_per_second": 3.745, |
|
"step": 240 |
|
}, |
|
{ |
|
"epoch": 6.25, |
|
"learning_rate": 5e-05, |
|
"loss": 1.1223, |
|
"step": 250 |
|
}, |
|
{ |
|
"epoch": 6.49, |
|
"learning_rate": 4.666666666666667e-05, |
|
"loss": 1.1019, |
|
"step": 260 |
|
}, |
|
{ |
|
"epoch": 6.74, |
|
"learning_rate": 4.3333333333333334e-05, |
|
"loss": 1.0818, |
|
"step": 270 |
|
}, |
|
{ |
|
"epoch": 6.99, |
|
"learning_rate": 3.9999999999999996e-05, |
|
"loss": 1.0379, |
|
"step": 280 |
|
}, |
|
{ |
|
"epoch": 6.99, |
|
"eval_accuracy": 0.5463678516228748, |
|
"eval_loss": 1.1023606061935425, |
|
"eval_runtime": 10.9798, |
|
"eval_samples_per_second": 117.853, |
|
"eval_steps_per_second": 3.734, |
|
"step": 280 |
|
}, |
|
{ |
|
"epoch": 7.25, |
|
"learning_rate": 3.666666666666667e-05, |
|
"loss": 1.105, |
|
"step": 290 |
|
}, |
|
{ |
|
"epoch": 7.49, |
|
"learning_rate": 3.3333333333333335e-05, |
|
"loss": 1.0405, |
|
"step": 300 |
|
}, |
|
{ |
|
"epoch": 7.74, |
|
"learning_rate": 3e-05, |
|
"loss": 1.064, |
|
"step": 310 |
|
}, |
|
{ |
|
"epoch": 7.99, |
|
"learning_rate": 2.6666666666666667e-05, |
|
"loss": 1.041, |
|
"step": 320 |
|
}, |
|
{ |
|
"epoch": 7.99, |
|
"eval_accuracy": 0.5579598145285936, |
|
"eval_loss": 1.092698574066162, |
|
"eval_runtime": 10.8776, |
|
"eval_samples_per_second": 118.96, |
|
"eval_steps_per_second": 3.769, |
|
"step": 320 |
|
}, |
|
{ |
|
"epoch": 8.25, |
|
"learning_rate": 2.3333333333333336e-05, |
|
"loss": 1.0863, |
|
"step": 330 |
|
}, |
|
{ |
|
"epoch": 8.49, |
|
"learning_rate": 1.9999999999999998e-05, |
|
"loss": 1.0746, |
|
"step": 340 |
|
}, |
|
{ |
|
"epoch": 8.74, |
|
"learning_rate": 1.6666666666666667e-05, |
|
"loss": 0.9904, |
|
"step": 350 |
|
}, |
|
{ |
|
"epoch": 8.99, |
|
"learning_rate": 1.3333333333333333e-05, |
|
"loss": 0.9952, |
|
"step": 360 |
|
}, |
|
{ |
|
"epoch": 8.99, |
|
"eval_accuracy": 0.5540958268933539, |
|
"eval_loss": 1.0790153741836548, |
|
"eval_runtime": 10.8823, |
|
"eval_samples_per_second": 118.909, |
|
"eval_steps_per_second": 3.768, |
|
"step": 360 |
|
}, |
|
{ |
|
"epoch": 9.25, |
|
"learning_rate": 9.999999999999999e-06, |
|
"loss": 1.0354, |
|
"step": 370 |
|
}, |
|
{ |
|
"epoch": 9.49, |
|
"learning_rate": 6.666666666666667e-06, |
|
"loss": 1.0133, |
|
"step": 380 |
|
}, |
|
{ |
|
"epoch": 9.74, |
|
"learning_rate": 3.3333333333333333e-06, |
|
"loss": 1.0406, |
|
"step": 390 |
|
}, |
|
{ |
|
"epoch": 9.99, |
|
"learning_rate": 0.0, |
|
"loss": 1.0146, |
|
"step": 400 |
|
}, |
|
{ |
|
"epoch": 9.99, |
|
"eval_accuracy": 0.5741885625965997, |
|
"eval_loss": 1.0625255107879639, |
|
"eval_runtime": 10.9551, |
|
"eval_samples_per_second": 118.118, |
|
"eval_steps_per_second": 3.743, |
|
"step": 400 |
|
}, |
|
{ |
|
"epoch": 9.99, |
|
"step": 400, |
|
"total_flos": 1.0978600105465897e+18, |
|
"train_loss": 1.1949917197227478, |
|
"train_runtime": 2893.9697, |
|
"train_samples_per_second": 17.879, |
|
"train_steps_per_second": 0.138 |
|
} |
|
], |
|
"max_steps": 400, |
|
"num_train_epochs": 10, |
|
"total_flos": 1.0978600105465897e+18, |
|
"trial_name": null, |
|
"trial_params": null |
|
} |
|
|