{"train/loss": 0.1277, "train/learning_rate": 0.0, "train/epoch": 7.0, "train/global_step": 441, "_timestamp": 1713268369.8602688, "_runtime": 20034.376485824585, "_step": 15, "eval/loss": 0.1535859853029251, "eval/runtime": 27.971, "eval/samples_per_second": 0.93, "eval/steps_per_second": 0.322, "train/train_runtime": 20006.4283, "train/train_samples_per_second": 0.33, "train/train_steps_per_second": 0.022, "train/total_flos": 2.684839994232668e+17, "train/train_loss": 0.44885902664288374}