transformer-8192-16M-test / trainer_log.jsonl

Training in progress, step 20000

f88afd8 verified about 1 month ago

121 kB

	{"current_steps": 32, "total_steps": 20000, "loss": 10.1989, "eval_loss": null, "predict_loss": null, "learning_rate": 4.7999999999999994e-05, "epoch": 0.0018226348464999715, "percentage": 0.16}
	{"current_steps": 64, "total_steps": 20000, "loss": 9.6443, "eval_loss": null, "predict_loss": null, "learning_rate": 9.599999999999999e-05, "epoch": 0.003645269692999943, "percentage": 0.32}
	{"current_steps": 96, "total_steps": 20000, "loss": 8.9072, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014399999999999998, "epoch": 0.005467904539499914, "percentage": 0.48}
	{"current_steps": 128, "total_steps": 20000, "loss": 7.973, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019199999999999998, "epoch": 0.007290539385999886, "percentage": 0.64}
	{"current_steps": 160, "total_steps": 20000, "loss": 7.2218, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023999999999999998, "epoch": 0.009113174232499858, "percentage": 0.8}
	{"current_steps": 192, "total_steps": 20000, "loss": 6.8723, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028799999999999995, "epoch": 0.010935809078999829, "percentage": 0.96}
	{"current_steps": 224, "total_steps": 20000, "loss": 6.6762, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002999990211974405, "epoch": 0.012758443925499801, "percentage": 1.12}
	{"current_steps": 256, "total_steps": 20000, "loss": 6.3837, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029999467099246324, "epoch": 0.014581078771999772, "percentage": 1.28}
	{"current_steps": 288, "total_steps": 20000, "loss": 6.2005, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029998684074125604, "epoch": 0.016403713618499745, "percentage": 1.44}
	{"current_steps": 320, "total_steps": 20000, "loss": 6.2262, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029997553064567596, "epoch": 0.018226348464999716, "percentage": 1.6}
	{"current_steps": 352, "total_steps": 20000, "loss": 5.8466, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002999607409972875, "epoch": 0.020048983311499687, "percentage": 1.76}
	{"current_steps": 384, "total_steps": 20000, "loss": 6.0215, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002999424721773551, "epoch": 0.021871618157999657, "percentage": 1.92}
	{"current_steps": 416, "total_steps": 20000, "loss": 5.7095, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029992072465683314, "epoch": 0.02369425300449963, "percentage": 2.08}
	{"current_steps": 448, "total_steps": 20000, "loss": 5.7009, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000299895498996354, "epoch": 0.025516887850999603, "percentage": 2.24}
	{"current_steps": 480, "total_steps": 20000, "loss": 5.7069, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002998667958462134, "epoch": 0.027339522697499574, "percentage": 2.4}
	{"current_steps": 512, "total_steps": 20000, "loss": 5.718, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029983461594635383, "epoch": 0.029162157543999544, "percentage": 2.56}
	{"current_steps": 544, "total_steps": 20000, "loss": 5.5151, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029979896012634534, "epoch": 0.030984792390499515, "percentage": 2.72}
	{"current_steps": 576, "total_steps": 20000, "loss": 5.5678, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002997598293053643, "epoch": 0.03280742723699949, "percentage": 2.88}
	{"current_steps": 608, "total_steps": 20000, "loss": 5.2282, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002997172244921695, "epoch": 0.03463006208349946, "percentage": 3.04}
	{"current_steps": 640, "total_steps": 20000, "loss": 5.2922, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002996711467850762, "epoch": 0.03645269692999943, "percentage": 3.2}
	{"current_steps": 672, "total_steps": 20000, "loss": 5.2707, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029962159737192815, "epoch": 0.0382753317764994, "percentage": 3.36}
	{"current_steps": 704, "total_steps": 20000, "loss": 5.4287, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029956857753006636, "epoch": 0.04009796662299937, "percentage": 3.52}
	{"current_steps": 736, "total_steps": 20000, "loss": 5.2245, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029951208862629666, "epoch": 0.041920601469499344, "percentage": 3.68}
	{"current_steps": 768, "total_steps": 20000, "loss": 5.1859, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029945213211685426, "epoch": 0.043743236315999315, "percentage": 3.84}
	{"current_steps": 800, "total_steps": 20000, "loss": 5.1625, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002993887095473664, "epoch": 0.045565871162499286, "percentage": 4.0}
	{"current_steps": 832, "total_steps": 20000, "loss": 5.1964, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002993218225528122, "epoch": 0.04738850600899926, "percentage": 4.16}
	{"current_steps": 864, "total_steps": 20000, "loss": 5.224, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029925147285748055, "epoch": 0.049211140855499234, "percentage": 4.32}
	{"current_steps": 896, "total_steps": 20000, "loss": 5.1312, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002991776622749261, "epoch": 0.051033775701999205, "percentage": 4.48}
	{"current_steps": 928, "total_steps": 20000, "loss": 5.0118, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000299100392707922, "epoch": 0.052856410548499176, "percentage": 4.64}
	{"current_steps": 960, "total_steps": 20000, "loss": 4.9445, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029901966614841115, "epoch": 0.05467904539499915, "percentage": 4.8}
	{"current_steps": 992, "total_steps": 20000, "loss": 4.9251, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002989354846774545, "epoch": 0.05650168024149912, "percentage": 4.96}
	{"current_steps": 1024, "total_steps": 20000, "loss": 4.9707, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002988478504651778, "epoch": 0.05832431508799909, "percentage": 5.12}
	{"current_steps": 1056, "total_steps": 20000, "loss": 4.9096, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002987567657707157, "epoch": 0.06014694993449906, "percentage": 5.28}
	{"current_steps": 1088, "total_steps": 20000, "loss": 4.7992, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029866223294215287, "epoch": 0.06196958478099903, "percentage": 5.44}
	{"current_steps": 1120, "total_steps": 20000, "loss": 4.7556, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002985642544164642, "epoch": 0.06379221962749901, "percentage": 5.6}
	{"current_steps": 1152, "total_steps": 20000, "loss": 4.8262, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002984628327194516, "epoch": 0.06561485447399898, "percentage": 5.76}
	{"current_steps": 1184, "total_steps": 20000, "loss": 4.7054, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029835797046567897, "epoch": 0.06743748932049895, "percentage": 5.92}
	{"current_steps": 1216, "total_steps": 20000, "loss": 4.766, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029824967035840485, "epoch": 0.06926012416699892, "percentage": 6.08}
	{"current_steps": 1248, "total_steps": 20000, "loss": 4.9407, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002981379351895126, "epoch": 0.07108275901349889, "percentage": 6.24}
	{"current_steps": 1280, "total_steps": 20000, "loss": 4.8247, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002980227678394385, "epoch": 0.07290539385999886, "percentage": 6.4}
	{"current_steps": 1312, "total_steps": 20000, "loss": 4.764, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002979041712770977, "epoch": 0.07472802870649883, "percentage": 6.56}
	{"current_steps": 1344, "total_steps": 20000, "loss": 4.8822, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002977821485598071, "epoch": 0.0765506635529988, "percentage": 6.72}
	{"current_steps": 1376, "total_steps": 20000, "loss": 4.8619, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029765670283320725, "epoch": 0.07837329839949878, "percentage": 6.88}
	{"current_steps": 1408, "total_steps": 20000, "loss": 4.7759, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029752783733118086, "epoch": 0.08019593324599875, "percentage": 7.04}
	{"current_steps": 1440, "total_steps": 20000, "loss": 4.7226, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029739555537576946, "epoch": 0.08201856809249872, "percentage": 7.2}
	{"current_steps": 1472, "total_steps": 20000, "loss": 4.7048, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002972598603770878, "epoch": 0.08384120293899869, "percentage": 7.36}
	{"current_steps": 1504, "total_steps": 20000, "loss": 4.6586, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002971207558332359, "epoch": 0.08566383778549866, "percentage": 7.52}
	{"current_steps": 1536, "total_steps": 20000, "loss": 4.5819, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000296978245330209, "epoch": 0.08748647263199863, "percentage": 7.68}
	{"current_steps": 1568, "total_steps": 20000, "loss": 4.7554, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029683233254180504, "epoch": 0.0893091074784986, "percentage": 7.84}
	{"current_steps": 1600, "total_steps": 20000, "loss": 4.9152, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002966830212295299, "epoch": 0.09113174232499857, "percentage": 8.0}
	{"current_steps": 1632, "total_steps": 20000, "loss": 4.6103, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029653031524250043, "epoch": 0.09295437717149854, "percentage": 8.16}
	{"current_steps": 1664, "total_steps": 20000, "loss": 4.5324, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002963742185173454, "epoch": 0.09477701201799851, "percentage": 8.32}
	{"current_steps": 1696, "total_steps": 20000, "loss": 4.4715, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029621473507810374, "epoch": 0.09659964686449848, "percentage": 8.48}
	{"current_steps": 1728, "total_steps": 20000, "loss": 4.6459, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002960518690361209, "epoch": 0.09842228171099847, "percentage": 8.64}
	{"current_steps": 1760, "total_steps": 20000, "loss": 4.5681, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002958856245899433, "epoch": 0.10024491655749844, "percentage": 8.8}
	{"current_steps": 1792, "total_steps": 20000, "loss": 4.6641, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002957160060252092, "epoch": 0.10206755140399841, "percentage": 8.96}
	{"current_steps": 1824, "total_steps": 20000, "loss": 4.6112, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029554301771453904, "epoch": 0.10389018625049838, "percentage": 9.12}
	{"current_steps": 1856, "total_steps": 20000, "loss": 4.5055, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029536666411742233, "epoch": 0.10571282109699835, "percentage": 9.28}
	{"current_steps": 1888, "total_steps": 20000, "loss": 4.5485, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002951869497801027, "epoch": 0.10753545594349832, "percentage": 9.44}
	{"current_steps": 1920, "total_steps": 20000, "loss": 4.3948, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029500387933546095, "epoch": 0.1093580907899983, "percentage": 9.6}
	{"current_steps": 1952, "total_steps": 20000, "loss": 4.3138, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029481745750289517, "epoch": 0.11118072563649826, "percentage": 9.76}
	{"current_steps": 1984, "total_steps": 20000, "loss": 4.4486, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029462768908819953, "epoch": 0.11300336048299824, "percentage": 9.92}
	{"current_steps": 2016, "total_steps": 20000, "loss": 4.604, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002944345789834402, "epoch": 0.1148259953294982, "percentage": 10.08}
	{"current_steps": 2048, "total_steps": 20000, "loss": 4.4442, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000294238132166829, "epoch": 0.11664863017599818, "percentage": 10.24}
	{"current_steps": 2080, "total_steps": 20000, "loss": 4.3806, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029403835370259574, "epoch": 0.11847126502249815, "percentage": 10.4}
	{"current_steps": 2112, "total_steps": 20000, "loss": 4.2749, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029383524874085685, "epoch": 0.12029389986899812, "percentage": 10.56}
	{"current_steps": 2144, "total_steps": 20000, "loss": 4.3869, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002936288225174832, "epoch": 0.12211653471549809, "percentage": 10.72}
	{"current_steps": 2176, "total_steps": 20000, "loss": 4.468, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029341908035396475, "epoch": 0.12393916956199806, "percentage": 10.88}
	{"current_steps": 2208, "total_steps": 20000, "loss": 4.452, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002932060276572737, "epoch": 0.12576180440849805, "percentage": 11.04}
	{"current_steps": 2240, "total_steps": 20000, "loss": 4.3773, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002929896699197249, "epoch": 0.12758443925499802, "percentage": 11.2}
	{"current_steps": 2272, "total_steps": 20000, "loss": 4.3507, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029277001271883426, "epoch": 0.129407074101498, "percentage": 11.36}
	{"current_steps": 2304, "total_steps": 20000, "loss": 4.3723, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002925470617171751, "epoch": 0.13122970894799796, "percentage": 11.52}
	{"current_steps": 2336, "total_steps": 20000, "loss": 4.2689, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002923208226622319, "epoch": 0.13305234379449793, "percentage": 11.68}
	{"current_steps": 2368, "total_steps": 20000, "loss": 4.1489, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029209130138625256, "epoch": 0.1348749786409979, "percentage": 11.84}
	{"current_steps": 2400, "total_steps": 20000, "loss": 4.2807, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029185850380609757, "epoch": 0.13669761348749787, "percentage": 12.0}
	{"current_steps": 2432, "total_steps": 20000, "loss": 4.1258, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000291622435923088, "epoch": 0.13852024833399784, "percentage": 12.16}
	{"current_steps": 2464, "total_steps": 20000, "loss": 4.2682, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002913831038228502, "epoch": 0.1403428831804978, "percentage": 12.32}
	{"current_steps": 2496, "total_steps": 20000, "loss": 4.2238, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029114051367515944, "epoch": 0.14216551802699778, "percentage": 12.48}
	{"current_steps": 2528, "total_steps": 20000, "loss": 4.2166, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002908946717337805, "epoch": 0.14398815287349775, "percentage": 12.64}
	{"current_steps": 2560, "total_steps": 20000, "loss": 4.2946, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029064558433630674, "epoch": 0.14581078771999773, "percentage": 12.8}
	{"current_steps": 2592, "total_steps": 20000, "loss": 4.2036, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00029039325790399656, "epoch": 0.1476334225664977, "percentage": 12.96}
	{"current_steps": 2624, "total_steps": 20000, "loss": 4.1975, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002901376989416077, "epoch": 0.14945605741299767, "percentage": 13.12}
	{"current_steps": 2656, "total_steps": 20000, "loss": 4.4016, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028987891403723, "epoch": 0.15127869225949764, "percentage": 13.28}
	{"current_steps": 2688, "total_steps": 20000, "loss": 4.1795, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002896169098621151, "epoch": 0.1531013271059976, "percentage": 13.44}
	{"current_steps": 2720, "total_steps": 20000, "loss": 4.1536, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028935169317050475, "epoch": 0.15492396195249758, "percentage": 13.6}
	{"current_steps": 2752, "total_steps": 20000, "loss": 4.042, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002890832707994566, "epoch": 0.15674659679899755, "percentage": 13.76}
	{"current_steps": 2784, "total_steps": 20000, "loss": 4.2988, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000288811649668668, "epoch": 0.15856923164549752, "percentage": 13.92}
	{"current_steps": 2816, "total_steps": 20000, "loss": 3.8898, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028853683678029755, "epoch": 0.1603918664919975, "percentage": 14.08}
	{"current_steps": 2848, "total_steps": 20000, "loss": 4.0103, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028825883921878437, "epoch": 0.16221450133849746, "percentage": 14.24}
	{"current_steps": 2880, "total_steps": 20000, "loss": 4.2229, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028797766415066613, "epoch": 0.16403713618499743, "percentage": 14.4}
	{"current_steps": 2912, "total_steps": 20000, "loss": 4.2711, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028769331882439364, "epoch": 0.1658597710314974, "percentage": 14.56}
	{"current_steps": 2944, "total_steps": 20000, "loss": 4.2065, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028740581057014417, "epoch": 0.16768240587799738, "percentage": 14.72}
	{"current_steps": 2976, "total_steps": 20000, "loss": 4.0063, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002871151467996327, "epoch": 0.16950504072449735, "percentage": 14.88}
	{"current_steps": 3008, "total_steps": 20000, "loss": 4.0905, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028682133500592056, "epoch": 0.17132767557099732, "percentage": 15.04}
	{"current_steps": 3040, "total_steps": 20000, "loss": 4.0331, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028652438276322256, "epoch": 0.1731503104174973, "percentage": 15.2}
	{"current_steps": 3072, "total_steps": 20000, "loss": 4.1993, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002862242977267114, "epoch": 0.17497294526399726, "percentage": 15.36}
	{"current_steps": 3104, "total_steps": 20000, "loss": 4.2014, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002859210876323207, "epoch": 0.17679558011049723, "percentage": 15.52}
	{"current_steps": 3136, "total_steps": 20000, "loss": 4.1409, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028561476029654524, "epoch": 0.1786182149569972, "percentage": 15.68}
	{"current_steps": 3168, "total_steps": 20000, "loss": 4.0273, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002853053236162396, "epoch": 0.18044084980349717, "percentage": 15.84}
	{"current_steps": 3200, "total_steps": 20000, "loss": 4.0995, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028499278556841465, "epoch": 0.18226348464999714, "percentage": 16.0}
	{"current_steps": 3232, "total_steps": 20000, "loss": 4.0739, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002846771542100318, "epoch": 0.1840861194964971, "percentage": 16.16}
	{"current_steps": 3264, "total_steps": 20000, "loss": 3.9517, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002843584376777953, "epoch": 0.18590875434299708, "percentage": 16.32}
	{"current_steps": 3296, "total_steps": 20000, "loss": 4.0628, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002840366441879425, "epoch": 0.18773138918949706, "percentage": 16.48}
	{"current_steps": 3328, "total_steps": 20000, "loss": 4.0196, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028371178203603236, "epoch": 0.18955402403599703, "percentage": 16.64}
	{"current_steps": 3360, "total_steps": 20000, "loss": 3.8922, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002833838595967309, "epoch": 0.191376658882497, "percentage": 16.8}
	{"current_steps": 3392, "total_steps": 20000, "loss": 4.0095, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028305288532359585, "epoch": 0.19319929372899697, "percentage": 16.96}
	{"current_steps": 3424, "total_steps": 20000, "loss": 3.9934, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002827188677488587, "epoch": 0.19502192857549694, "percentage": 17.12}
	{"current_steps": 3456, "total_steps": 20000, "loss": 4.0817, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028238181548320457, "epoch": 0.19684456342199694, "percentage": 17.28}
	{"current_steps": 3488, "total_steps": 20000, "loss": 4.1356, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002820417372155502, "epoch": 0.1986671982684969, "percentage": 17.44}
	{"current_steps": 3520, "total_steps": 20000, "loss": 3.9618, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002816986417128201, "epoch": 0.20048983311499688, "percentage": 17.6}
	{"current_steps": 3552, "total_steps": 20000, "loss": 4.0911, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028135253781972063, "epoch": 0.20231246796149685, "percentage": 17.76}
	{"current_steps": 3584, "total_steps": 20000, "loss": 4.0569, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028100343445851164, "epoch": 0.20413510280799682, "percentage": 17.92}
	{"current_steps": 3616, "total_steps": 20000, "loss": 4.0413, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00028065134062877685, "epoch": 0.2059577376544968, "percentage": 18.08}
	{"current_steps": 3648, "total_steps": 20000, "loss": 3.8624, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002802962654071917, "epoch": 0.20778037250099676, "percentage": 18.24}
	{"current_steps": 3680, "total_steps": 20000, "loss": 3.9012, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027993821794728915, "epoch": 0.20960300734749673, "percentage": 18.4}
	{"current_steps": 3712, "total_steps": 20000, "loss": 4.0135, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027957720747922405, "epoch": 0.2114256421939967, "percentage": 18.56}
	{"current_steps": 3744, "total_steps": 20000, "loss": 3.9736, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002792132433095351, "epoch": 0.21324827704049668, "percentage": 18.72}
	{"current_steps": 3776, "total_steps": 20000, "loss": 3.7798, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002788463348209047, "epoch": 0.21507091188699665, "percentage": 18.88}
	{"current_steps": 3808, "total_steps": 20000, "loss": 4.0089, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027847649147191736, "epoch": 0.21689354673349662, "percentage": 19.04}
	{"current_steps": 3840, "total_steps": 20000, "loss": 3.9998, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027810372279681576, "epoch": 0.2187161815799966, "percentage": 19.2}
	{"current_steps": 3872, "total_steps": 20000, "loss": 4.0982, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000277728038405255, "epoch": 0.22053881642649656, "percentage": 19.36}
	{"current_steps": 3904, "total_steps": 20000, "loss": 4.021, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002773494479820547, "epoch": 0.22236145127299653, "percentage": 19.52}
	{"current_steps": 3936, "total_steps": 20000, "loss": 3.982, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027696796128694965, "epoch": 0.2241840861194965, "percentage": 19.68}
	{"current_steps": 3968, "total_steps": 20000, "loss": 3.9666, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002765835881543379, "epoch": 0.22600672096599647, "percentage": 19.84}
	{"current_steps": 4000, "total_steps": 20000, "loss": 3.9463, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002761963384930274, "epoch": 0.22782935581249644, "percentage": 20.0}
	{"current_steps": 4032, "total_steps": 20000, "loss": 4.0947, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027580622228598055, "epoch": 0.2296519906589964, "percentage": 20.16}
	{"current_steps": 4064, "total_steps": 20000, "loss": 3.9191, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002754132495900569, "epoch": 0.23147462550549638, "percentage": 20.32}
	{"current_steps": 4096, "total_steps": 20000, "loss": 3.9013, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027501743053575365, "epoch": 0.23329726035199636, "percentage": 20.48}
	{"current_steps": 4128, "total_steps": 20000, "loss": 3.9748, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027461877532694476, "epoch": 0.23511989519849633, "percentage": 20.64}
	{"current_steps": 4160, "total_steps": 20000, "loss": 4.0505, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027421729424061787, "epoch": 0.2369425300449963, "percentage": 20.8}
	{"current_steps": 4192, "total_steps": 20000, "loss": 4.0524, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002738129976266092, "epoch": 0.23876516489149627, "percentage": 20.96}
	{"current_steps": 4224, "total_steps": 20000, "loss": 3.9289, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027340589590733687, "epoch": 0.24058779973799624, "percentage": 21.12}
	{"current_steps": 4256, "total_steps": 20000, "loss": 3.9631, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002729959995775323, "epoch": 0.2424104345844962, "percentage": 21.28}
	{"current_steps": 4288, "total_steps": 20000, "loss": 4.023, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027258331920396926, "epoch": 0.24423306943099618, "percentage": 21.44}
	{"current_steps": 4320, "total_steps": 20000, "loss": 3.9693, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00027216786542519225, "epoch": 0.24605570427749615, "percentage": 21.6}
	{"current_steps": 4352, "total_steps": 20000, "loss": 4.0566, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002717496489512413, "epoch": 0.24787833912399612, "percentage": 21.76}
	{"current_steps": 4384, "total_steps": 20000, "loss": 3.951, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002713286805633767, "epoch": 0.2497009739704961, "percentage": 21.92}
	{"current_steps": 4416, "total_steps": 20000, "loss": 3.7155, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002709049711138003, "epoch": 0.2515236088169961, "percentage": 22.08}
	{"current_steps": 4448, "total_steps": 20000, "loss": 3.8154, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002704785315253767, "epoch": 0.25334624366349606, "percentage": 22.24}
	{"current_steps": 4480, "total_steps": 20000, "loss": 4.0759, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002700493727913506, "epoch": 0.25516887850999603, "percentage": 22.4}
	{"current_steps": 4512, "total_steps": 20000, "loss": 3.817, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002696175059750642, "epoch": 0.256991513356496, "percentage": 22.56}
	{"current_steps": 4544, "total_steps": 20000, "loss": 3.8875, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026918294220967175, "epoch": 0.258814148202996, "percentage": 22.72}
	{"current_steps": 4576, "total_steps": 20000, "loss": 3.943, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026874569269785245, "epoch": 0.26063678304949595, "percentage": 22.88}
	{"current_steps": 4608, "total_steps": 20000, "loss": 3.9347, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026830576871152167, "epoch": 0.2624594178959959, "percentage": 23.04}
	{"current_steps": 4640, "total_steps": 20000, "loss": 3.8873, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026786318159154054, "epoch": 0.2642820527424959, "percentage": 23.2}
	{"current_steps": 4672, "total_steps": 20000, "loss": 3.7657, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002674179427474234, "epoch": 0.26610468758899586, "percentage": 23.36}
	{"current_steps": 4704, "total_steps": 20000, "loss": 4.0359, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002669700636570438, "epoch": 0.26792732243549583, "percentage": 23.52}
	{"current_steps": 4736, "total_steps": 20000, "loss": 3.8682, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002665195558663385, "epoch": 0.2697499572819958, "percentage": 23.68}
	{"current_steps": 4768, "total_steps": 20000, "loss": 3.8112, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026606643098900997, "epoch": 0.27157259212849577, "percentage": 23.84}
	{"current_steps": 4800, "total_steps": 20000, "loss": 4.0166, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002656107007062269, "epoch": 0.27339522697499574, "percentage": 24.0}
	{"current_steps": 4832, "total_steps": 20000, "loss": 3.7879, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026515237676632295, "epoch": 0.2752178618214957, "percentage": 24.16}
	{"current_steps": 4864, "total_steps": 20000, "loss": 3.9825, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002646914709844943, "epoch": 0.2770404966679957, "percentage": 24.32}
	{"current_steps": 4896, "total_steps": 20000, "loss": 3.8656, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002642279952424945, "epoch": 0.27886313151449565, "percentage": 24.48}
	{"current_steps": 4928, "total_steps": 20000, "loss": 3.7714, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002637619614883287, "epoch": 0.2806857663609956, "percentage": 24.64}
	{"current_steps": 4960, "total_steps": 20000, "loss": 3.8426, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026329338173594516, "epoch": 0.2825084012074956, "percentage": 24.8}
	{"current_steps": 4992, "total_steps": 20000, "loss": 3.8449, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026282226806492595, "epoch": 0.28433103605399557, "percentage": 24.96}
	{"current_steps": 5024, "total_steps": 20000, "loss": 3.9761, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026234863262017535, "epoch": 0.28615367090049554, "percentage": 25.12}
	{"current_steps": 5056, "total_steps": 20000, "loss": 4.0494, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026187248761160676, "epoch": 0.2879763057469955, "percentage": 25.28}
	{"current_steps": 5088, "total_steps": 20000, "loss": 3.8912, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026139384531382795, "epoch": 0.2897989405934955, "percentage": 25.44}
	{"current_steps": 5120, "total_steps": 20000, "loss": 3.9177, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00026091271806582476, "epoch": 0.29162157543999545, "percentage": 25.6}
	{"current_steps": 5152, "total_steps": 20000, "loss": 3.9875, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002604291182706428, "epoch": 0.2934442102864954, "percentage": 25.76}
	{"current_steps": 5184, "total_steps": 20000, "loss": 3.7827, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00025994305839506775, "epoch": 0.2952668451329954, "percentage": 25.92}
	{"current_steps": 5216, "total_steps": 20000, "loss": 3.9791, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002594545509693043, "epoch": 0.29708947997949536, "percentage": 26.08}
	{"current_steps": 5248, "total_steps": 20000, "loss": 3.7312, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002589636085866526, "epoch": 0.29891211482599533, "percentage": 26.24}
	{"current_steps": 5280, "total_steps": 20000, "loss": 3.8365, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00025847024390318406, "epoch": 0.3007347496724953, "percentage": 26.4}
	{"current_steps": 5312, "total_steps": 20000, "loss": 3.9364, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002579744696374148, "epoch": 0.3025573845189953, "percentage": 26.56}
	{"current_steps": 5344, "total_steps": 20000, "loss": 3.6989, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00025747629856997796, "epoch": 0.30438001936549525, "percentage": 26.72}
	{"current_steps": 5376, "total_steps": 20000, "loss": 3.6757, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002569757435432942, "epoch": 0.3062026542119952, "percentage": 26.88}
	{"current_steps": 5408, "total_steps": 20000, "loss": 3.794, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002564728174612405, "epoch": 0.3080252890584952, "percentage": 27.04}
	{"current_steps": 5440, "total_steps": 20000, "loss": 3.8299, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00025596753328881763, "epoch": 0.30984792390499516, "percentage": 27.2}
	{"current_steps": 5472, "total_steps": 20000, "loss": 3.8286, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000255459904051816, "epoch": 0.31167055875149513, "percentage": 27.36}
	{"current_steps": 5504, "total_steps": 20000, "loss": 3.8281, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002549499428364796, "epoch": 0.3134931935979951, "percentage": 27.52}
	{"current_steps": 5536, "total_steps": 20000, "loss": 3.8089, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002544376627891689, "epoch": 0.31531582844449507, "percentage": 27.68}
	{"current_steps": 5568, "total_steps": 20000, "loss": 3.7754, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002539230771160218, "epoch": 0.31713846329099504, "percentage": 27.84}
	{"current_steps": 5600, "total_steps": 20000, "loss": 3.8723, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002534061990826135, "epoch": 0.318961098137495, "percentage": 28.0}
	{"current_steps": 5632, "total_steps": 20000, "loss": 3.815, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002528870420136138, "epoch": 0.320783732983995, "percentage": 28.16}
	{"current_steps": 5664, "total_steps": 20000, "loss": 3.7078, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002523656192924445, "epoch": 0.32260636783049496, "percentage": 28.32}
	{"current_steps": 5696, "total_steps": 20000, "loss": 3.7814, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00025184194436093373, "epoch": 0.3244290026769949, "percentage": 28.48}
	{"current_steps": 5728, "total_steps": 20000, "loss": 3.6737, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00025131603071896976, "epoch": 0.3262516375234949, "percentage": 28.64}
	{"current_steps": 5760, "total_steps": 20000, "loss": 4.0052, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002507878919241529, "epoch": 0.32807427236999487, "percentage": 28.8}
	{"current_steps": 5792, "total_steps": 20000, "loss": 3.8064, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002502575415914458, "epoch": 0.32989690721649484, "percentage": 28.96}
	{"current_steps": 5824, "total_steps": 20000, "loss": 3.7766, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024972499339282286, "epoch": 0.3317195420629948, "percentage": 29.12}
	{"current_steps": 5856, "total_steps": 20000, "loss": 3.8121, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024919026105691756, "epoch": 0.3335421769094948, "percentage": 29.28}
	{"current_steps": 5888, "total_steps": 20000, "loss": 3.8076, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024865335836866845, "epoch": 0.33536481175599475, "percentage": 29.44}
	{"current_steps": 5920, "total_steps": 20000, "loss": 3.7648, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002481142991689638, "epoch": 0.3371874466024947, "percentage": 29.6}
	{"current_steps": 5952, "total_steps": 20000, "loss": 3.756, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024757309735428523, "epoch": 0.3390100814489947, "percentage": 29.76}
	{"current_steps": 5984, "total_steps": 20000, "loss": 3.5367, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002470297668763488, "epoch": 0.34083271629549466, "percentage": 29.92}
	{"current_steps": 6016, "total_steps": 20000, "loss": 3.7687, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024648432174174576, "epoch": 0.34265535114199464, "percentage": 30.08}
	{"current_steps": 6048, "total_steps": 20000, "loss": 3.8556, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024593677601158153, "epoch": 0.3444779859884946, "percentage": 30.24}
	{"current_steps": 6080, "total_steps": 20000, "loss": 3.947, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024538714380111285, "epoch": 0.3463006208349946, "percentage": 30.4}
	{"current_steps": 6112, "total_steps": 20000, "loss": 3.6322, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002448354392793843, "epoch": 0.34812325568149455, "percentage": 30.56}
	{"current_steps": 6144, "total_steps": 20000, "loss": 3.896, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002442816766688627, "epoch": 0.3499458905279945, "percentage": 30.72}
	{"current_steps": 6176, "total_steps": 20000, "loss": 3.6894, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024372587024507078, "epoch": 0.3517685253744945, "percentage": 30.88}
	{"current_steps": 6208, "total_steps": 20000, "loss": 3.7994, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024316803433621894, "epoch": 0.35359116022099446, "percentage": 31.04}
	{"current_steps": 6240, "total_steps": 20000, "loss": 3.7865, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024260818332283595, "epoch": 0.35541379506749443, "percentage": 31.2}
	{"current_steps": 6272, "total_steps": 20000, "loss": 3.7989, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024204633163739828, "epoch": 0.3572364299139944, "percentage": 31.36}
	{"current_steps": 6304, "total_steps": 20000, "loss": 3.7127, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002414824937639579, "epoch": 0.3590590647604944, "percentage": 31.52}
	{"current_steps": 6336, "total_steps": 20000, "loss": 3.6266, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00024091668423776915, "epoch": 0.36088169960699434, "percentage": 31.68}
	{"current_steps": 6368, "total_steps": 20000, "loss": 3.8128, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002403489176449137, "epoch": 0.3627043344534943, "percentage": 31.84}
	{"current_steps": 6400, "total_steps": 20000, "loss": 3.7633, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023977920862192488, "epoch": 0.3645269692999943, "percentage": 32.0}
	{"current_steps": 6432, "total_steps": 20000, "loss": 3.7562, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023920757185541007, "epoch": 0.36634960414649426, "percentage": 32.16}
	{"current_steps": 6464, "total_steps": 20000, "loss": 3.7413, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023863402208167228, "epoch": 0.3681722389929942, "percentage": 32.32}
	{"current_steps": 6496, "total_steps": 20000, "loss": 3.696, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023805857408633024, "epoch": 0.3699948738394942, "percentage": 32.48}
	{"current_steps": 6528, "total_steps": 20000, "loss": 3.7198, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000237481242703937, "epoch": 0.37181750868599417, "percentage": 32.64}
	{"current_steps": 6560, "total_steps": 20000, "loss": 3.8234, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023690204281759795, "epoch": 0.37364014353249414, "percentage": 32.8}
	{"current_steps": 6592, "total_steps": 20000, "loss": 3.6528, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002363209893585868, "epoch": 0.3754627783789941, "percentage": 32.96}
	{"current_steps": 6624, "total_steps": 20000, "loss": 3.8601, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023573809730596066, "epoch": 0.3772854132254941, "percentage": 33.12}
	{"current_steps": 6656, "total_steps": 20000, "loss": 3.8349, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002351533816861742, "epoch": 0.37910804807199405, "percentage": 33.28}
	{"current_steps": 6688, "total_steps": 20000, "loss": 3.6825, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023456685757269189, "epoch": 0.380930682918494, "percentage": 33.44}
	{"current_steps": 6720, "total_steps": 20000, "loss": 3.7653, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023397854008559975, "epoch": 0.382753317764994, "percentage": 33.6}
	{"current_steps": 6752, "total_steps": 20000, "loss": 3.8535, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023338844439121532, "epoch": 0.38457595261149397, "percentage": 33.76}
	{"current_steps": 6784, "total_steps": 20000, "loss": 3.6708, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023279658570169698, "epoch": 0.38639858745799394, "percentage": 33.92}
	{"current_steps": 6816, "total_steps": 20000, "loss": 3.6573, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023220297927465123, "epoch": 0.3882212223044939, "percentage": 34.08}
	{"current_steps": 6848, "total_steps": 20000, "loss": 3.6761, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002316076404127401, "epoch": 0.3900438571509939, "percentage": 34.24}
	{"current_steps": 6880, "total_steps": 20000, "loss": 3.449, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023101058446328625, "epoch": 0.3918664919974939, "percentage": 34.4}
	{"current_steps": 6912, "total_steps": 20000, "loss": 3.821, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00023041182681787713, "epoch": 0.3936891268439939, "percentage": 34.56}
	{"current_steps": 6944, "total_steps": 20000, "loss": 3.7888, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002298113829119687, "epoch": 0.39551176169049385, "percentage": 34.72}
	{"current_steps": 6976, "total_steps": 20000, "loss": 3.6945, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022920926822448716, "epoch": 0.3973343965369938, "percentage": 34.88}
	{"current_steps": 7008, "total_steps": 20000, "loss": 3.6882, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022860549827743, "epoch": 0.3991570313834938, "percentage": 35.04}
	{"current_steps": 7040, "total_steps": 20000, "loss": 3.8674, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022800008863546592, "epoch": 0.40097966622999376, "percentage": 35.2}
	{"current_steps": 7072, "total_steps": 20000, "loss": 3.6808, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022739305490553357, "epoch": 0.40280230107649373, "percentage": 35.36}
	{"current_steps": 7104, "total_steps": 20000, "loss": 3.7803, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022678441273643908, "epoch": 0.4046249359229937, "percentage": 35.52}
	{"current_steps": 7136, "total_steps": 20000, "loss": 3.6481, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022617417781845283, "epoch": 0.40644757076949367, "percentage": 35.68}
	{"current_steps": 7168, "total_steps": 20000, "loss": 3.5634, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022556236588290487, "epoch": 0.40827020561599364, "percentage": 35.84}
	{"current_steps": 7200, "total_steps": 20000, "loss": 3.6948, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002249489927017795, "epoch": 0.4100928404624936, "percentage": 36.0}
	{"current_steps": 7232, "total_steps": 20000, "loss": 3.5979, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022433407408730836, "epoch": 0.4119154753089936, "percentage": 36.16}
	{"current_steps": 7264, "total_steps": 20000, "loss": 3.6149, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022371762589156328, "epoch": 0.41373811015549355, "percentage": 36.32}
	{"current_steps": 7296, "total_steps": 20000, "loss": 3.6455, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022309966400604724, "epoch": 0.4155607450019935, "percentage": 36.48}
	{"current_steps": 7328, "total_steps": 20000, "loss": 3.7417, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022248020436128478, "epoch": 0.4173833798484935, "percentage": 36.64}
	{"current_steps": 7360, "total_steps": 20000, "loss": 3.746, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002218592629264116, "epoch": 0.41920601469499347, "percentage": 36.8}
	{"current_steps": 7392, "total_steps": 20000, "loss": 3.6838, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022123685570876237, "epoch": 0.42102864954149344, "percentage": 36.96}
	{"current_steps": 7424, "total_steps": 20000, "loss": 3.8068, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00022061299875345867, "epoch": 0.4228512843879934, "percentage": 37.12}
	{"current_steps": 7456, "total_steps": 20000, "loss": 3.6016, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021998770814299495, "epoch": 0.4246739192344934, "percentage": 37.28}
	{"current_steps": 7488, "total_steps": 20000, "loss": 3.7361, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021936099999682394, "epoch": 0.42649655408099335, "percentage": 37.44}
	{"current_steps": 7520, "total_steps": 20000, "loss": 3.8801, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021873289047094141, "epoch": 0.4283191889274933, "percentage": 37.6}
	{"current_steps": 7552, "total_steps": 20000, "loss": 3.6818, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002181033957574693, "epoch": 0.4301418237739933, "percentage": 37.76}
	{"current_steps": 7584, "total_steps": 20000, "loss": 3.6879, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002174725320842387, "epoch": 0.43196445862049326, "percentage": 37.92}
	{"current_steps": 7616, "total_steps": 20000, "loss": 3.6208, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021684031571437111, "epoch": 0.43378709346699323, "percentage": 38.08}
	{"current_steps": 7648, "total_steps": 20000, "loss": 3.6135, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021620676294585955, "epoch": 0.4356097283134932, "percentage": 38.24}
	{"current_steps": 7680, "total_steps": 20000, "loss": 3.7962, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002155718901111481, "epoch": 0.4374323631599932, "percentage": 38.4}
	{"current_steps": 7712, "total_steps": 20000, "loss": 3.6046, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021493571357671112, "epoch": 0.43925499800649315, "percentage": 38.56}
	{"current_steps": 7744, "total_steps": 20000, "loss": 3.4611, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002142982497426311, "epoch": 0.4410776328529931, "percentage": 38.72}
	{"current_steps": 7776, "total_steps": 20000, "loss": 3.7191, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021365951504217614, "epoch": 0.4429002676994931, "percentage": 38.88}
	{"current_steps": 7808, "total_steps": 20000, "loss": 3.7062, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021301952594137612, "epoch": 0.44472290254599306, "percentage": 39.04}
	{"current_steps": 7840, "total_steps": 20000, "loss": 3.6181, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021237829893859831, "epoch": 0.44654553739249303, "percentage": 39.2}
	{"current_steps": 7872, "total_steps": 20000, "loss": 3.8039, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002117358505641219, "epoch": 0.448368172238993, "percentage": 39.36}
	{"current_steps": 7904, "total_steps": 20000, "loss": 3.6247, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021109219737971217, "epoch": 0.45019080708549297, "percentage": 39.52}
	{"current_steps": 7936, "total_steps": 20000, "loss": 3.5254, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00021044735597819318, "epoch": 0.45201344193199294, "percentage": 39.68}
	{"current_steps": 7968, "total_steps": 20000, "loss": 3.7195, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020980134298302048, "epoch": 0.4538360767784929, "percentage": 39.84}
	{"current_steps": 8000, "total_steps": 20000, "loss": 3.6691, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020915417504785194, "epoch": 0.4556587116249929, "percentage": 40.0}
	{"current_steps": 8032, "total_steps": 20000, "loss": 3.6375, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000208505868856119, "epoch": 0.45748134647149286, "percentage": 40.16}
	{"current_steps": 8064, "total_steps": 20000, "loss": 3.6757, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020785644112059632, "epoch": 0.4593039813179928, "percentage": 40.32}
	{"current_steps": 8096, "total_steps": 20000, "loss": 3.5434, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002072059085829711, "epoch": 0.4611266161644928, "percentage": 40.48}
	{"current_steps": 8128, "total_steps": 20000, "loss": 3.4916, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020655428801341123, "epoch": 0.46294925101099277, "percentage": 40.64}
	{"current_steps": 8160, "total_steps": 20000, "loss": 3.6529, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002059015962101332, "epoch": 0.46477188585749274, "percentage": 40.8}
	{"current_steps": 8192, "total_steps": 20000, "loss": 3.6159, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020524784999896887, "epoch": 0.4665945207039927, "percentage": 40.96}
	{"current_steps": 8224, "total_steps": 20000, "loss": 3.5225, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002045930662329321, "epoch": 0.4684171555504927, "percentage": 41.12}
	{"current_steps": 8256, "total_steps": 20000, "loss": 3.6029, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002039372617917837, "epoch": 0.47023979039699265, "percentage": 41.28}
	{"current_steps": 8288, "total_steps": 20000, "loss": 3.5498, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020328045358159678, "epoch": 0.4720624252434926, "percentage": 41.44}
	{"current_steps": 8320, "total_steps": 20000, "loss": 3.7112, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020262265853432084, "epoch": 0.4738850600899926, "percentage": 41.6}
	{"current_steps": 8352, "total_steps": 20000, "loss": 3.7622, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020196389360734485, "epoch": 0.47570769493649256, "percentage": 41.76}
	{"current_steps": 8384, "total_steps": 20000, "loss": 3.9205, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00020130417578306082, "epoch": 0.47753032978299254, "percentage": 41.92}
	{"current_steps": 8416, "total_steps": 20000, "loss": 3.6771, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0002006435220684255, "epoch": 0.4793529646294925, "percentage": 42.08}
	{"current_steps": 8448, "total_steps": 20000, "loss": 3.6222, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019998194949452192, "epoch": 0.4811755994759925, "percentage": 42.24}
	{"current_steps": 8480, "total_steps": 20000, "loss": 3.6102, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019931947511612076, "epoch": 0.48299823432249245, "percentage": 42.4}
	{"current_steps": 8512, "total_steps": 20000, "loss": 3.476, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019865611601124024, "epoch": 0.4848208691689924, "percentage": 42.56}
	{"current_steps": 8544, "total_steps": 20000, "loss": 3.4903, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001979918892807062, "epoch": 0.4866435040154924, "percentage": 42.72}
	{"current_steps": 8576, "total_steps": 20000, "loss": 3.4669, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001973268120477111, "epoch": 0.48846613886199236, "percentage": 42.88}
	{"current_steps": 8608, "total_steps": 20000, "loss": 3.5432, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001966609014573726, "epoch": 0.49028877370849233, "percentage": 43.04}
	{"current_steps": 8640, "total_steps": 20000, "loss": 3.8211, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019599417467629153, "epoch": 0.4921114085549923, "percentage": 43.2}
	{"current_steps": 8672, "total_steps": 20000, "loss": 3.7261, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019532664889210957, "epoch": 0.4939340434014923, "percentage": 43.36}
	{"current_steps": 8704, "total_steps": 20000, "loss": 3.5414, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001946583413130658, "epoch": 0.49575667824799224, "percentage": 43.52}
	{"current_steps": 8736, "total_steps": 20000, "loss": 3.5808, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019398926916755355, "epoch": 0.4975793130944922, "percentage": 43.68}
	{"current_steps": 8768, "total_steps": 20000, "loss": 3.5779, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019331944970367573, "epoch": 0.4994019479409922, "percentage": 43.84}
	{"current_steps": 8800, "total_steps": 20000, "loss": 3.5607, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019264890018880074, "epoch": 0.5012245827874922, "percentage": 44.0}
	{"current_steps": 8832, "total_steps": 20000, "loss": 3.6896, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019197763790911685, "epoch": 0.5030472176339922, "percentage": 44.16}
	{"current_steps": 8864, "total_steps": 20000, "loss": 3.5745, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000191305680169187, "epoch": 0.5048698524804921, "percentage": 44.32}
	{"current_steps": 8896, "total_steps": 20000, "loss": 3.7164, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00019063304429150233, "epoch": 0.5066924873269921, "percentage": 44.48}
	{"current_steps": 8928, "total_steps": 20000, "loss": 3.6807, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018995974761603583, "epoch": 0.508515122173492, "percentage": 44.64}
	{"current_steps": 8960, "total_steps": 20000, "loss": 3.7764, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018928580749979525, "epoch": 0.5103377570199921, "percentage": 44.8}
	{"current_steps": 8992, "total_steps": 20000, "loss": 3.563, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018861124131637586, "epoch": 0.512160391866492, "percentage": 44.96}
	{"current_steps": 9024, "total_steps": 20000, "loss": 3.6327, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018793606645551217, "epoch": 0.513983026712992, "percentage": 45.12}
	{"current_steps": 9056, "total_steps": 20000, "loss": 3.771, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018726030032263004, "epoch": 0.5158056615594919, "percentage": 45.28}
	{"current_steps": 9088, "total_steps": 20000, "loss": 3.5535, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001865839603383977, "epoch": 0.517628296405992, "percentage": 45.44}
	{"current_steps": 9120, "total_steps": 20000, "loss": 3.7299, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018590706393827684, "epoch": 0.5194509312524919, "percentage": 45.6}
	{"current_steps": 9152, "total_steps": 20000, "loss": 3.6769, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018522962857207308, "epoch": 0.5212735660989919, "percentage": 45.76}
	{"current_steps": 9184, "total_steps": 20000, "loss": 3.6492, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018455167170348616, "epoch": 0.5230962009454918, "percentage": 45.92}
	{"current_steps": 9216, "total_steps": 20000, "loss": 3.499, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018387321080965953, "epoch": 0.5249188357919918, "percentage": 46.08}
	{"current_steps": 9248, "total_steps": 20000, "loss": 3.5919, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001831942633807301, "epoch": 0.5267414706384917, "percentage": 46.24}
	{"current_steps": 9280, "total_steps": 20000, "loss": 3.7526, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018251484691937723, "epoch": 0.5285641054849918, "percentage": 46.4}
	{"current_steps": 9312, "total_steps": 20000, "loss": 3.4012, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018183497894037152, "epoch": 0.5303867403314917, "percentage": 46.56}
	{"current_steps": 9344, "total_steps": 20000, "loss": 3.6739, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00018115467697012337, "epoch": 0.5322093751779917, "percentage": 46.72}
	{"current_steps": 9376, "total_steps": 20000, "loss": 3.5556, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000180473958546231, "epoch": 0.5340320100244916, "percentage": 46.88}
	{"current_steps": 9408, "total_steps": 20000, "loss": 3.6137, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017979284121702842, "epoch": 0.5358546448709917, "percentage": 47.04}
	{"current_steps": 9440, "total_steps": 20000, "loss": 3.5903, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001791113425411332, "epoch": 0.5376772797174916, "percentage": 47.2}
	{"current_steps": 9472, "total_steps": 20000, "loss": 3.5073, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017842948008699365, "epoch": 0.5394999145639916, "percentage": 47.36}
	{"current_steps": 9504, "total_steps": 20000, "loss": 3.5026, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017774727143243598, "epoch": 0.5413225494104915, "percentage": 47.52}
	{"current_steps": 9536, "total_steps": 20000, "loss": 3.6944, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017706473416421098, "epoch": 0.5431451842569915, "percentage": 47.68}
	{"current_steps": 9568, "total_steps": 20000, "loss": 3.6534, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017638188587754114, "epoch": 0.5449678191034915, "percentage": 47.84}
	{"current_steps": 9600, "total_steps": 20000, "loss": 3.6599, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017569874417566644, "epoch": 0.5467904539499915, "percentage": 48.0}
	{"current_steps": 9632, "total_steps": 20000, "loss": 3.5849, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017501532666939105, "epoch": 0.5486130887964914, "percentage": 48.16}
	{"current_steps": 9664, "total_steps": 20000, "loss": 3.6269, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017433165097662897, "epoch": 0.5504357236429914, "percentage": 48.32}
	{"current_steps": 9696, "total_steps": 20000, "loss": 3.4433, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017364773472195024, "epoch": 0.5522583584894913, "percentage": 48.48}
	{"current_steps": 9728, "total_steps": 20000, "loss": 3.5819, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017296359553612615, "epoch": 0.5540809933359914, "percentage": 48.64}
	{"current_steps": 9760, "total_steps": 20000, "loss": 3.6691, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017227925105567512, "epoch": 0.5559036281824913, "percentage": 48.8}
	{"current_steps": 9792, "total_steps": 20000, "loss": 3.4785, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001715947189224078, "epoch": 0.5577262630289913, "percentage": 48.96}
	{"current_steps": 9824, "total_steps": 20000, "loss": 3.5475, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017091001678297242, "epoch": 0.5595488978754912, "percentage": 49.12}
	{"current_steps": 9856, "total_steps": 20000, "loss": 3.6051, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00017022516228839985, "epoch": 0.5613715327219913, "percentage": 49.28}
	{"current_steps": 9888, "total_steps": 20000, "loss": 3.7461, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001695401730936484, "epoch": 0.5631941675684912, "percentage": 49.44}
	{"current_steps": 9920, "total_steps": 20000, "loss": 3.675, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016885506685714895, "epoch": 0.5650168024149912, "percentage": 49.6}
	{"current_steps": 9952, "total_steps": 20000, "loss": 3.5888, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016816986124034976, "epoch": 0.5668394372614911, "percentage": 49.76}
	{"current_steps": 9984, "total_steps": 20000, "loss": 3.6282, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001674845739072607, "epoch": 0.5686620721079911, "percentage": 49.92}
	{"current_steps": 10016, "total_steps": 20000, "loss": 3.4105, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016679922252399841, "epoch": 0.570484706954491, "percentage": 50.08}
	{"current_steps": 10048, "total_steps": 20000, "loss": 3.6361, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016611382475833068, "epoch": 0.5723073418009911, "percentage": 50.24}
	{"current_steps": 10080, "total_steps": 20000, "loss": 3.5517, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000165428398279221, "epoch": 0.574129976647491, "percentage": 50.4}
	{"current_steps": 10112, "total_steps": 20000, "loss": 3.6401, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016474296075637306, "epoch": 0.575952611493991, "percentage": 50.56}
	{"current_steps": 10144, "total_steps": 20000, "loss": 3.4805, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016405752985977517, "epoch": 0.5777752463404909, "percentage": 50.72}
	{"current_steps": 10176, "total_steps": 20000, "loss": 3.5557, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016337212325924494, "epoch": 0.579597881186991, "percentage": 50.88}
	{"current_steps": 10208, "total_steps": 20000, "loss": 3.567, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001626867586239736, "epoch": 0.5814205160334909, "percentage": 51.04}
	{"current_steps": 10240, "total_steps": 20000, "loss": 3.6031, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001620014536220705, "epoch": 0.5832431508799909, "percentage": 51.2}
	{"current_steps": 10272, "total_steps": 20000, "loss": 3.4674, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016131622592010784, "epoch": 0.5850657857264908, "percentage": 51.36}
	{"current_steps": 10304, "total_steps": 20000, "loss": 3.5487, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00016063109318266487, "epoch": 0.5868884205729908, "percentage": 51.52}
	{"current_steps": 10336, "total_steps": 20000, "loss": 3.4222, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001599460730718729, "epoch": 0.5887110554194908, "percentage": 51.68}
	{"current_steps": 10368, "total_steps": 20000, "loss": 3.4814, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015926118324695982, "epoch": 0.5905336902659908, "percentage": 51.84}
	{"current_steps": 10400, "total_steps": 20000, "loss": 3.4907, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001585764413637948, "epoch": 0.5923563251124907, "percentage": 52.0}
	{"current_steps": 10432, "total_steps": 20000, "loss": 3.5135, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015789186507443324, "epoch": 0.5941789599589907, "percentage": 52.16}
	{"current_steps": 10464, "total_steps": 20000, "loss": 3.5683, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015720747202666163, "epoch": 0.5960015948054906, "percentage": 52.32}
	{"current_steps": 10496, "total_steps": 20000, "loss": 3.5334, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001565232798635427, "epoch": 0.5978242296519907, "percentage": 52.48}
	{"current_steps": 10528, "total_steps": 20000, "loss": 3.805, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001558393062229605, "epoch": 0.5996468644984906, "percentage": 52.64}
	{"current_steps": 10560, "total_steps": 20000, "loss": 3.475, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015515556873716584, "epoch": 0.6014694993449906, "percentage": 52.8}
	{"current_steps": 10592, "total_steps": 20000, "loss": 3.6168, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015447208503232158, "epoch": 0.6032921341914905, "percentage": 52.96}
	{"current_steps": 10624, "total_steps": 20000, "loss": 3.4482, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015378887272804838, "epoch": 0.6051147690379906, "percentage": 53.12}
	{"current_steps": 10656, "total_steps": 20000, "loss": 3.504, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015310594943697032, "epoch": 0.6069374038844905, "percentage": 53.28}
	{"current_steps": 10688, "total_steps": 20000, "loss": 3.5016, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015242333276426108, "epoch": 0.6087600387309905, "percentage": 53.44}
	{"current_steps": 10720, "total_steps": 20000, "loss": 3.447, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015174104030718998, "epoch": 0.6105826735774904, "percentage": 53.6}
	{"current_steps": 10752, "total_steps": 20000, "loss": 3.7044, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001510590896546683, "epoch": 0.6124053084239904, "percentage": 53.76}
	{"current_steps": 10784, "total_steps": 20000, "loss": 3.612, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00015037749838679593, "epoch": 0.6142279432704904, "percentage": 53.92}
	{"current_steps": 10816, "total_steps": 20000, "loss": 3.3875, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014969628407440806, "epoch": 0.6160505781169904, "percentage": 54.08}
	{"current_steps": 10848, "total_steps": 20000, "loss": 3.6838, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014901546427862234, "epoch": 0.6178732129634903, "percentage": 54.24}
	{"current_steps": 10880, "total_steps": 20000, "loss": 3.4442, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001483350565503862, "epoch": 0.6196958478099903, "percentage": 54.4}
	{"current_steps": 10912, "total_steps": 20000, "loss": 3.6602, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014765507843002418, "epoch": 0.6215184826564902, "percentage": 54.56}
	{"current_steps": 10944, "total_steps": 20000, "loss": 3.6658, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014697554744678596, "epoch": 0.6233411175029903, "percentage": 54.72}
	{"current_steps": 10976, "total_steps": 20000, "loss": 3.3246, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014629648111839452, "epoch": 0.6251637523494903, "percentage": 54.88}
	{"current_steps": 11008, "total_steps": 20000, "loss": 3.4986, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001456178969505942, "epoch": 0.6269863871959902, "percentage": 55.04}
	{"current_steps": 11040, "total_steps": 20000, "loss": 3.5654, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014493981243669983, "epoch": 0.6288090220424902, "percentage": 55.2}
	{"current_steps": 11072, "total_steps": 20000, "loss": 3.5269, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014426224505714556, "epoch": 0.6306316568889901, "percentage": 55.36}
	{"current_steps": 11104, "total_steps": 20000, "loss": 3.5738, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001435852122790343, "epoch": 0.6324542917354902, "percentage": 55.52}
	{"current_steps": 11136, "total_steps": 20000, "loss": 3.6372, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001429087315556873, "epoch": 0.6342769265819901, "percentage": 55.68}
	{"current_steps": 11168, "total_steps": 20000, "loss": 3.3446, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014223282032619445, "epoch": 0.6360995614284901, "percentage": 55.84}
	{"current_steps": 11200, "total_steps": 20000, "loss": 3.5913, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001415574960149644, "epoch": 0.63792219627499, "percentage": 56.0}
	{"current_steps": 11232, "total_steps": 20000, "loss": 3.5349, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014088277603127567, "epoch": 0.63974483112149, "percentage": 56.16}
	{"current_steps": 11264, "total_steps": 20000, "loss": 3.4422, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00014020867776882778, "epoch": 0.64156746596799, "percentage": 56.32}
	{"current_steps": 11296, "total_steps": 20000, "loss": 3.4884, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001395352186052927, "epoch": 0.64339010081449, "percentage": 56.48}
	{"current_steps": 11328, "total_steps": 20000, "loss": 3.5927, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000138862415901867, "epoch": 0.6452127356609899, "percentage": 56.64}
	{"current_steps": 11360, "total_steps": 20000, "loss": 3.4533, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001381902870028244, "epoch": 0.6470353705074899, "percentage": 56.8}
	{"current_steps": 11392, "total_steps": 20000, "loss": 3.5376, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013751884923506833, "epoch": 0.6488580053539899, "percentage": 56.96}
	{"current_steps": 11424, "total_steps": 20000, "loss": 3.659, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013684811990768558, "epoch": 0.6506806402004899, "percentage": 57.12}
	{"current_steps": 11456, "total_steps": 20000, "loss": 3.5734, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013617811631149988, "epoch": 0.6525032750469898, "percentage": 57.28}
	{"current_steps": 11488, "total_steps": 20000, "loss": 3.6587, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013550885571862647, "epoch": 0.6543259098934898, "percentage": 57.44}
	{"current_steps": 11520, "total_steps": 20000, "loss": 3.5469, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013484035538202616, "epoch": 0.6561485447399897, "percentage": 57.6}
	{"current_steps": 11552, "total_steps": 20000, "loss": 3.6726, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013417263253506147, "epoch": 0.6579711795864898, "percentage": 57.76}
	{"current_steps": 11584, "total_steps": 20000, "loss": 3.3987, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013350570439105158, "epoch": 0.6597938144329897, "percentage": 57.92}
	{"current_steps": 11616, "total_steps": 20000, "loss": 3.4946, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001328395881428292, "epoch": 0.6616164492794897, "percentage": 58.08}
	{"current_steps": 11648, "total_steps": 20000, "loss": 3.4551, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001321743009622967, "epoch": 0.6634390841259896, "percentage": 58.24}
	{"current_steps": 11680, "total_steps": 20000, "loss": 3.5396, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013150985999998415, "epoch": 0.6652617189724896, "percentage": 58.4}
	{"current_steps": 11712, "total_steps": 20000, "loss": 3.5134, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001308462823846066, "epoch": 0.6670843538189896, "percentage": 58.56}
	{"current_steps": 11744, "total_steps": 20000, "loss": 3.6401, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00013018358522262288, "epoch": 0.6689069886654896, "percentage": 58.72}
	{"current_steps": 11776, "total_steps": 20000, "loss": 3.5408, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012952178559779454, "epoch": 0.6707296235119895, "percentage": 58.88}
	{"current_steps": 11808, "total_steps": 20000, "loss": 3.4689, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001288609005707453, "epoch": 0.6725522583584895, "percentage": 59.04}
	{"current_steps": 11840, "total_steps": 20000, "loss": 3.5513, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001282009471785213, "epoch": 0.6743748932049894, "percentage": 59.2}
	{"current_steps": 11872, "total_steps": 20000, "loss": 3.4985, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012754194243415202, "epoch": 0.6761975280514895, "percentage": 59.36}
	{"current_steps": 11904, "total_steps": 20000, "loss": 3.3898, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012688390332621165, "epoch": 0.6780201628979894, "percentage": 59.52}
	{"current_steps": 11936, "total_steps": 20000, "loss": 3.446, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012622684681838102, "epoch": 0.6798427977444894, "percentage": 59.68}
	{"current_steps": 11968, "total_steps": 20000, "loss": 3.4879, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012557078984901042, "epoch": 0.6816654325909893, "percentage": 59.84}
	{"current_steps": 12000, "total_steps": 20000, "loss": 3.4652, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012491574933068292, "epoch": 0.6834880674374894, "percentage": 60.0}
	{"current_steps": 12032, "total_steps": 20000, "loss": 3.5784, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012426174214977823, "epoch": 0.6853107022839893, "percentage": 60.16}
	{"current_steps": 12064, "total_steps": 20000, "loss": 3.5508, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012360878516603764, "epoch": 0.6871333371304893, "percentage": 60.32}
	{"current_steps": 12096, "total_steps": 20000, "loss": 3.4962, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001229568952121293, "epoch": 0.6889559719769892, "percentage": 60.48}
	{"current_steps": 12128, "total_steps": 20000, "loss": 3.4576, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012230608909321412, "epoch": 0.6907786068234892, "percentage": 60.64}
	{"current_steps": 12160, "total_steps": 20000, "loss": 3.5288, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012165638358651273, "epoch": 0.6926012416699892, "percentage": 60.8}
	{"current_steps": 12192, "total_steps": 20000, "loss": 3.4696, "eval_loss": null, "predict_loss": null, "learning_rate": 0.000121007795440873, "epoch": 0.6944238765164892, "percentage": 60.96}
	{"current_steps": 12224, "total_steps": 20000, "loss": 3.5382, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00012036034137633809, "epoch": 0.6962465113629891, "percentage": 61.12}
	{"current_steps": 12256, "total_steps": 20000, "loss": 3.4682, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011971403808371557, "epoch": 0.6980691462094891, "percentage": 61.28}
	{"current_steps": 12288, "total_steps": 20000, "loss": 3.3782, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011906890222414711, "epoch": 0.699891781055989, "percentage": 61.44}
	{"current_steps": 12320, "total_steps": 20000, "loss": 3.4854, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011842495042867899, "epoch": 0.7017144159024891, "percentage": 61.6}
	{"current_steps": 12352, "total_steps": 20000, "loss": 3.4986, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011778219929783322, "epoch": 0.703537050748989, "percentage": 61.76}
	{"current_steps": 12384, "total_steps": 20000, "loss": 3.4748, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011714066540117983, "epoch": 0.705359685595489, "percentage": 61.92}
	{"current_steps": 12416, "total_steps": 20000, "loss": 3.515, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011650036527690956, "epoch": 0.7071823204419889, "percentage": 62.08}
	{"current_steps": 12448, "total_steps": 20000, "loss": 3.4306, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011586131543140762, "epoch": 0.709004955288489, "percentage": 62.24}
	{"current_steps": 12480, "total_steps": 20000, "loss": 3.3721, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011522353233882803, "epoch": 0.7108275901349889, "percentage": 62.4}
	{"current_steps": 12512, "total_steps": 20000, "loss": 3.2683, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011458703244066896, "epoch": 0.7126502249814889, "percentage": 62.56}
	{"current_steps": 12544, "total_steps": 20000, "loss": 3.4729, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001139518321453491, "epoch": 0.7144728598279888, "percentage": 62.72}
	{"current_steps": 12576, "total_steps": 20000, "loss": 3.5516, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011331794782778444, "epoch": 0.7162954946744888, "percentage": 62.88}
	{"current_steps": 12608, "total_steps": 20000, "loss": 3.5837, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001126853958289661, "epoch": 0.7181181295209887, "percentage": 63.04}
	{"current_steps": 12640, "total_steps": 20000, "loss": 3.3683, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011205419245553924, "epoch": 0.7199407643674888, "percentage": 63.2}
	{"current_steps": 12672, "total_steps": 20000, "loss": 3.4721, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011142435397938273, "epoch": 0.7217633992139887, "percentage": 63.36}
	{"current_steps": 12704, "total_steps": 20000, "loss": 3.4573, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011079589663718931, "epoch": 0.7235860340604887, "percentage": 63.52}
	{"current_steps": 12736, "total_steps": 20000, "loss": 3.4366, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00011016883663004754, "epoch": 0.7254086689069886, "percentage": 63.68}
	{"current_steps": 12768, "total_steps": 20000, "loss": 3.3886, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010954319012302369, "epoch": 0.7272313037534887, "percentage": 63.84}
	{"current_steps": 12800, "total_steps": 20000, "loss": 3.382, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010891897324474534, "epoch": 0.7290539385999886, "percentage": 64.0}
	{"current_steps": 12832, "total_steps": 20000, "loss": 3.3509, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010829620208698547, "epoch": 0.7308765734464886, "percentage": 64.16}
	{"current_steps": 12864, "total_steps": 20000, "loss": 3.4454, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001076748927042475, "epoch": 0.7326992082929885, "percentage": 64.32}
	{"current_steps": 12896, "total_steps": 20000, "loss": 3.4615, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010705506111335171, "epoch": 0.7345218431394885, "percentage": 64.48}
	{"current_steps": 12928, "total_steps": 20000, "loss": 3.4641, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010643672329302207, "epoch": 0.7363444779859885, "percentage": 64.64}
	{"current_steps": 12960, "total_steps": 20000, "loss": 3.4309, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010581989518347453, "epoch": 0.7381671128324885, "percentage": 64.8}
	{"current_steps": 12992, "total_steps": 20000, "loss": 3.5289, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010520459268600592, "epoch": 0.7399897476789884, "percentage": 64.96}
	{"current_steps": 13024, "total_steps": 20000, "loss": 3.4022, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010459083166258416, "epoch": 0.7418123825254884, "percentage": 65.12}
	{"current_steps": 13056, "total_steps": 20000, "loss": 3.4717, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001039786279354392, "epoch": 0.7436350173719883, "percentage": 65.28}
	{"current_steps": 13088, "total_steps": 20000, "loss": 3.5262, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010336799728665537, "epoch": 0.7454576522184884, "percentage": 65.44}
	{"current_steps": 13120, "total_steps": 20000, "loss": 3.5129, "eval_loss": null, "predict_loss": null, "learning_rate": 0.0001027589554577643, "epoch": 0.7472802870649883, "percentage": 65.6}
	{"current_steps": 13152, "total_steps": 20000, "loss": 3.3454, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010215151814933922, "epoch": 0.7491029219114883, "percentage": 65.76}
	{"current_steps": 13184, "total_steps": 20000, "loss": 3.3002, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010154570102059024, "epoch": 0.7509255567579882, "percentage": 65.92}
	{"current_steps": 13216, "total_steps": 20000, "loss": 3.3141, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010094151968896062, "epoch": 0.7527481916044882, "percentage": 66.08}
	{"current_steps": 13248, "total_steps": 20000, "loss": 3.5017, "eval_loss": null, "predict_loss": null, "learning_rate": 0.00010033898972972423, "epoch": 0.7545708264509882, "percentage": 66.24}
	{"current_steps": 13280, "total_steps": 20000, "loss": 3.4135, "eval_loss": null, "predict_loss": null, "learning_rate": 9.973812667558385e-05, "epoch": 0.7563934612974882, "percentage": 66.4}
	{"current_steps": 13312, "total_steps": 20000, "loss": 3.3258, "eval_loss": null, "predict_loss": null, "learning_rate": 9.913894601627107e-05, "epoch": 0.7582160961439881, "percentage": 66.56}
	{"current_steps": 13344, "total_steps": 20000, "loss": 3.4969, "eval_loss": null, "predict_loss": null, "learning_rate": 9.854146319814667e-05, "epoch": 0.7600387309904881, "percentage": 66.72}
	{"current_steps": 13376, "total_steps": 20000, "loss": 3.391, "eval_loss": null, "predict_loss": null, "learning_rate": 9.794569362380249e-05, "epoch": 0.761861365836988, "percentage": 66.88}
	{"current_steps": 13408, "total_steps": 20000, "loss": 3.5774, "eval_loss": null, "predict_loss": null, "learning_rate": 9.735165265166456e-05, "epoch": 0.7636840006834881, "percentage": 67.04}
	{"current_steps": 13440, "total_steps": 20000, "loss": 3.4524, "eval_loss": null, "predict_loss": null, "learning_rate": 9.675935559559702e-05, "epoch": 0.765506635529988, "percentage": 67.2}
	{"current_steps": 13472, "total_steps": 20000, "loss": 3.6359, "eval_loss": null, "predict_loss": null, "learning_rate": 9.616881772450724e-05, "epoch": 0.767329270376488, "percentage": 67.36}
	{"current_steps": 13504, "total_steps": 20000, "loss": 3.4489, "eval_loss": null, "predict_loss": null, "learning_rate": 9.558005426195242e-05, "epoch": 0.7691519052229879, "percentage": 67.52}
	{"current_steps": 13536, "total_steps": 20000, "loss": 3.2775, "eval_loss": null, "predict_loss": null, "learning_rate": 9.499308038574699e-05, "epoch": 0.770974540069488, "percentage": 67.68}
	{"current_steps": 13568, "total_steps": 20000, "loss": 3.5144, "eval_loss": null, "predict_loss": null, "learning_rate": 9.440791122757145e-05, "epoch": 0.7727971749159879, "percentage": 67.84}
	{"current_steps": 13600, "total_steps": 20000, "loss": 3.3279, "eval_loss": null, "predict_loss": null, "learning_rate": 9.382456187258217e-05, "epoch": 0.7746198097624879, "percentage": 68.0}
	{"current_steps": 13632, "total_steps": 20000, "loss": 3.3244, "eval_loss": null, "predict_loss": null, "learning_rate": 9.324304735902253e-05, "epoch": 0.7764424446089878, "percentage": 68.16}
	{"current_steps": 13664, "total_steps": 20000, "loss": 3.3064, "eval_loss": null, "predict_loss": null, "learning_rate": 9.266338267783541e-05, "epoch": 0.7782650794554878, "percentage": 68.32}
	{"current_steps": 13696, "total_steps": 20000, "loss": 3.4345, "eval_loss": null, "predict_loss": null, "learning_rate": 9.208558277227653e-05, "epoch": 0.7800877143019878, "percentage": 68.48}
	{"current_steps": 13728, "total_steps": 20000, "loss": 3.3302, "eval_loss": null, "predict_loss": null, "learning_rate": 9.150966253752919e-05, "epoch": 0.7819103491484878, "percentage": 68.64}
	{"current_steps": 13760, "total_steps": 20000, "loss": 3.4702, "eval_loss": null, "predict_loss": null, "learning_rate": 9.093563682032058e-05, "epoch": 0.7837329839949878, "percentage": 68.8}
	{"current_steps": 13792, "total_steps": 20000, "loss": 3.3884, "eval_loss": null, "predict_loss": null, "learning_rate": 9.036352041853875e-05, "epoch": 0.7855556188414877, "percentage": 68.96}
	{"current_steps": 13824, "total_steps": 20000, "loss": 3.3936, "eval_loss": null, "predict_loss": null, "learning_rate": 8.979332808085124e-05, "epoch": 0.7873782536879878, "percentage": 69.12}
	{"current_steps": 13856, "total_steps": 20000, "loss": 3.3741, "eval_loss": null, "predict_loss": null, "learning_rate": 8.922507450632498e-05, "epoch": 0.7892008885344877, "percentage": 69.28}
	{"current_steps": 13888, "total_steps": 20000, "loss": 3.3988, "eval_loss": null, "predict_loss": null, "learning_rate": 8.865877434404718e-05, "epoch": 0.7910235233809877, "percentage": 69.44}
	{"current_steps": 13920, "total_steps": 20000, "loss": 3.4056, "eval_loss": null, "predict_loss": null, "learning_rate": 8.809444219274776e-05, "epoch": 0.7928461582274876, "percentage": 69.6}
	{"current_steps": 13952, "total_steps": 20000, "loss": 3.4124, "eval_loss": null, "predict_loss": null, "learning_rate": 8.753209260042303e-05, "epoch": 0.7946687930739876, "percentage": 69.76}
	{"current_steps": 13984, "total_steps": 20000, "loss": 3.3623, "eval_loss": null, "predict_loss": null, "learning_rate": 8.697174006396064e-05, "epoch": 0.7964914279204875, "percentage": 69.92}
	{"current_steps": 14016, "total_steps": 20000, "loss": 3.3605, "eval_loss": null, "predict_loss": null, "learning_rate": 8.641339902876595e-05, "epoch": 0.7983140627669876, "percentage": 70.08}
	{"current_steps": 14048, "total_steps": 20000, "loss": 3.4132, "eval_loss": null, "predict_loss": null, "learning_rate": 8.585708388838935e-05, "epoch": 0.8001366976134875, "percentage": 70.24}
	{"current_steps": 14080, "total_steps": 20000, "loss": 3.4014, "eval_loss": null, "predict_loss": null, "learning_rate": 8.530280898415551e-05, "epoch": 0.8019593324599875, "percentage": 70.4}
	{"current_steps": 14112, "total_steps": 20000, "loss": 3.3893, "eval_loss": null, "predict_loss": null, "learning_rate": 8.475058860479362e-05, "epoch": 0.8037819673064874, "percentage": 70.56}
	{"current_steps": 14144, "total_steps": 20000, "loss": 3.3038, "eval_loss": null, "predict_loss": null, "learning_rate": 8.420043698606898e-05, "epoch": 0.8056046021529875, "percentage": 70.72}
	{"current_steps": 14176, "total_steps": 20000, "loss": 3.3374, "eval_loss": null, "predict_loss": null, "learning_rate": 8.365236831041596e-05, "epoch": 0.8074272369994874, "percentage": 70.88}
	{"current_steps": 14208, "total_steps": 20000, "loss": 3.3515, "eval_loss": null, "predict_loss": null, "learning_rate": 8.31063967065725e-05, "epoch": 0.8092498718459874, "percentage": 71.04}
	{"current_steps": 14240, "total_steps": 20000, "loss": 3.4038, "eval_loss": null, "predict_loss": null, "learning_rate": 8.256253624921584e-05, "epoch": 0.8110725066924873, "percentage": 71.2}
	{"current_steps": 14272, "total_steps": 20000, "loss": 3.0866, "eval_loss": null, "predict_loss": null, "learning_rate": 8.202080095859966e-05, "epoch": 0.8128951415389873, "percentage": 71.36}
	{"current_steps": 14304, "total_steps": 20000, "loss": 3.4988, "eval_loss": null, "predict_loss": null, "learning_rate": 8.148120480019276e-05, "epoch": 0.8147177763854873, "percentage": 71.52}
	{"current_steps": 14336, "total_steps": 20000, "loss": 3.4212, "eval_loss": null, "predict_loss": null, "learning_rate": 8.094376168431873e-05, "epoch": 0.8165404112319873, "percentage": 71.68}
	{"current_steps": 14368, "total_steps": 20000, "loss": 3.2785, "eval_loss": null, "predict_loss": null, "learning_rate": 8.040848546579788e-05, "epoch": 0.8183630460784872, "percentage": 71.84}
	{"current_steps": 14400, "total_steps": 20000, "loss": 3.34, "eval_loss": null, "predict_loss": null, "learning_rate": 7.98753899435895e-05, "epoch": 0.8201856809249872, "percentage": 72.0}
	{"current_steps": 14432, "total_steps": 20000, "loss": 3.4378, "eval_loss": null, "predict_loss": null, "learning_rate": 7.93444888604366e-05, "epoch": 0.8220083157714871, "percentage": 72.16}
	{"current_steps": 14464, "total_steps": 20000, "loss": 3.3012, "eval_loss": null, "predict_loss": null, "learning_rate": 7.881579590251135e-05, "epoch": 0.8238309506179872, "percentage": 72.32}
	{"current_steps": 14496, "total_steps": 20000, "loss": 3.4742, "eval_loss": null, "predict_loss": null, "learning_rate": 7.82893246990624e-05, "epoch": 0.8256535854644871, "percentage": 72.48}
	{"current_steps": 14528, "total_steps": 20000, "loss": 3.3974, "eval_loss": null, "predict_loss": null, "learning_rate": 7.77650888220635e-05, "epoch": 0.8274762203109871, "percentage": 72.64}
	{"current_steps": 14560, "total_steps": 20000, "loss": 3.2891, "eval_loss": null, "predict_loss": null, "learning_rate": 7.72431017858635e-05, "epoch": 0.829298855157487, "percentage": 72.8}
	{"current_steps": 14592, "total_steps": 20000, "loss": 3.3826, "eval_loss": null, "predict_loss": null, "learning_rate": 7.672337704683824e-05, "epoch": 0.831121490003987, "percentage": 72.96}
	{"current_steps": 14624, "total_steps": 20000, "loss": 3.3069, "eval_loss": null, "predict_loss": null, "learning_rate": 7.620592800304338e-05, "epoch": 0.832944124850487, "percentage": 73.12}
	{"current_steps": 14656, "total_steps": 20000, "loss": 3.4393, "eval_loss": null, "predict_loss": null, "learning_rate": 7.569076799386909e-05, "epoch": 0.834766759696987, "percentage": 73.28}
	{"current_steps": 14688, "total_steps": 20000, "loss": 3.349, "eval_loss": null, "predict_loss": null, "learning_rate": 7.517791029969627e-05, "epoch": 0.8365893945434869, "percentage": 73.44}
	{"current_steps": 14720, "total_steps": 20000, "loss": 3.3965, "eval_loss": null, "predict_loss": null, "learning_rate": 7.466736814155418e-05, "epoch": 0.8384120293899869, "percentage": 73.6}
	{"current_steps": 14752, "total_steps": 20000, "loss": 3.3879, "eval_loss": null, "predict_loss": null, "learning_rate": 7.415915468077937e-05, "epoch": 0.8402346642364869, "percentage": 73.76}
	{"current_steps": 14784, "total_steps": 20000, "loss": 3.3738, "eval_loss": null, "predict_loss": null, "learning_rate": 7.365328301867673e-05, "epoch": 0.8420572990829869, "percentage": 73.92}
	{"current_steps": 14816, "total_steps": 20000, "loss": 3.4681, "eval_loss": null, "predict_loss": null, "learning_rate": 7.31497661961816e-05, "epoch": 0.8438799339294868, "percentage": 74.08}
	{"current_steps": 14848, "total_steps": 20000, "loss": 3.3666, "eval_loss": null, "predict_loss": null, "learning_rate": 7.264861719352352e-05, "epoch": 0.8457025687759868, "percentage": 74.24}
	{"current_steps": 14880, "total_steps": 20000, "loss": 3.3233, "eval_loss": null, "predict_loss": null, "learning_rate": 7.21498489298917e-05, "epoch": 0.8475252036224867, "percentage": 74.4}
	{"current_steps": 14912, "total_steps": 20000, "loss": 3.3867, "eval_loss": null, "predict_loss": null, "learning_rate": 7.165347426310198e-05, "epoch": 0.8493478384689868, "percentage": 74.56}
	{"current_steps": 14944, "total_steps": 20000, "loss": 3.2287, "eval_loss": null, "predict_loss": null, "learning_rate": 7.115950598926533e-05, "epoch": 0.8511704733154867, "percentage": 74.72}
	{"current_steps": 14976, "total_steps": 20000, "loss": 3.3889, "eval_loss": null, "predict_loss": null, "learning_rate": 7.066795684245788e-05, "epoch": 0.8529931081619867, "percentage": 74.88}
	{"current_steps": 15008, "total_steps": 20000, "loss": 3.3299, "eval_loss": null, "predict_loss": null, "learning_rate": 7.017883949439288e-05, "epoch": 0.8548157430084866, "percentage": 75.04}
	{"current_steps": 15040, "total_steps": 20000, "loss": 3.4652, "eval_loss": null, "predict_loss": null, "learning_rate": 6.969216655409388e-05, "epoch": 0.8566383778549866, "percentage": 75.2}
	{"current_steps": 15072, "total_steps": 20000, "loss": 3.3907, "eval_loss": null, "predict_loss": null, "learning_rate": 6.92079505675697e-05, "epoch": 0.8584610127014866, "percentage": 75.36}
	{"current_steps": 15104, "total_steps": 20000, "loss": 3.3981, "eval_loss": null, "predict_loss": null, "learning_rate": 6.872620401749094e-05, "epoch": 0.8602836475479866, "percentage": 75.52}
	{"current_steps": 15136, "total_steps": 20000, "loss": 3.6027, "eval_loss": null, "predict_loss": null, "learning_rate": 6.824693932286834e-05, "epoch": 0.8621062823944865, "percentage": 75.68}
	{"current_steps": 15168, "total_steps": 20000, "loss": 3.4507, "eval_loss": null, "predict_loss": null, "learning_rate": 6.777016883873253e-05, "epoch": 0.8639289172409865, "percentage": 75.84}
	{"current_steps": 15200, "total_steps": 20000, "loss": 3.4501, "eval_loss": null, "predict_loss": null, "learning_rate": 6.729590485581552e-05, "epoch": 0.8657515520874864, "percentage": 76.0}
	{"current_steps": 15232, "total_steps": 20000, "loss": 3.4464, "eval_loss": null, "predict_loss": null, "learning_rate": 6.68241596002339e-05, "epoch": 0.8675741869339865, "percentage": 76.16}
	{"current_steps": 15264, "total_steps": 20000, "loss": 3.4268, "eval_loss": null, "predict_loss": null, "learning_rate": 6.63549452331737e-05, "epoch": 0.8693968217804864, "percentage": 76.32}
	{"current_steps": 15296, "total_steps": 20000, "loss": 3.5604, "eval_loss": null, "predict_loss": null, "learning_rate": 6.588827385057663e-05, "epoch": 0.8712194566269864, "percentage": 76.48}
	{"current_steps": 15328, "total_steps": 20000, "loss": 3.595, "eval_loss": null, "predict_loss": null, "learning_rate": 6.542415748282867e-05, "epoch": 0.8730420914734863, "percentage": 76.64}
	{"current_steps": 15360, "total_steps": 20000, "loss": 3.3765, "eval_loss": null, "predict_loss": null, "learning_rate": 6.496260809444961e-05, "epoch": 0.8748647263199864, "percentage": 76.8}
	{"current_steps": 15392, "total_steps": 20000, "loss": 3.2804, "eval_loss": null, "predict_loss": null, "learning_rate": 6.45036375837848e-05, "epoch": 0.8766873611664863, "percentage": 76.96}
	{"current_steps": 15424, "total_steps": 20000, "loss": 3.5249, "eval_loss": null, "predict_loss": null, "learning_rate": 6.404725778269821e-05, "epoch": 0.8785099960129863, "percentage": 77.12}
	{"current_steps": 15456, "total_steps": 20000, "loss": 3.3314, "eval_loss": null, "predict_loss": null, "learning_rate": 6.359348045626768e-05, "epoch": 0.8803326308594862, "percentage": 77.28}
	{"current_steps": 15488, "total_steps": 20000, "loss": 3.3959, "eval_loss": null, "predict_loss": null, "learning_rate": 6.314231730248144e-05, "epoch": 0.8821552657059862, "percentage": 77.44}
	{"current_steps": 15520, "total_steps": 20000, "loss": 3.2723, "eval_loss": null, "predict_loss": null, "learning_rate": 6.269377995193662e-05, "epoch": 0.8839779005524862, "percentage": 77.6}
	{"current_steps": 15552, "total_steps": 20000, "loss": 3.3634, "eval_loss": null, "predict_loss": null, "learning_rate": 6.224787996753946e-05, "epoch": 0.8858005353989862, "percentage": 77.76}
	{"current_steps": 15584, "total_steps": 20000, "loss": 3.5432, "eval_loss": null, "predict_loss": null, "learning_rate": 6.180462884420702e-05, "epoch": 0.8876231702454861, "percentage": 77.92}
	{"current_steps": 15616, "total_steps": 20000, "loss": 3.4279, "eval_loss": null, "predict_loss": null, "learning_rate": 6.136403800857113e-05, "epoch": 0.8894458050919861, "percentage": 78.08}
	{"current_steps": 15648, "total_steps": 20000, "loss": 3.3444, "eval_loss": null, "predict_loss": null, "learning_rate": 6.092611881868369e-05, "epoch": 0.891268439938486, "percentage": 78.24}
	{"current_steps": 15680, "total_steps": 20000, "loss": 3.2575, "eval_loss": null, "predict_loss": null, "learning_rate": 6.049088256372386e-05, "epoch": 0.8930910747849861, "percentage": 78.4}
	{"current_steps": 15712, "total_steps": 20000, "loss": 3.1619, "eval_loss": null, "predict_loss": null, "learning_rate": 6.005834046370704e-05, "epoch": 0.894913709631486, "percentage": 78.56}
	{"current_steps": 15744, "total_steps": 20000, "loss": 3.4806, "eval_loss": null, "predict_loss": null, "learning_rate": 5.962850366919566e-05, "epoch": 0.896736344477986, "percentage": 78.72}
	{"current_steps": 15776, "total_steps": 20000, "loss": 3.3673, "eval_loss": null, "predict_loss": null, "learning_rate": 5.9201383261011636e-05, "epoch": 0.8985589793244859, "percentage": 78.88}
	{"current_steps": 15808, "total_steps": 20000, "loss": 3.3109, "eval_loss": null, "predict_loss": null, "learning_rate": 5.877699024995088e-05, "epoch": 0.9003816141709859, "percentage": 79.04}
	{"current_steps": 15840, "total_steps": 20000, "loss": 3.3335, "eval_loss": null, "predict_loss": null, "learning_rate": 5.835533557649932e-05, "epoch": 0.9022042490174859, "percentage": 79.2}
	{"current_steps": 15872, "total_steps": 20000, "loss": 3.3958, "eval_loss": null, "predict_loss": null, "learning_rate": 5.793643011055091e-05, "epoch": 0.9040268838639859, "percentage": 79.36}
	{"current_steps": 15904, "total_steps": 20000, "loss": 3.2641, "eval_loss": null, "predict_loss": null, "learning_rate": 5.752028465112736e-05, "epoch": 0.9058495187104858, "percentage": 79.52}
	{"current_steps": 15936, "total_steps": 20000, "loss": 3.3877, "eval_loss": null, "predict_loss": null, "learning_rate": 5.710690992609983e-05, "epoch": 0.9076721535569858, "percentage": 79.68}
	{"current_steps": 15968, "total_steps": 20000, "loss": 3.3199, "eval_loss": null, "predict_loss": null, "learning_rate": 5.6696316591912355e-05, "epoch": 0.9094947884034857, "percentage": 79.84}
	{"current_steps": 16000, "total_steps": 20000, "loss": 3.3811, "eval_loss": null, "predict_loss": null, "learning_rate": 5.628851523330708e-05, "epoch": 0.9113174232499858, "percentage": 80.0}
	{"current_steps": 16032, "total_steps": 20000, "loss": 3.4942, "eval_loss": null, "predict_loss": null, "learning_rate": 5.588351636305146e-05, "epoch": 0.9131400580964857, "percentage": 80.16}
	{"current_steps": 16064, "total_steps": 20000, "loss": 3.328, "eval_loss": null, "predict_loss": null, "learning_rate": 5.548133042166714e-05, "epoch": 0.9149626929429857, "percentage": 80.32}
	{"current_steps": 16096, "total_steps": 20000, "loss": 3.5363, "eval_loss": null, "predict_loss": null, "learning_rate": 5.5081967777161005e-05, "epoch": 0.9167853277894856, "percentage": 80.48}
	{"current_steps": 16128, "total_steps": 20000, "loss": 3.5356, "eval_loss": null, "predict_loss": null, "learning_rate": 5.468543872475766e-05, "epoch": 0.9186079626359857, "percentage": 80.64}
	{"current_steps": 16160, "total_steps": 20000, "loss": 3.3574, "eval_loss": null, "predict_loss": null, "learning_rate": 5.42917534866342e-05, "epoch": 0.9204305974824856, "percentage": 80.8}
	{"current_steps": 16192, "total_steps": 20000, "loss": 3.3641, "eval_loss": null, "predict_loss": null, "learning_rate": 5.390092221165669e-05, "epoch": 0.9222532323289856, "percentage": 80.96}
	{"current_steps": 16224, "total_steps": 20000, "loss": 3.2683, "eval_loss": null, "predict_loss": null, "learning_rate": 5.3512954975118384e-05, "epoch": 0.9240758671754855, "percentage": 81.12}
	{"current_steps": 16256, "total_steps": 20000, "loss": 3.4966, "eval_loss": null, "predict_loss": null, "learning_rate": 5.3127861778480155e-05, "epoch": 0.9258985020219855, "percentage": 81.28}
	{"current_steps": 16288, "total_steps": 20000, "loss": 3.6079, "eval_loss": null, "predict_loss": null, "learning_rate": 5.274565254911261e-05, "epoch": 0.9277211368684855, "percentage": 81.44}
	{"current_steps": 16320, "total_steps": 20000, "loss": 3.5604, "eval_loss": null, "predict_loss": null, "learning_rate": 5.236633714004014e-05, "epoch": 0.9295437717149855, "percentage": 81.6}
	{"current_steps": 16352, "total_steps": 20000, "loss": 3.3423, "eval_loss": null, "predict_loss": null, "learning_rate": 5.1989925329686985e-05, "epoch": 0.9313664065614854, "percentage": 81.76}
	{"current_steps": 16384, "total_steps": 20000, "loss": 3.3109, "eval_loss": null, "predict_loss": null, "learning_rate": 5.161642682162506e-05, "epoch": 0.9331890414079854, "percentage": 81.92}
	{"current_steps": 16416, "total_steps": 20000, "loss": 3.4777, "eval_loss": null, "predict_loss": null, "learning_rate": 5.1245851244323926e-05, "epoch": 0.9350116762544853, "percentage": 82.08}
	{"current_steps": 16448, "total_steps": 20000, "loss": 3.4493, "eval_loss": null, "predict_loss": null, "learning_rate": 5.087820815090239e-05, "epoch": 0.9368343111009854, "percentage": 82.24}
	{"current_steps": 16480, "total_steps": 20000, "loss": 3.3607, "eval_loss": null, "predict_loss": null, "learning_rate": 5.0513507018882495e-05, "epoch": 0.9386569459474854, "percentage": 82.4}
	{"current_steps": 16512, "total_steps": 20000, "loss": 3.3759, "eval_loss": null, "predict_loss": null, "learning_rate": 5.015175724994498e-05, "epoch": 0.9404795807939853, "percentage": 82.56}
	{"current_steps": 16544, "total_steps": 20000, "loss": 3.5364, "eval_loss": null, "predict_loss": null, "learning_rate": 4.979296816968697e-05, "epoch": 0.9423022156404853, "percentage": 82.72}
	{"current_steps": 16576, "total_steps": 20000, "loss": 3.3132, "eval_loss": null, "predict_loss": null, "learning_rate": 4.943714902738163e-05, "epoch": 0.9441248504869852, "percentage": 82.88}
	{"current_steps": 16608, "total_steps": 20000, "loss": 3.5673, "eval_loss": null, "predict_loss": null, "learning_rate": 4.908430899573967e-05, "epoch": 0.9459474853334853, "percentage": 83.04}
	{"current_steps": 16640, "total_steps": 20000, "loss": 3.4356, "eval_loss": null, "predict_loss": null, "learning_rate": 4.873445717067292e-05, "epoch": 0.9477701201799852, "percentage": 83.2}
	{"current_steps": 16672, "total_steps": 20000, "loss": 3.3143, "eval_loss": null, "predict_loss": null, "learning_rate": 4.838760257105979e-05, "epoch": 0.9495927550264852, "percentage": 83.36}
	{"current_steps": 16704, "total_steps": 20000, "loss": 3.5084, "eval_loss": null, "predict_loss": null, "learning_rate": 4.8043754138512794e-05, "epoch": 0.9514153898729851, "percentage": 83.52}
	{"current_steps": 16736, "total_steps": 20000, "loss": 3.3382, "eval_loss": null, "predict_loss": null, "learning_rate": 4.770292073714807e-05, "epoch": 0.9532380247194852, "percentage": 83.68}
	{"current_steps": 16768, "total_steps": 20000, "loss": 3.1503, "eval_loss": null, "predict_loss": null, "learning_rate": 4.73651111533569e-05, "epoch": 0.9550606595659851, "percentage": 83.84}
	{"current_steps": 16800, "total_steps": 20000, "loss": 3.4448, "eval_loss": null, "predict_loss": null, "learning_rate": 4.703033409557903e-05, "epoch": 0.9568832944124851, "percentage": 84.0}
	{"current_steps": 16832, "total_steps": 20000, "loss": 3.2959, "eval_loss": null, "predict_loss": null, "learning_rate": 4.669859819407844e-05, "epoch": 0.958705929258985, "percentage": 84.16}
	{"current_steps": 16864, "total_steps": 20000, "loss": 3.3042, "eval_loss": null, "predict_loss": null, "learning_rate": 4.63699120007206e-05, "epoch": 0.960528564105485, "percentage": 84.32}
	{"current_steps": 16896, "total_steps": 20000, "loss": 3.3773, "eval_loss": null, "predict_loss": null, "learning_rate": 4.6044283988752214e-05, "epoch": 0.962351198951985, "percentage": 84.48}
	{"current_steps": 16928, "total_steps": 20000, "loss": 3.511, "eval_loss": null, "predict_loss": null, "learning_rate": 4.572172255258268e-05, "epoch": 0.964173833798485, "percentage": 84.64}
	{"current_steps": 16960, "total_steps": 20000, "loss": 3.4194, "eval_loss": null, "predict_loss": null, "learning_rate": 4.540223600756775e-05, "epoch": 0.9659964686449849, "percentage": 84.8}
	{"current_steps": 16992, "total_steps": 20000, "loss": 3.3175, "eval_loss": null, "predict_loss": null, "learning_rate": 4.508583258979507e-05, "epoch": 0.9678191034914849, "percentage": 84.96}
	{"current_steps": 17024, "total_steps": 20000, "loss": 3.407, "eval_loss": null, "predict_loss": null, "learning_rate": 4.4772520455871974e-05, "epoch": 0.9696417383379848, "percentage": 85.12}
	{"current_steps": 17056, "total_steps": 20000, "loss": 3.2908, "eval_loss": null, "predict_loss": null, "learning_rate": 4.446230768271513e-05, "epoch": 0.9714643731844849, "percentage": 85.28}
	{"current_steps": 17088, "total_steps": 20000, "loss": 3.4567, "eval_loss": null, "predict_loss": null, "learning_rate": 4.415520226734242e-05, "epoch": 0.9732870080309848, "percentage": 85.44}
	{"current_steps": 17120, "total_steps": 20000, "loss": 3.4349, "eval_loss": null, "predict_loss": null, "learning_rate": 4.385121212666663e-05, "epoch": 0.9751096428774848, "percentage": 85.6}
	{"current_steps": 17152, "total_steps": 20000, "loss": 3.3015, "eval_loss": null, "predict_loss": null, "learning_rate": 4.355034509729152e-05, "epoch": 0.9769322777239847, "percentage": 85.76}
	{"current_steps": 17184, "total_steps": 20000, "loss": 3.3702, "eval_loss": null, "predict_loss": null, "learning_rate": 4.325260893530965e-05, "epoch": 0.9787549125704847, "percentage": 85.92}
	{"current_steps": 17216, "total_steps": 20000, "loss": 3.4142, "eval_loss": null, "predict_loss": null, "learning_rate": 4.295801131610265e-05, "epoch": 0.9805775474169847, "percentage": 86.08}
	{"current_steps": 17248, "total_steps": 20000, "loss": 3.1584, "eval_loss": null, "predict_loss": null, "learning_rate": 4.266655983414312e-05, "epoch": 0.9824001822634847, "percentage": 86.24}
	{"current_steps": 17280, "total_steps": 20000, "loss": 3.3601, "eval_loss": null, "predict_loss": null, "learning_rate": 4.237826200279898e-05, "epoch": 0.9842228171099846, "percentage": 86.4}
	{"current_steps": 17312, "total_steps": 20000, "loss": 3.3902, "eval_loss": null, "predict_loss": null, "learning_rate": 4.209312525413978e-05, "epoch": 0.9860454519564846, "percentage": 86.56}
	{"current_steps": 17344, "total_steps": 20000, "loss": 3.3125, "eval_loss": null, "predict_loss": null, "learning_rate": 4.1811156938745036e-05, "epoch": 0.9878680868029845, "percentage": 86.72}
	{"current_steps": 17376, "total_steps": 20000, "loss": 3.3201, "eval_loss": null, "predict_loss": null, "learning_rate": 4.153236432551488e-05, "epoch": 0.9896907216494846, "percentage": 86.88}
	{"current_steps": 17408, "total_steps": 20000, "loss": 3.5218, "eval_loss": null, "predict_loss": null, "learning_rate": 4.125675460148243e-05, "epoch": 0.9915133564959845, "percentage": 87.04}
	{"current_steps": 17440, "total_steps": 20000, "loss": 3.3612, "eval_loss": null, "predict_loss": null, "learning_rate": 4.09843348716288e-05, "epoch": 0.9933359913424845, "percentage": 87.2}
	{"current_steps": 17472, "total_steps": 20000, "loss": 3.2801, "eval_loss": null, "predict_loss": null, "learning_rate": 4.071511215869974e-05, "epoch": 0.9951586261889844, "percentage": 87.36}
	{"current_steps": 17504, "total_steps": 20000, "loss": 3.3016, "eval_loss": null, "predict_loss": null, "learning_rate": 4.044909340302465e-05, "epoch": 0.9969812610354845, "percentage": 87.52}
	{"current_steps": 17536, "total_steps": 20000, "loss": 3.2638, "eval_loss": null, "predict_loss": null, "learning_rate": 4.018628546233774e-05, "epoch": 0.9988038958819844, "percentage": 87.68}
	{"current_steps": 17568, "total_steps": 20000, "loss": 3.533, "eval_loss": null, "predict_loss": null, "learning_rate": 3.992669511160111e-05, "epoch": 1.0006265307284843, "percentage": 87.84}
	{"current_steps": 17600, "total_steps": 20000, "loss": 3.2613, "eval_loss": null, "predict_loss": null, "learning_rate": 3.9670329042830205e-05, "epoch": 1.0024491655749843, "percentage": 88.0}
	{"current_steps": 17632, "total_steps": 20000, "loss": 3.484, "eval_loss": null, "predict_loss": null, "learning_rate": 3.941719386492123e-05, "epoch": 1.0042718004214843, "percentage": 88.16}
	{"current_steps": 17664, "total_steps": 20000, "loss": 3.2604, "eval_loss": null, "predict_loss": null, "learning_rate": 3.916729610348085e-05, "epoch": 1.0060944352679844, "percentage": 88.32}
	{"current_steps": 17696, "total_steps": 20000, "loss": 3.4028, "eval_loss": null, "predict_loss": null, "learning_rate": 3.89206422006579e-05, "epoch": 1.0079170701144842, "percentage": 88.48}
	{"current_steps": 17728, "total_steps": 20000, "loss": 3.3969, "eval_loss": null, "predict_loss": null, "learning_rate": 3.8677238514977316e-05, "epoch": 1.0097397049609842, "percentage": 88.64}
	{"current_steps": 17760, "total_steps": 20000, "loss": 3.4418, "eval_loss": null, "predict_loss": null, "learning_rate": 3.843709132117625e-05, "epoch": 1.0115623398074842, "percentage": 88.8}
	{"current_steps": 17792, "total_steps": 20000, "loss": 3.1845, "eval_loss": null, "predict_loss": null, "learning_rate": 3.8200206810042385e-05, "epoch": 1.0133849746539842, "percentage": 88.96}
	{"current_steps": 17824, "total_steps": 20000, "loss": 3.5594, "eval_loss": null, "predict_loss": null, "learning_rate": 3.7966591088254076e-05, "epoch": 1.015207609500484, "percentage": 89.12}
	{"current_steps": 17856, "total_steps": 20000, "loss": 3.3188, "eval_loss": null, "predict_loss": null, "learning_rate": 3.7736250178223284e-05, "epoch": 1.017030244346984, "percentage": 89.28}
	{"current_steps": 17888, "total_steps": 20000, "loss": 3.2784, "eval_loss": null, "predict_loss": null, "learning_rate": 3.7509190017940066e-05, "epoch": 1.018852879193484, "percentage": 89.44}
	{"current_steps": 17920, "total_steps": 20000, "loss": 3.2204, "eval_loss": null, "predict_loss": null, "learning_rate": 3.728541646081958e-05, "epoch": 1.0206755140399841, "percentage": 89.6}
	{"current_steps": 17952, "total_steps": 20000, "loss": 3.2125, "eval_loss": null, "predict_loss": null, "learning_rate": 3.7064935275551196e-05, "epoch": 1.022498148886484, "percentage": 89.76}
	{"current_steps": 17984, "total_steps": 20000, "loss": 3.3255, "eval_loss": null, "predict_loss": null, "learning_rate": 3.6847752145949786e-05, "epoch": 1.024320783732984, "percentage": 89.92}
	{"current_steps": 18016, "total_steps": 20000, "loss": 3.3118, "eval_loss": null, "predict_loss": null, "learning_rate": 3.66338726708092e-05, "epoch": 1.026143418579484, "percentage": 90.08}
	{"current_steps": 18048, "total_steps": 20000, "loss": 3.4108, "eval_loss": null, "predict_loss": null, "learning_rate": 3.642330236375788e-05, "epoch": 1.027966053425984, "percentage": 90.24}
	{"current_steps": 18080, "total_steps": 20000, "loss": 3.3578, "eval_loss": null, "predict_loss": null, "learning_rate": 3.6216046653116795e-05, "epoch": 1.0297886882724838, "percentage": 90.4}
	{"current_steps": 18112, "total_steps": 20000, "loss": 3.4629, "eval_loss": null, "predict_loss": null, "learning_rate": 3.601211088175948e-05, "epoch": 1.0316113231189838, "percentage": 90.56}
	{"current_steps": 18144, "total_steps": 20000, "loss": 3.3069, "eval_loss": null, "predict_loss": null, "learning_rate": 3.581150030697432e-05, "epoch": 1.0334339579654839, "percentage": 90.72}
	{"current_steps": 18176, "total_steps": 20000, "loss": 3.3297, "eval_loss": null, "predict_loss": null, "learning_rate": 3.561422010032892e-05, "epoch": 1.035256592811984, "percentage": 90.88}
	{"current_steps": 18208, "total_steps": 20000, "loss": 3.3708, "eval_loss": null, "predict_loss": null, "learning_rate": 3.5420275347536976e-05, "epoch": 1.0370792276584837, "percentage": 91.04}
	{"current_steps": 18240, "total_steps": 20000, "loss": 3.4097, "eval_loss": null, "predict_loss": null, "learning_rate": 3.522967104832694e-05, "epoch": 1.0389018625049837, "percentage": 91.2}
	{"current_steps": 18272, "total_steps": 20000, "loss": 3.3742, "eval_loss": null, "predict_loss": null, "learning_rate": 3.504241211631338e-05, "epoch": 1.0407244973514838, "percentage": 91.36}
	{"current_steps": 18304, "total_steps": 20000, "loss": 3.1914, "eval_loss": null, "predict_loss": null, "learning_rate": 3.485850337887007e-05, "epoch": 1.0425471321979838, "percentage": 91.52}
	{"current_steps": 18336, "total_steps": 20000, "loss": 3.3076, "eval_loss": null, "predict_loss": null, "learning_rate": 3.467794957700573e-05, "epoch": 1.0443697670444836, "percentage": 91.68}
	{"current_steps": 18368, "total_steps": 20000, "loss": 3.3821, "eval_loss": null, "predict_loss": null, "learning_rate": 3.450075536524166e-05, "epoch": 1.0461924018909836, "percentage": 91.84}
	{"current_steps": 18400, "total_steps": 20000, "loss": 3.3944, "eval_loss": null, "predict_loss": null, "learning_rate": 3.432692531149191e-05, "epoch": 1.0480150367374836, "percentage": 92.0}
	{"current_steps": 18432, "total_steps": 20000, "loss": 3.2519, "eval_loss": null, "predict_loss": null, "learning_rate": 3.4156463896945356e-05, "epoch": 1.0498376715839837, "percentage": 92.16}
	{"current_steps": 18464, "total_steps": 20000, "loss": 3.3614, "eval_loss": null, "predict_loss": null, "learning_rate": 3.398937551595037e-05, "epoch": 1.0516603064304835, "percentage": 92.32}
	{"current_steps": 18496, "total_steps": 20000, "loss": 3.2746, "eval_loss": null, "predict_loss": null, "learning_rate": 3.382566447590126e-05, "epoch": 1.0534829412769835, "percentage": 92.48}
	{"current_steps": 18528, "total_steps": 20000, "loss": 3.2593, "eval_loss": null, "predict_loss": null, "learning_rate": 3.366533499712757e-05, "epoch": 1.0553055761234835, "percentage": 92.64}
	{"current_steps": 18560, "total_steps": 20000, "loss": 3.4592, "eval_loss": null, "predict_loss": null, "learning_rate": 3.3508391212784984e-05, "epoch": 1.0571282109699836, "percentage": 92.8}
	{"current_steps": 18592, "total_steps": 20000, "loss": 3.255, "eval_loss": null, "predict_loss": null, "learning_rate": 3.3354837168748956e-05, "epoch": 1.0589508458164834, "percentage": 92.96}
	{"current_steps": 18624, "total_steps": 20000, "loss": 3.1441, "eval_loss": null, "predict_loss": null, "learning_rate": 3.32046768235104e-05, "epoch": 1.0607734806629834, "percentage": 93.12}
	{"current_steps": 18656, "total_steps": 20000, "loss": 3.4337, "eval_loss": null, "predict_loss": null, "learning_rate": 3.305791404807349e-05, "epoch": 1.0625961155094834, "percentage": 93.28}
	{"current_steps": 18688, "total_steps": 20000, "loss": 3.4064, "eval_loss": null, "predict_loss": null, "learning_rate": 3.291455262585608e-05, "epoch": 1.0644187503559834, "percentage": 93.44}
	{"current_steps": 18720, "total_steps": 20000, "loss": 3.3228, "eval_loss": null, "predict_loss": null, "learning_rate": 3.277459625259199e-05, "epoch": 1.0662413852024832, "percentage": 93.6}
	{"current_steps": 18752, "total_steps": 20000, "loss": 3.3079, "eval_loss": null, "predict_loss": null, "learning_rate": 3.2638048536235925e-05, "epoch": 1.0680640200489833, "percentage": 93.76}
	{"current_steps": 18784, "total_steps": 20000, "loss": 3.3057, "eval_loss": null, "predict_loss": null, "learning_rate": 3.2504912996870223e-05, "epoch": 1.0698866548954833, "percentage": 93.92}
	{"current_steps": 18816, "total_steps": 20000, "loss": 3.1894, "eval_loss": null, "predict_loss": null, "learning_rate": 3.237519306661436e-05, "epoch": 1.0717092897419833, "percentage": 94.08}
	{"current_steps": 18848, "total_steps": 20000, "loss": 3.3885, "eval_loss": null, "predict_loss": null, "learning_rate": 3.224889208953625e-05, "epoch": 1.0735319245884831, "percentage": 94.24}
	{"current_steps": 18880, "total_steps": 20000, "loss": 3.4863, "eval_loss": null, "predict_loss": null, "learning_rate": 3.21260133215662e-05, "epoch": 1.0753545594349831, "percentage": 94.4}
	{"current_steps": 18912, "total_steps": 20000, "loss": 3.3887, "eval_loss": null, "predict_loss": null, "learning_rate": 3.200655993041291e-05, "epoch": 1.0771771942814832, "percentage": 94.56}
	{"current_steps": 18944, "total_steps": 20000, "loss": 3.4815, "eval_loss": null, "predict_loss": null, "learning_rate": 3.1890534995481836e-05, "epoch": 1.0789998291279832, "percentage": 94.72}
	{"current_steps": 18976, "total_steps": 20000, "loss": 3.322, "eval_loss": null, "predict_loss": null, "learning_rate": 3.177794150779575e-05, "epoch": 1.0808224639744832, "percentage": 94.88}
	{"current_steps": 19008, "total_steps": 20000, "loss": 3.2297, "eval_loss": null, "predict_loss": null, "learning_rate": 3.166878236991767e-05, "epoch": 1.082645098820983, "percentage": 95.04}
	{"current_steps": 19040, "total_steps": 20000, "loss": 3.1521, "eval_loss": null, "predict_loss": null, "learning_rate": 3.1563060395876074e-05, "epoch": 1.084467733667483, "percentage": 95.2}
	{"current_steps": 19072, "total_steps": 20000, "loss": 3.289, "eval_loss": null, "predict_loss": null, "learning_rate": 3.1460778311092306e-05, "epoch": 1.086290368513983, "percentage": 95.36}
	{"current_steps": 19104, "total_steps": 20000, "loss": 3.2968, "eval_loss": null, "predict_loss": null, "learning_rate": 3.136193875231033e-05, "epoch": 1.0881130033604829, "percentage": 95.52}
	{"current_steps": 19136, "total_steps": 20000, "loss": 3.278, "eval_loss": null, "predict_loss": null, "learning_rate": 3.1266544267528746e-05, "epoch": 1.089935638206983, "percentage": 95.68}
	{"current_steps": 19168, "total_steps": 20000, "loss": 3.2662, "eval_loss": null, "predict_loss": null, "learning_rate": 3.117459731593514e-05, "epoch": 1.091758273053483, "percentage": 95.84}
	{"current_steps": 19200, "total_steps": 20000, "loss": 3.305, "eval_loss": null, "predict_loss": null, "learning_rate": 3.1086100267842626e-05, "epoch": 1.093580907899983, "percentage": 96.0}
	{"current_steps": 19232, "total_steps": 20000, "loss": 3.3092, "eval_loss": null, "predict_loss": null, "learning_rate": 3.1001055404628825e-05, "epoch": 1.095403542746483, "percentage": 96.16}
	{"current_steps": 19264, "total_steps": 20000, "loss": 3.3532, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0919464918676995e-05, "epoch": 1.0972261775929828, "percentage": 96.32}
	{"current_steps": 19296, "total_steps": 20000, "loss": 3.3003, "eval_loss": null, "predict_loss": null, "learning_rate": 3.084133091331949e-05, "epoch": 1.0990488124394828, "percentage": 96.48}
	{"current_steps": 19328, "total_steps": 20000, "loss": 3.3035, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0766655402783616e-05, "epoch": 1.1008714472859829, "percentage": 96.64}
	{"current_steps": 19360, "total_steps": 20000, "loss": 3.3652, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0695440312139664e-05, "epoch": 1.1026940821324827, "percentage": 96.8}
	{"current_steps": 19392, "total_steps": 20000, "loss": 3.3741, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0627687477251264e-05, "epoch": 1.1045167169789827, "percentage": 96.96}
	{"current_steps": 19424, "total_steps": 20000, "loss": 3.4161, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0563398644728066e-05, "epoch": 1.1063393518254827, "percentage": 97.12}
	{"current_steps": 19456, "total_steps": 20000, "loss": 3.3532, "eval_loss": null, "predict_loss": null, "learning_rate": 3.050257547188077e-05, "epoch": 1.1081619866719827, "percentage": 97.28}
	{"current_steps": 19488, "total_steps": 20000, "loss": 3.2554, "eval_loss": null, "predict_loss": null, "learning_rate": 3.044521952667833e-05, "epoch": 1.1099846215184828, "percentage": 97.44}
	{"current_steps": 19520, "total_steps": 20000, "loss": 3.2747, "eval_loss": null, "predict_loss": null, "learning_rate": 3.039133228770754e-05, "epoch": 1.1118072563649826, "percentage": 97.6}
	{"current_steps": 19552, "total_steps": 20000, "loss": 3.379, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0340915144134993e-05, "epoch": 1.1136298912114826, "percentage": 97.76}
	{"current_steps": 19584, "total_steps": 20000, "loss": 3.2245, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0293969395671157e-05, "epoch": 1.1154525260579826, "percentage": 97.92}
	{"current_steps": 19616, "total_steps": 20000, "loss": 3.3332, "eval_loss": null, "predict_loss": null, "learning_rate": 3.025049625253697e-05, "epoch": 1.1172751609044826, "percentage": 98.08}
	{"current_steps": 19648, "total_steps": 20000, "loss": 3.373, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0210496835432564e-05, "epoch": 1.1190977957509824, "percentage": 98.24}
	{"current_steps": 19680, "total_steps": 20000, "loss": 3.5304, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0173972175508445e-05, "epoch": 1.1209204305974825, "percentage": 98.4}
	{"current_steps": 19712, "total_steps": 20000, "loss": 3.5012, "eval_loss": null, "predict_loss": null, "learning_rate": 3.014092321433883e-05, "epoch": 1.1227430654439825, "percentage": 98.56}
	{"current_steps": 19744, "total_steps": 20000, "loss": 3.2433, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0111350803897467e-05, "epoch": 1.1245657002904825, "percentage": 98.72}
	{"current_steps": 19776, "total_steps": 20000, "loss": 3.216, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0085255706535594e-05, "epoch": 1.1263883351369823, "percentage": 98.88}
	{"current_steps": 19808, "total_steps": 20000, "loss": 3.2591, "eval_loss": null, "predict_loss": null, "learning_rate": 3.006263859496231e-05, "epoch": 1.1282109699834824, "percentage": 99.04}
	{"current_steps": 19840, "total_steps": 20000, "loss": 3.2864, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0043500052227267e-05, "epoch": 1.1300336048299824, "percentage": 99.2}
	{"current_steps": 19872, "total_steps": 20000, "loss": 3.2918, "eval_loss": null, "predict_loss": null, "learning_rate": 3.002784057170561e-05, "epoch": 1.1318562396764824, "percentage": 99.36}
	{"current_steps": 19904, "total_steps": 20000, "loss": 3.1914, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0015660557085206e-05, "epoch": 1.1336788745229822, "percentage": 99.52}
	{"current_steps": 19936, "total_steps": 20000, "loss": 3.2511, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0006960322356355e-05, "epoch": 1.1355015093694822, "percentage": 99.68}
	{"current_steps": 19968, "total_steps": 20000, "loss": 3.3102, "eval_loss": null, "predict_loss": null, "learning_rate": 3.0001740091803596e-05, "epoch": 1.1373241442159823, "percentage": 99.84}
	{"current_steps": 20000, "total_steps": 20000, "loss": 3.394, "eval_loss": null, "predict_loss": null, "learning_rate": 2.9999999999999997e-05, "epoch": 1.1391467790624823, "percentage": 100.0}
	{"current_steps": 20000, "total_steps": 20000, "loss": null, "eval_loss": null, "predict_loss": null, "learning_rate": null, "epoch": 1.1391467790624823, "percentage": 100.0}