{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 0.9981298423724285,
  "eval_steps": 200,
  "global_step": 467,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.0021373230029388193,
      "grad_norm": 0.0,
      "learning_rate": 0.0,
      "logits": -2.7276527881622314,
      "logps": -123.19757843017578,
      "loss": 0.6931,
      "step": 1
    },
    {
      "epoch": 0.010686615014694095,
      "grad_norm": 27.89530248586404,
      "learning_rate": 1.0638297872340425e-08,
      "logits": -2.8715224266052246,
      "logps": -234.59034729003906,
      "loss": 0.6931,
      "step": 5
    },
    {
      "epoch": 0.02137323002938819,
      "grad_norm": 24.041320691027245,
      "learning_rate": 6.382978723404254e-08,
      "logits": -2.8461320400238037,
      "logps": -248.1672821044922,
      "loss": 0.6928,
      "step": 10
    },
    {
      "epoch": 0.03205984504408229,
      "grad_norm": 24.00395488621066,
      "learning_rate": 1.0638297872340425e-07,
      "logits": -2.780062437057495,
      "logps": -229.3790740966797,
      "loss": 0.683,
      "step": 15
    },
    {
      "epoch": 0.04274646005877638,
      "grad_norm": 19.287203304415307,
      "learning_rate": 1.4893617021276595e-07,
      "logits": -2.772031545639038,
      "logps": -204.7851104736328,
      "loss": 0.6589,
      "step": 20
    },
    {
      "epoch": 0.053433075073470476,
      "grad_norm": 16.506203912380084,
      "learning_rate": 2.0212765957446807e-07,
      "logits": -2.9439215660095215,
      "logps": -291.8533630371094,
      "loss": 0.5956,
      "step": 25
    },
    {
      "epoch": 0.06411969008816458,
      "grad_norm": 13.779319784342116,
      "learning_rate": 2.4468085106382976e-07,
      "logits": -2.911271572113037,
      "logps": -281.06744384765625,
      "loss": 0.5498,
      "step": 30
    },
    {
      "epoch": 0.07480630510285867,
      "grad_norm": 12.4154908271174,
      "learning_rate": 2.978723404255319e-07,
      "logits": -2.8849587440490723,
      "logps": -235.69473266601562,
      "loss": 0.5207,
      "step": 35
    },
    {
      "epoch": 0.08549292011755276,
      "grad_norm": 13.748382495294905,
      "learning_rate": 3.5106382978723405e-07,
      "logits": -2.877370595932007,
      "logps": -235.3643035888672,
      "loss": 0.4912,
      "step": 40
    },
    {
      "epoch": 0.09617953513224686,
      "grad_norm": 13.504025107902667,
      "learning_rate": 4.0425531914893614e-07,
      "logits": -2.7878780364990234,
      "logps": -260.6932678222656,
      "loss": 0.4916,
      "step": 45
    },
    {
      "epoch": 0.10686615014694095,
      "grad_norm": 14.324493553144778,
      "learning_rate": 4.574468085106383e-07,
      "logits": -2.603867292404175,
      "logps": -273.16552734375,
      "loss": 0.4721,
      "step": 50
    },
    {
      "epoch": 0.11755276516163506,
      "grad_norm": 15.40742501299336,
      "learning_rate": 4.999930062653174e-07,
      "logits": -2.7843973636627197,
      "logps": -288.14190673828125,
      "loss": 0.4515,
      "step": 55
    },
    {
      "epoch": 0.12823938017632916,
      "grad_norm": 14.561448001055401,
      "learning_rate": 4.997482666353286e-07,
      "logits": -2.647210121154785,
      "logps": -257.77447509765625,
      "loss": 0.4475,
      "step": 60
    },
    {
      "epoch": 0.13892599519102325,
      "grad_norm": 15.068250536743896,
      "learning_rate": 4.991542314714122e-07,
      "logits": -2.5821423530578613,
      "logps": -303.4721984863281,
      "loss": 0.4282,
      "step": 65
    },
    {
      "epoch": 0.14961261020571734,
      "grad_norm": 16.720167595176566,
      "learning_rate": 4.982117315854593e-07,
      "logits": -2.341573476791382,
      "logps": -270.63189697265625,
      "loss": 0.4396,
      "step": 70
    },
    {
      "epoch": 0.16029922522041143,
      "grad_norm": 13.024576148545005,
      "learning_rate": 4.969220851487844e-07,
      "logits": -2.181319236755371,
      "logps": -271.0784912109375,
      "loss": 0.4102,
      "step": 75
    },
    {
      "epoch": 0.17098584023510552,
      "grad_norm": 14.533980847784468,
      "learning_rate": 4.952870958485431e-07,
      "logits": -2.5626049041748047,
      "logps": -315.2617492675781,
      "loss": 0.4169,
      "step": 80
    },
    {
      "epoch": 0.18167245524979964,
      "grad_norm": 20.372388284984453,
      "learning_rate": 4.933090503651128e-07,
      "logits": -2.1712753772735596,
      "logps": -308.96380615234375,
      "loss": 0.4085,
      "step": 85
    },
    {
      "epoch": 0.19235907026449373,
      "grad_norm": 16.99275205662673,
      "learning_rate": 4.909907151739633e-07,
      "logits": -2.3788561820983887,
      "logps": -242.3260498046875,
      "loss": 0.4102,
      "step": 90
    },
    {
      "epoch": 0.20304568527918782,
      "grad_norm": 15.680297362409974,
      "learning_rate": 4.883353326764906e-07,
      "logits": -2.041024684906006,
      "logps": -308.76361083984375,
      "loss": 0.4059,
      "step": 95
    },
    {
      "epoch": 0.2137323002938819,
      "grad_norm": 16.614616612784232,
      "learning_rate": 4.853466166652258e-07,
      "logits": -2.2316627502441406,
      "logps": -250.2170867919922,
      "loss": 0.3966,
      "step": 100
    },
    {
      "epoch": 0.224418915308576,
      "grad_norm": 15.24947145329996,
      "learning_rate": 4.820287471297597e-07,
      "logits": -2.2991251945495605,
      "logps": -299.30413818359375,
      "loss": 0.3826,
      "step": 105
    },
    {
      "epoch": 0.2351055303232701,
      "grad_norm": 13.727683778137456,
      "learning_rate": 4.783863644106502e-07,
      "logits": -2.3693361282348633,
      "logps": -316.0078125,
      "loss": 0.3928,
      "step": 110
    },
    {
      "epoch": 0.2457921453379642,
      "grad_norm": 14.648764803231707,
      "learning_rate": 4.744245627094858e-07,
      "logits": -2.2451415061950684,
      "logps": -289.3954772949219,
      "loss": 0.4144,
      "step": 115
    },
    {
      "epoch": 0.2564787603526583,
      "grad_norm": 14.654511458237025,
      "learning_rate": 4.7014888296418447e-07,
      "logits": -2.1494853496551514,
      "logps": -273.82159423828125,
      "loss": 0.4048,
      "step": 120
    },
    {
      "epoch": 0.2671653753673524,
      "grad_norm": 14.029747414365776,
      "learning_rate": 4.655653050994906e-07,
      "logits": -2.2021608352661133,
      "logps": -295.5478515625,
      "loss": 0.3795,
      "step": 125
    },
    {
      "epoch": 0.2778519903820465,
      "grad_norm": 14.629974380430687,
      "learning_rate": 4.606802396635098e-07,
      "logits": -2.278817653656006,
      "logps": -288.4320983886719,
      "loss": 0.4076,
      "step": 130
    },
    {
      "epoch": 0.2885386053967406,
      "grad_norm": 15.667008536793405,
      "learning_rate": 4.555005188619775e-07,
      "logits": -2.370594024658203,
      "logps": -278.10565185546875,
      "loss": 0.3922,
      "step": 135
    },
    {
      "epoch": 0.2992252204114347,
      "grad_norm": 16.537626095297334,
      "learning_rate": 4.500333870028016e-07,
      "logits": -2.296696424484253,
      "logps": -314.9455871582031,
      "loss": 0.3805,
      "step": 140
    },
    {
      "epoch": 0.30991183542612877,
      "grad_norm": 14.136931000002011,
      "learning_rate": 4.442864903642427e-07,
      "logits": -1.9875481128692627,
      "logps": -321.88336181640625,
      "loss": 0.3807,
      "step": 145
    },
    {
      "epoch": 0.32059845044082286,
      "grad_norm": 17.66764816927005,
      "learning_rate": 4.3826786650090273e-07,
      "logits": -2.300191879272461,
      "logps": -288.90155029296875,
      "loss": 0.3962,
      "step": 150
    },
    {
      "epoch": 0.33128506545551695,
      "grad_norm": 13.966542226658245,
      "learning_rate": 4.319859330024777e-07,
      "logits": -2.366628408432007,
      "logps": -320.36199951171875,
      "loss": 0.3882,
      "step": 155
    },
    {
      "epoch": 0.34197168047021104,
      "grad_norm": 15.005833930316435,
      "learning_rate": 4.254494757209979e-07,
      "logits": -2.2027194499969482,
      "logps": -344.4361267089844,
      "loss": 0.3849,
      "step": 160
    },
    {
      "epoch": 0.3526582954849052,
      "grad_norm": 18.876637586071404,
      "learning_rate": 4.186676364830186e-07,
      "logits": -2.357083559036255,
      "logps": -315.52972412109375,
      "loss": 0.3865,
      "step": 165
    },
    {
      "epoch": 0.36334491049959927,
      "grad_norm": 15.883791751426108,
      "learning_rate": 4.1164990030394985e-07,
      "logits": -2.214961051940918,
      "logps": -286.7484130859375,
      "loss": 0.383,
      "step": 170
    },
    {
      "epoch": 0.37403152551429336,
      "grad_norm": 15.570319458411793,
      "learning_rate": 4.0440608212240445e-07,
      "logits": -2.1734325885772705,
      "logps": -290.1646728515625,
      "loss": 0.3771,
      "step": 175
    },
    {
      "epoch": 0.38471814052898745,
      "grad_norm": 16.13327248480777,
      "learning_rate": 3.9694631307311825e-07,
      "logits": -2.2254865169525146,
      "logps": -303.46368408203125,
      "loss": 0.3899,
      "step": 180
    },
    {
      "epoch": 0.39540475554368154,
      "grad_norm": 13.968633194350911,
      "learning_rate": 3.8928102631764304e-07,
      "logits": -2.254255771636963,
      "logps": -246.87158203125,
      "loss": 0.3705,
      "step": 185
    },
    {
      "epoch": 0.40609137055837563,
      "grad_norm": 16.518660551756426,
      "learning_rate": 3.8142094245262615e-07,
      "logits": -2.283003568649292,
      "logps": -298.9637451171875,
      "loss": 0.3755,
      "step": 190
    },
    {
      "epoch": 0.4167779855730697,
      "grad_norm": 17.34857995588876,
      "learning_rate": 3.7337705451608667e-07,
      "logits": -2.154602289199829,
      "logps": -354.7010192871094,
      "loss": 0.3748,
      "step": 195
    },
    {
      "epoch": 0.4274646005877638,
      "grad_norm": 15.365894431623499,
      "learning_rate": 3.6516061261265805e-07,
      "logits": -2.255361795425415,
      "logps": -273.0242004394531,
      "loss": 0.3733,
      "step": 200
    },
    {
      "epoch": 0.4274646005877638,
      "eval_logits": -2.2792365550994873,
      "eval_logps": -309.9268493652344,
      "eval_loss": 0.3719645142555237,
      "eval_runtime": 491.0681,
      "eval_samples_per_second": 4.008,
      "eval_steps_per_second": 0.25,
      "step": 200
    },
    {
      "epoch": 0.4381512156024579,
      "grad_norm": 15.070320151495675,
      "learning_rate": 3.567831081792992e-07,
      "logits": -2.1955361366271973,
      "logps": -286.1488037109375,
      "loss": 0.3799,
      "step": 205
    },
    {
      "epoch": 0.448837830617152,
      "grad_norm": 14.900452812607735,
      "learning_rate": 3.482562579134809e-07,
      "logits": -2.0645949840545654,
      "logps": -300.73236083984375,
      "loss": 0.3727,
      "step": 210
    },
    {
      "epoch": 0.45952444563184613,
      "grad_norm": 16.05224888818079,
      "learning_rate": 3.39591987386325e-07,
      "logits": -1.9900414943695068,
      "logps": -282.0771484375,
      "loss": 0.3582,
      "step": 215
    },
    {
      "epoch": 0.4702110606465402,
      "grad_norm": 15.03367961373721,
      "learning_rate": 3.30802414363615e-07,
      "logits": -1.9547094106674194,
      "logps": -248.65402221679688,
      "loss": 0.3634,
      "step": 220
    },
    {
      "epoch": 0.4808976756612343,
      "grad_norm": 18.773649100686807,
      "learning_rate": 3.218998318580043e-07,
      "logits": -2.17350172996521,
      "logps": -326.99517822265625,
      "loss": 0.367,
      "step": 225
    },
    {
      "epoch": 0.4915842906759284,
      "grad_norm": 14.562679231504998,
      "learning_rate": 3.128966909361271e-07,
      "logits": -2.153386116027832,
      "logps": -335.359375,
      "loss": 0.3683,
      "step": 230
    },
    {
      "epoch": 0.5022709056906225,
      "grad_norm": 13.853727892905015,
      "learning_rate": 3.038055833046555e-07,
      "logits": -2.035804510116577,
      "logps": -272.8970642089844,
      "loss": 0.3716,
      "step": 235
    },
    {
      "epoch": 0.5129575207053166,
      "grad_norm": 15.090711014568011,
      "learning_rate": 2.9463922369965915e-07,
      "logits": -1.9920990467071533,
      "logps": -318.5932922363281,
      "loss": 0.3686,
      "step": 240
    },
    {
      "epoch": 0.5236441357200107,
      "grad_norm": 16.18137909043194,
      "learning_rate": 2.8541043210389726e-07,
      "logits": -2.217284679412842,
      "logps": -294.2337341308594,
      "loss": 0.3545,
      "step": 245
    },
    {
      "epoch": 0.5343307507347048,
      "grad_norm": 14.063753919982574,
      "learning_rate": 2.761321158169134e-07,
      "logits": -2.3281540870666504,
      "logps": -285.443359375,
      "loss": 0.3574,
      "step": 250
    },
    {
      "epoch": 0.5450173657493989,
      "grad_norm": 17.098897367043495,
      "learning_rate": 2.6681725140300995e-07,
      "logits": -1.7651288509368896,
      "logps": -297.5621032714844,
      "loss": 0.3564,
      "step": 255
    },
    {
      "epoch": 0.555703980764093,
      "grad_norm": 16.412107745592355,
      "learning_rate": 2.574788665423496e-07,
      "logits": -1.856030821800232,
      "logps": -297.8916320800781,
      "loss": 0.3588,
      "step": 260
    },
    {
      "epoch": 0.566390595778787,
      "grad_norm": 14.888086982411561,
      "learning_rate": 2.4813002181056676e-07,
      "logits": -2.086013078689575,
      "logps": -289.2059020996094,
      "loss": 0.3562,
      "step": 265
    },
    {
      "epoch": 0.5770772107934812,
      "grad_norm": 20.34056135034251,
      "learning_rate": 2.3878379241237134e-07,
      "logits": -1.7992274761199951,
      "logps": -286.0703125,
      "loss": 0.3674,
      "step": 270
    },
    {
      "epoch": 0.5877638258081752,
      "grad_norm": 16.00937961787345,
      "learning_rate": 2.2945324989469243e-07,
      "logits": -2.1212961673736572,
      "logps": -294.78125,
      "loss": 0.3583,
      "step": 275
    },
    {
      "epoch": 0.5984504408228694,
      "grad_norm": 15.0543607024416,
      "learning_rate": 2.2015144386493895e-07,
      "logits": -1.5599911212921143,
      "logps": -331.1915588378906,
      "loss": 0.3612,
      "step": 280
    },
    {
      "epoch": 0.6091370558375635,
      "grad_norm": 15.738762756418016,
      "learning_rate": 2.1089138373994222e-07,
      "logits": -1.6524254083633423,
      "logps": -275.34027099609375,
      "loss": 0.3517,
      "step": 285
    },
    {
      "epoch": 0.6198236708522575,
      "grad_norm": 14.233606209222401,
      "learning_rate": 2.0168602055111173e-07,
      "logits": -1.846451997756958,
      "logps": -323.7337341308594,
      "loss": 0.3594,
      "step": 290
    },
    {
      "epoch": 0.6305102858669517,
      "grad_norm": 14.831569367257195,
      "learning_rate": 1.9254822883124517e-07,
      "logits": -1.5174415111541748,
      "logps": -268.7288818359375,
      "loss": 0.3556,
      "step": 295
    },
    {
      "epoch": 0.6411969008816457,
      "grad_norm": 14.671373291294442,
      "learning_rate": 1.8349078860833124e-07,
      "logits": -1.7903592586517334,
      "logps": -292.779052734375,
      "loss": 0.3559,
      "step": 300
    },
    {
      "epoch": 0.6518835158963399,
      "grad_norm": 15.705427082152443,
      "learning_rate": 1.745263675315245e-07,
      "logits": -1.7898918390274048,
      "logps": -310.0693664550781,
      "loss": 0.3571,
      "step": 305
    },
    {
      "epoch": 0.6625701309110339,
      "grad_norm": 14.233332865288965,
      "learning_rate": 1.656675031542925e-07,
      "logits": -1.736101508140564,
      "logps": -288.0835266113281,
      "loss": 0.3618,
      "step": 310
    },
    {
      "epoch": 0.673256745925728,
      "grad_norm": 13.101127579355996,
      "learning_rate": 1.569265853995137e-07,
      "logits": -2.0390021800994873,
      "logps": -329.4677429199219,
      "loss": 0.3578,
      "step": 315
    },
    {
      "epoch": 0.6839433609404221,
      "grad_norm": 15.898783980322763,
      "learning_rate": 1.4831583923104998e-07,
      "logits": -1.9800916910171509,
      "logps": -278.5652770996094,
      "loss": 0.3391,
      "step": 320
    },
    {
      "epoch": 0.6946299759551162,
      "grad_norm": 15.179976349180745,
      "learning_rate": 1.3984730755602903e-07,
      "logits": -2.15975284576416,
      "logps": -331.96722412109375,
      "loss": 0.3488,
      "step": 325
    },
    {
      "epoch": 0.7053165909698104,
      "grad_norm": 16.173648063524812,
      "learning_rate": 1.3153283438175034e-07,
      "logits": -2.1058340072631836,
      "logps": -319.34527587890625,
      "loss": 0.3568,
      "step": 330
    },
    {
      "epoch": 0.7160032059845044,
      "grad_norm": 14.495401917181017,
      "learning_rate": 1.2338404825076935e-07,
      "logits": -1.7633529901504517,
      "logps": -351.7260437011719,
      "loss": 0.3397,
      "step": 335
    },
    {
      "epoch": 0.7266898209991985,
      "grad_norm": 14.748613870290693,
      "learning_rate": 1.1541234597732947e-07,
      "logits": -1.9439738988876343,
      "logps": -284.2515563964844,
      "loss": 0.3488,
      "step": 340
    },
    {
      "epoch": 0.7373764360138926,
      "grad_norm": 15.431597691399574,
      "learning_rate": 1.0762887670788701e-07,
      "logits": -2.0670387744903564,
      "logps": -324.03240966796875,
      "loss": 0.3568,
      "step": 345
    },
    {
      "epoch": 0.7480630510285867,
      "grad_norm": 13.916918536725055,
      "learning_rate": 1.0004452632802158e-07,
      "logits": -1.9829730987548828,
      "logps": -283.0121154785156,
      "loss": 0.3371,
      "step": 350
    },
    {
      "epoch": 0.7587496660432808,
      "grad_norm": 14.83244858797638,
      "learning_rate": 9.266990223754067e-08,
      "logits": -2.1220943927764893,
      "logps": -284.113525390625,
      "loss": 0.3572,
      "step": 355
    },
    {
      "epoch": 0.7694362810579749,
      "grad_norm": 13.906877690225956,
      "learning_rate": 8.551531851507185e-08,
      "logits": -1.8662292957305908,
      "logps": -316.2903747558594,
      "loss": 0.3534,
      "step": 360
    },
    {
      "epoch": 0.7801228960726689,
      "grad_norm": 16.021070732056423,
      "learning_rate": 7.859078149289144e-08,
      "logits": -2.0029776096343994,
      "logps": -290.8583068847656,
      "loss": 0.3611,
      "step": 365
    },
    {
      "epoch": 0.7908095110873631,
      "grad_norm": 13.954109703177394,
      "learning_rate": 7.190597576216384e-08,
      "logits": -1.896113634109497,
      "logps": -294.7978210449219,
      "loss": 0.349,
      "step": 370
    },
    {
      "epoch": 0.8014961261020572,
      "grad_norm": 18.103369920066683,
      "learning_rate": 6.547025062816486e-08,
      "logits": -1.7909294366836548,
      "logps": -298.8819885253906,
      "loss": 0.3567,
      "step": 375
    },
    {
      "epoch": 0.8121827411167513,
      "grad_norm": 12.482171705770575,
      "learning_rate": 5.929260703443337e-08,
      "logits": -1.713022232055664,
      "logps": -309.056396484375,
      "loss": 0.3468,
      "step": 380
    },
    {
      "epoch": 0.8228693561314454,
      "grad_norm": 15.966406254185237,
      "learning_rate": 5.338168497413756e-08,
      "logits": -1.485386610031128,
      "logps": -301.24560546875,
      "loss": 0.3568,
      "step": 385
    },
    {
      "epoch": 0.8335559711461394,
      "grad_norm": 14.935885056404505,
      "learning_rate": 4.774575140626316e-08,
      "logits": -1.68508780002594,
      "logps": -302.7105407714844,
      "loss": 0.3465,
      "step": 390
    },
    {
      "epoch": 0.8442425861608336,
      "grad_norm": 14.494342289383189,
      "learning_rate": 4.2392688693524055e-08,
      "logits": -1.780106782913208,
      "logps": -281.1724548339844,
      "loss": 0.3577,
      "step": 395
    },
    {
      "epoch": 0.8549292011755276,
      "grad_norm": 14.966163192699174,
      "learning_rate": 3.732998357816514e-08,
      "logits": -1.9449115991592407,
      "logps": -308.26251220703125,
      "loss": 0.355,
      "step": 400
    },
    {
      "epoch": 0.8549292011755276,
      "eval_logits": -1.9703269004821777,
      "eval_logps": -324.5088806152344,
      "eval_loss": 0.3534272313117981,
      "eval_runtime": 480.7572,
      "eval_samples_per_second": 4.094,
      "eval_steps_per_second": 0.256,
      "step": 400
    },
    {
      "epoch": 0.8656158161902218,
      "grad_norm": 14.52513199126684,
      "learning_rate": 3.256471671107616e-08,
      "logits": -1.9270665645599365,
      "logps": -320.7890319824219,
      "loss": 0.357,
      "step": 405
    },
    {
      "epoch": 0.8763024312049158,
      "grad_norm": 13.984563355291044,
      "learning_rate": 2.8103552748861475e-08,
      "logits": -1.7152255773544312,
      "logps": -300.7731628417969,
      "loss": 0.3598,
      "step": 410
    },
    {
      "epoch": 0.88698904621961,
      "grad_norm": 14.474719718248345,
      "learning_rate": 2.3952731032714973e-08,
      "logits": -1.8561521768569946,
      "logps": -279.46380615234375,
      "loss": 0.3509,
      "step": 415
    },
    {
      "epoch": 0.897675661234304,
      "grad_norm": 15.20686225812657,
      "learning_rate": 2.0118056862137354e-08,
      "logits": -2.1437106132507324,
      "logps": -296.0022277832031,
      "loss": 0.3596,
      "step": 420
    },
    {
      "epoch": 0.9083622762489981,
      "grad_norm": 13.705499471422334,
      "learning_rate": 1.6604893375699592e-08,
      "logits": -1.8986858129501343,
      "logps": -294.5618896484375,
      "loss": 0.3566,
      "step": 425
    },
    {
      "epoch": 0.9190488912636923,
      "grad_norm": 14.224665908488847,
      "learning_rate": 1.3418154050208936e-08,
      "logits": -1.9494727849960327,
      "logps": -325.150634765625,
      "loss": 0.3432,
      "step": 430
    },
    {
      "epoch": 0.9297355062783863,
      "grad_norm": 13.456954319141683,
      "learning_rate": 1.0562295828767387e-08,
      "logits": -2.093982458114624,
      "logps": -293.69842529296875,
      "loss": 0.3565,
      "step": 435
    },
    {
      "epoch": 0.9404221212930804,
      "grad_norm": 13.391645385265695,
      "learning_rate": 8.041312887333396e-09,
      "logits": -1.904130220413208,
      "logps": -276.39105224609375,
      "loss": 0.3404,
      "step": 440
    },
    {
      "epoch": 0.9511087363077745,
      "grad_norm": 20.71139273996219,
      "learning_rate": 5.858731048505927e-09,
      "logits": -1.914345383644104,
      "logps": -338.41656494140625,
      "loss": 0.3573,
      "step": 445
    },
    {
      "epoch": 0.9617953513224686,
      "grad_norm": 19.97291791251005,
      "learning_rate": 4.0176028503425826e-09,
      "logits": -1.9096574783325195,
      "logps": -301.0379943847656,
      "loss": 0.355,
      "step": 450
    },
    {
      "epoch": 0.9724819663371627,
      "grad_norm": 14.314824993795222,
      "learning_rate": 2.5205032771092592e-09,
      "logits": -1.702121376991272,
      "logps": -298.85516357421875,
      "loss": 0.3377,
      "step": 455
    },
    {
      "epoch": 0.9831685813518568,
      "grad_norm": 13.935952369098977,
      "learning_rate": 1.3695261579316775e-09,
      "logits": -1.7297840118408203,
      "logps": -259.74139404296875,
      "loss": 0.3506,
      "step": 460
    },
    {
      "epoch": 0.9938551963665508,
      "grad_norm": 16.215817529965406,
      "learning_rate": 5.662812383859794e-10,
      "logits": -1.9168570041656494,
      "logps": -299.5458068847656,
      "loss": 0.3554,
      "step": 465
    },
    {
      "epoch": 0.9981298423724285,
      "step": 467,
      "total_flos": 0.0,
      "train_loss": 0.3941320441264412,
      "train_runtime": 39337.3566,
      "train_samples_per_second": 1.522,
      "train_steps_per_second": 0.012
    }
  ],
  "logging_steps": 5,
  "max_steps": 467,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 1,
  "save_steps": 125,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": true
      },
      "attributes": {}
    }
  },
  "total_flos": 0.0,
  "train_batch_size": 1,
  "trial_name": null,
  "trial_params": null
}