End of training

Browse files

Files changed (5) hide show

all_results.json +6 -6
pytorch_model.bin +1 -1
runs/Nov08_03-08-54_teesta/events.out.tfevents.1667857146.teesta.30780.0 +2 -2
train_results.json +6 -6
trainer_state.json +685 -85

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 7.8,
-    "total_flos": 5.011254619486618e+16,
-    "train_loss": 0.9726034700870514,
-    "train_runtime": 60.475,
-    "train_samples_per_second": 84.134,
-    "train_steps_per_second": 0.265
 }

 {
+    "epoch": 49.8,
+    "total_flos": 3.197753854288036e+17,
+    "train_loss": 0.3222511351108551,
+    "train_runtime": 425.6784,
+    "train_samples_per_second": 74.704,
+    "train_steps_per_second": 0.235
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be00eb3b10547693fff8fd59ebc7a338b82c9cbc4a9401175b6c9ed8f6296b41
 size 44790413

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0216682802b08cfae03ccddd163dfb1cc827ba7be19fb8d48a91a8354b08617
 size 44790413

runs/Nov08_03-08-54_teesta/events.out.tfevents.1667857146.teesta.30780.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:60620fa919fe0c7ee84a705f364c5ed65675da77262c04ba379189f5324a9b3a
-size 25913

 version https://git-lfs.github.com/spec/v1
+oid sha256:80fce727f490fe37bbfa6a867ff97ddf3c6ece236584580ed1954c6f25becb8b
+size 31186

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 7.8,
-    "total_flos": 5.011254619486618e+16,
-    "train_loss": 0.9726034700870514,
-    "train_runtime": 60.475,
-    "train_samples_per_second": 84.134,
-    "train_steps_per_second": 0.265
 }

 {
+    "epoch": 49.8,
+    "total_flos": 3.197753854288036e+17,
+    "train_loss": 0.3222511351108551,
+    "train_runtime": 425.6784,
+    "train_samples_per_second": 74.704,
+    "train_steps_per_second": 0.235
 }

trainer_state.json CHANGED Viewed

@@ -1,135 +1,735 @@
 {
-  "best_metric": 0.76875,
-  "best_model_checkpoint": "resnet-18-feature-extraction/checkpoint-16",
-  "epoch": 7.8,
-  "global_step": 16,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.8,
-      "eval_accuracy": 0.09375,
-      "eval_f1": 0.0,
-      "eval_loss": 1.4615901708602905,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_roc_auc": 0.5,
-      "eval_runtime": 4.0789,
-      "eval_samples_per_second": 39.226,
-      "eval_steps_per_second": 0.735,
       "step": 2
     },
     {
       "epoch": 1.8,
-      "eval_accuracy": 0.09375,
-      "eval_f1": 0.0,
-      "eval_loss": 1.3914295434951782,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_roc_auc": 0.5,
-      "eval_runtime": 4.1829,
-      "eval_samples_per_second": 38.251,
-      "eval_steps_per_second": 0.717,
       "step": 4
     },
     {
       "epoch": 2.8,
-      "eval_accuracy": 0.09375,
-      "eval_f1": 0.0,
-      "eval_loss": 1.473630666732788,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_roc_auc": 0.5,
-      "eval_runtime": 4.2309,
-      "eval_samples_per_second": 37.817,
-      "eval_steps_per_second": 0.709,
       "step": 6
     },
     {
       "epoch": 3.8,
-      "eval_accuracy": 0.09375,
-      "eval_f1": 0.0,
-      "eval_loss": 1.6036533117294312,
-      "eval_precision": 0.0,
-      "eval_recall": 0.0,
-      "eval_roc_auc": 0.5,
-      "eval_runtime": 4.3657,
-      "eval_samples_per_second": 36.65,
-      "eval_steps_per_second": 0.687,
       "step": 8
     },
     {
       "epoch": 4.8,
-      "learning_rate": 8.571428571428571e-06,
-      "loss": 1.0775,
       "step": 10
     },
     {
       "epoch": 4.8,
-      "eval_accuracy": 0.1375,
-      "eval_f1": 0.09210526315789473,
-      "eval_loss": 1.1970865726470947,
       "eval_precision": 1.0,
-      "eval_recall": 0.04827586206896552,
-      "eval_roc_auc": 0.5241379310344828,
-      "eval_runtime": 4.1964,
-      "eval_samples_per_second": 38.128,
-      "eval_steps_per_second": 0.715,
       "step": 10
     },
     {
       "epoch": 5.8,
-      "eval_accuracy": 0.28125,
-      "eval_f1": 0.34285714285714286,
-      "eval_loss": 0.9469502568244934,
       "eval_precision": 1.0,
-      "eval_recall": 0.20689655172413793,
-      "eval_roc_auc": 0.603448275862069,
-      "eval_runtime": 4.128,
-      "eval_samples_per_second": 38.76,
-      "eval_steps_per_second": 0.727,
       "step": 12
     },
     {
       "epoch": 6.8,
-      "eval_accuracy": 0.725,
-      "eval_f1": 0.8211382113821138,
-      "eval_loss": 0.6010352969169617,
       "eval_precision": 1.0,
-      "eval_recall": 0.696551724137931,
-      "eval_roc_auc": 0.8482758620689654,
-      "eval_runtime": 4.0447,
-      "eval_samples_per_second": 39.558,
-      "eval_steps_per_second": 0.742,
       "step": 14
     },
     {
       "epoch": 7.8,
-      "eval_accuracy": 0.76875,
-      "eval_f1": 0.8537549407114624,
-      "eval_loss": 0.566879153251648,
-      "eval_precision": 1.0,
-      "eval_recall": 0.7448275862068966,
-      "eval_roc_auc": 0.8724137931034484,
-      "eval_runtime": 4.1451,
-      "eval_samples_per_second": 38.6,
-      "eval_steps_per_second": 0.724,
       "step": 16
     },
     {
-      "epoch": 7.8,
-      "step": 16,
-      "total_flos": 5.011254619486618e+16,
-      "train_loss": 0.9726034700870514,
-      "train_runtime": 60.475,
-      "train_samples_per_second": 84.134,
-      "train_steps_per_second": 0.265
     }
   ],
-  "max_steps": 16,
-  "num_train_epochs": 8,
-  "total_flos": 5.011254619486618e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.95625,
+  "best_model_checkpoint": "resnet-18-feature-extraction/checkpoint-26",
+  "epoch": 49.8,
+  "global_step": 100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.8,
+      "eval_accuracy": 0.75,
+      "eval_f1": 0.8412698412698413,
+      "eval_loss": 0.6231745481491089,
+      "eval_precision": 0.9636363636363636,
+      "eval_recall": 0.7464788732394366,
+      "eval_roc_auc": 0.7621283255086071,
+      "eval_runtime": 5.3474,
+      "eval_samples_per_second": 29.921,
+      "eval_steps_per_second": 0.561,
       "step": 2
     },
     {
       "epoch": 1.8,
+      "eval_accuracy": 0.4875,
+      "eval_f1": 0.5940594059405941,
+      "eval_loss": 0.6971184611320496,
+      "eval_precision": 1.0,
+      "eval_recall": 0.4225352112676056,
+      "eval_roc_auc": 0.7112676056338028,
+      "eval_runtime": 4.1245,
+      "eval_samples_per_second": 38.792,
+      "eval_steps_per_second": 0.727,
       "step": 4
     },
     {
       "epoch": 2.8,
+      "eval_accuracy": 0.2875,
+      "eval_f1": 0.32941176470588235,
+      "eval_loss": 0.7914562821388245,
+      "eval_precision": 1.0,
+      "eval_recall": 0.19718309859154928,
+      "eval_roc_auc": 0.5985915492957746,
+      "eval_runtime": 4.0788,
+      "eval_samples_per_second": 39.227,
+      "eval_steps_per_second": 0.736,
       "step": 6
     },
     {
       "epoch": 3.8,
+      "eval_accuracy": 0.2875,
+      "eval_f1": 0.32941176470588235,
+      "eval_loss": 0.8479948043823242,
+      "eval_precision": 1.0,
+      "eval_recall": 0.19718309859154928,
+      "eval_roc_auc": 0.5985915492957746,
+      "eval_runtime": 3.9544,
+      "eval_samples_per_second": 40.462,
+      "eval_steps_per_second": 0.759,
       "step": 8
     },
     {
       "epoch": 4.8,
+      "learning_rate": 2e-05,
+      "loss": 0.8651,
       "step": 10
     },
     {
       "epoch": 4.8,
+      "eval_accuracy": 0.25625,
+      "eval_f1": 0.2787878787878788,
+      "eval_loss": 0.9093517065048218,
       "eval_precision": 1.0,
+      "eval_recall": 0.1619718309859155,
+      "eval_roc_auc": 0.5809859154929577,
+      "eval_runtime": 4.143,
+      "eval_samples_per_second": 38.62,
+      "eval_steps_per_second": 0.724,
       "step": 10
     },
     {
       "epoch": 5.8,
+      "eval_accuracy": 0.5625,
+      "eval_f1": 0.6728971962616822,
+      "eval_loss": 0.7470346689224243,
       "eval_precision": 1.0,
+      "eval_recall": 0.5070422535211268,
+      "eval_roc_auc": 0.7535211267605634,
+      "eval_runtime": 3.9679,
+      "eval_samples_per_second": 40.323,
+      "eval_steps_per_second": 0.756,
       "step": 12
     },
     {
       "epoch": 6.8,
+      "eval_accuracy": 0.85,
+      "eval_f1": 0.9076923076923077,
+      "eval_loss": 0.5915343165397644,
       "eval_precision": 1.0,
+      "eval_recall": 0.8309859154929577,
+      "eval_roc_auc": 0.9154929577464789,
+      "eval_runtime": 4.0338,
+      "eval_samples_per_second": 39.665,
+      "eval_steps_per_second": 0.744,
       "step": 14
     },
     {
       "epoch": 7.8,
+      "eval_accuracy": 0.8875,
+      "eval_f1": 0.9333333333333333,
+      "eval_loss": 0.4816938042640686,
+      "eval_precision": 0.984375,
+      "eval_recall": 0.8873239436619719,
+      "eval_roc_auc": 0.8881064162754304,
+      "eval_runtime": 4.0258,
+      "eval_samples_per_second": 39.743,
+      "eval_steps_per_second": 0.745,
       "step": 16
     },
     {
+      "epoch": 8.8,
+      "eval_accuracy": 0.91875,
+      "eval_f1": 0.9530685920577617,
+      "eval_loss": 0.34547853469848633,
+      "eval_precision": 0.9777777777777777,
+      "eval_recall": 0.9295774647887324,
+      "eval_roc_auc": 0.881455399061033,
+      "eval_runtime": 3.9749,
+      "eval_samples_per_second": 40.253,
+      "eval_steps_per_second": 0.755,
+      "step": 18
+    },
+    {
+      "epoch": 9.8,
+      "learning_rate": 1.7777777777777777e-05,
+      "loss": 0.5349,
+      "step": 20
+    },
+    {
+      "epoch": 9.8,
+      "eval_accuracy": 0.91875,
+      "eval_f1": 0.9534050179211471,
+      "eval_loss": 0.29664501547813416,
+      "eval_precision": 0.9708029197080292,
+      "eval_recall": 0.9366197183098591,
+      "eval_roc_auc": 0.8571987480438183,
+      "eval_runtime": 4.2704,
+      "eval_samples_per_second": 37.467,
+      "eval_steps_per_second": 0.703,
+      "step": 20
+    },
+    {
+      "epoch": 10.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.972027972027972,
+      "eval_loss": 0.23471388220787048,
+      "eval_precision": 0.9652777777777778,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.850547730829421,
+      "eval_runtime": 3.9069,
+      "eval_samples_per_second": 40.953,
+      "eval_steps_per_second": 0.768,
+      "step": 22
+    },
+    {
+      "epoch": 11.8,
+      "eval_accuracy": 0.93125,
+      "eval_f1": 0.9611307420494699,
+      "eval_loss": 0.2467934787273407,
+      "eval_precision": 0.9645390070921985,
+      "eval_recall": 0.9577464788732394,
+      "eval_roc_auc": 0.8399843505477309,
+      "eval_runtime": 4.025,
+      "eval_samples_per_second": 39.751,
+      "eval_steps_per_second": 0.745,
+      "step": 24
+    },
+    {
+      "epoch": 12.8,
+      "eval_accuracy": 0.95625,
+      "eval_f1": 0.9754385964912281,
+      "eval_loss": 0.23101434111595154,
+      "eval_precision": 0.972027972027972,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.8783255086071988,
+      "eval_runtime": 4.0457,
+      "eval_samples_per_second": 39.548,
+      "eval_steps_per_second": 0.742,
+      "step": 26
+    },
+    {
+      "epoch": 13.8,
+      "eval_accuracy": 0.93125,
+      "eval_f1": 0.9614035087719298,
+      "eval_loss": 0.2082931101322174,
+      "eval_precision": 0.958041958041958,
+      "eval_recall": 0.9647887323943662,
+      "eval_roc_auc": 0.8157276995305165,
+      "eval_runtime": 4.0645,
+      "eval_samples_per_second": 39.366,
+      "eval_steps_per_second": 0.738,
+      "step": 28
+    },
+    {
+      "epoch": 14.8,
+      "learning_rate": 1.555555555555556e-05,
+      "loss": 0.3593,
+      "step": 30
+    },
+    {
+      "epoch": 14.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.9652777777777778,
+      "eval_loss": 0.18395133316516876,
+      "eval_precision": 0.952054794520548,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.7949921752738655,
+      "eval_runtime": 3.8518,
+      "eval_samples_per_second": 41.539,
+      "eval_steps_per_second": 0.779,
+      "step": 30
+    },
+    {
+      "epoch": 15.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.9647887323943662,
+      "eval_loss": 0.19472570717334747,
+      "eval_precision": 0.9647887323943662,
+      "eval_recall": 0.9647887323943662,
+      "eval_roc_auc": 0.8435054773082942,
+      "eval_runtime": 4.1431,
+      "eval_samples_per_second": 38.618,
+      "eval_steps_per_second": 0.724,
+      "step": 32
+    },
+    {
+      "epoch": 16.8,
+      "eval_accuracy": 0.93125,
+      "eval_f1": 0.9616724738675958,
+      "eval_loss": 0.1836571842432022,
+      "eval_precision": 0.9517241379310345,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.7914710485133021,
+      "eval_runtime": 4.0848,
+      "eval_samples_per_second": 39.17,
+      "eval_steps_per_second": 0.734,
+      "step": 34
+    },
+    {
+      "epoch": 17.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.9688581314878894,
+      "eval_loss": 0.1819494664669037,
+      "eval_precision": 0.9523809523809523,
+      "eval_recall": 0.9859154929577465,
+      "eval_roc_auc": 0.7985133020344288,
+      "eval_runtime": 3.9897,
+      "eval_samples_per_second": 40.104,
+      "eval_steps_per_second": 0.752,
+      "step": 36
+    },
+    {
+      "epoch": 18.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.968421052631579,
+      "eval_loss": 0.19235201179981232,
+      "eval_precision": 0.965034965034965,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8470266040688575,
+      "eval_runtime": 4.041,
+      "eval_samples_per_second": 39.594,
+      "eval_steps_per_second": 0.742,
+      "step": 38
+    },
+    {
+      "epoch": 19.8,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.2737,
+      "step": 40
+    },
+    {
+      "epoch": 19.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.972027972027972,
+      "eval_loss": 0.1990378201007843,
+      "eval_precision": 0.9652777777777778,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.850547730829421,
+      "eval_runtime": 4.1236,
+      "eval_samples_per_second": 38.801,
+      "eval_steps_per_second": 0.728,
+      "step": 40
+    },
+    {
+      "epoch": 20.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.971830985915493,
+      "eval_loss": 0.1758503019809723,
+      "eval_precision": 0.971830985915493,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8748043818466354,
+      "eval_runtime": 4.1193,
+      "eval_samples_per_second": 38.841,
+      "eval_steps_per_second": 0.728,
+      "step": 42
+    },
+    {
+      "epoch": 21.8,
+      "eval_accuracy": 0.93125,
+      "eval_f1": 0.9616724738675958,
+      "eval_loss": 0.18040268123149872,
+      "eval_precision": 0.9517241379310345,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.7914710485133021,
+      "eval_runtime": 3.8662,
+      "eval_samples_per_second": 41.384,
+      "eval_steps_per_second": 0.776,
+      "step": 44
+    },
+    {
+      "epoch": 22.8,
+      "eval_accuracy": 0.93125,
+      "eval_f1": 0.9616724738675958,
+      "eval_loss": 0.16663400828838348,
+      "eval_precision": 0.9517241379310345,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.7914710485133021,
+      "eval_runtime": 4.3016,
+      "eval_samples_per_second": 37.195,
+      "eval_steps_per_second": 0.697,
+      "step": 46
+    },
+    {
+      "epoch": 23.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.9688581314878894,
+      "eval_loss": 0.15337304770946503,
+      "eval_precision": 0.9523809523809523,
+      "eval_recall": 0.9859154929577465,
+      "eval_roc_auc": 0.7985133020344288,
+      "eval_runtime": 4.0456,
+      "eval_samples_per_second": 39.549,
+      "eval_steps_per_second": 0.742,
+      "step": 48
+    },
+    {
+      "epoch": 24.8,
+      "learning_rate": 1.1111111111111113e-05,
+      "loss": 0.2278,
+      "step": 50
+    },
+    {
+      "epoch": 24.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.9652777777777778,
+      "eval_loss": 0.16116251051425934,
+      "eval_precision": 0.952054794520548,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.7949921752738655,
+      "eval_runtime": 4.0452,
+      "eval_samples_per_second": 39.553,
+      "eval_steps_per_second": 0.742,
+      "step": 50
+    },
+    {
+      "epoch": 25.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.9686411149825783,
+      "eval_loss": 0.15349864959716797,
+      "eval_precision": 0.9586206896551724,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.8227699530516432,
+      "eval_runtime": 6.0991,
+      "eval_samples_per_second": 26.233,
+      "eval_steps_per_second": 0.492,
+      "step": 52
+    },
+    {
+      "epoch": 26.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.9681978798586572,
+      "eval_loss": 0.1568022519350052,
+      "eval_precision": 0.9716312056737588,
+      "eval_recall": 0.9647887323943662,
+      "eval_roc_auc": 0.871283255086072,
+      "eval_runtime": 4.0891,
+      "eval_samples_per_second": 39.128,
+      "eval_steps_per_second": 0.734,
+      "step": 54
+    },
+    {
+      "epoch": 27.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.9645390070921985,
+      "eval_loss": 0.21069078147411346,
+      "eval_precision": 0.9714285714285714,
+      "eval_recall": 0.9577464788732394,
+      "eval_roc_auc": 0.8677621283255086,
+      "eval_runtime": 4.1257,
+      "eval_samples_per_second": 38.781,
+      "eval_steps_per_second": 0.727,
+      "step": 56
+    },
+    {
+      "epoch": 28.8,
+      "eval_accuracy": 0.93125,
+      "eval_f1": 0.9616724738675958,
+      "eval_loss": 0.15922358632087708,
+      "eval_precision": 0.9517241379310345,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.7914710485133021,
+      "eval_runtime": 3.944,
+      "eval_samples_per_second": 40.568,
+      "eval_steps_per_second": 0.761,
+      "step": 58
+    },
+    {
+      "epoch": 29.8,
+      "learning_rate": 8.888888888888888e-06,
+      "loss": 0.2057,
+      "step": 60
+    },
+    {
+      "epoch": 29.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.9647887323943662,
+      "eval_loss": 0.15567776560783386,
+      "eval_precision": 0.9647887323943662,
+      "eval_recall": 0.9647887323943662,
+      "eval_roc_auc": 0.8435054773082942,
+      "eval_runtime": 3.9386,
+      "eval_samples_per_second": 40.624,
+      "eval_steps_per_second": 0.762,
+      "step": 60
+    },
+    {
+      "epoch": 30.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.968421052631579,
+      "eval_loss": 0.1714434176683426,
+      "eval_precision": 0.965034965034965,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8470266040688575,
+      "eval_runtime": 4.1925,
+      "eval_samples_per_second": 38.164,
+      "eval_steps_per_second": 0.716,
+      "step": 62
+    },
+    {
+      "epoch": 31.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.972027972027972,
+      "eval_loss": 0.15714499354362488,
+      "eval_precision": 0.9652777777777778,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.850547730829421,
+      "eval_runtime": 4.3684,
+      "eval_samples_per_second": 36.627,
+      "eval_steps_per_second": 0.687,
+      "step": 64
+    },
+    {
+      "epoch": 32.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.965034965034965,
+      "eval_loss": 0.15739548206329346,
+      "eval_precision": 0.9583333333333334,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8192488262910799,
+      "eval_runtime": 3.9613,
+      "eval_samples_per_second": 40.39,
+      "eval_steps_per_second": 0.757,
+      "step": 66
+    },
+    {
+      "epoch": 33.8,
+      "eval_accuracy": 0.95625,
+      "eval_f1": 0.9754385964912281,
+      "eval_loss": 0.1422826498746872,
+      "eval_precision": 0.972027972027972,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.8783255086071988,
+      "eval_runtime": 3.9825,
+      "eval_samples_per_second": 40.175,
+      "eval_steps_per_second": 0.753,
+      "step": 68
+    },
+    {
+      "epoch": 34.8,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.2,
+      "step": 70
+    },
+    {
+      "epoch": 34.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.968421052631579,
+      "eval_loss": 0.16770192980766296,
+      "eval_precision": 0.965034965034965,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8470266040688575,
+      "eval_runtime": 4.1697,
+      "eval_samples_per_second": 38.372,
+      "eval_steps_per_second": 0.719,
+      "step": 70
+    },
+    {
+      "epoch": 35.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.965034965034965,
+      "eval_loss": 0.1559743881225586,
+      "eval_precision": 0.9583333333333334,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8192488262910799,
+      "eval_runtime": 4.0897,
+      "eval_samples_per_second": 39.123,
+      "eval_steps_per_second": 0.734,
+      "step": 72
+    },
+    {
+      "epoch": 36.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.9652777777777778,
+      "eval_loss": 0.15941758453845978,
+      "eval_precision": 0.952054794520548,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.7949921752738655,
+      "eval_runtime": 4.0474,
+      "eval_samples_per_second": 39.531,
+      "eval_steps_per_second": 0.741,
+      "step": 74
+    },
+    {
+      "epoch": 37.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.9686411149825783,
+      "eval_loss": 0.15121030807495117,
+      "eval_precision": 0.9586206896551724,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.8227699530516432,
+      "eval_runtime": 4.2667,
+      "eval_samples_per_second": 37.499,
+      "eval_steps_per_second": 0.703,
+      "step": 76
+    },
+    {
+      "epoch": 38.8,
+      "eval_accuracy": 0.95625,
+      "eval_f1": 0.975609756097561,
+      "eval_loss": 0.13959212601184845,
+      "eval_precision": 0.9655172413793104,
+      "eval_recall": 0.9859154929577465,
+      "eval_roc_auc": 0.8540688575899843,
+      "eval_runtime": 4.0576,
+      "eval_samples_per_second": 39.432,
+      "eval_steps_per_second": 0.739,
+      "step": 78
+    },
+    {
+      "epoch": 39.8,
+      "learning_rate": 4.444444444444444e-06,
+      "loss": 0.1838,
+      "step": 80
+    },
+    {
+      "epoch": 39.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.965034965034965,
+      "eval_loss": 0.15085594356060028,
+      "eval_precision": 0.9583333333333334,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8192488262910799,
+      "eval_runtime": 3.9857,
+      "eval_samples_per_second": 40.144,
+      "eval_steps_per_second": 0.753,
+      "step": 80
+    },
+    {
+      "epoch": 40.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.971830985915493,
+      "eval_loss": 0.15287616848945618,
+      "eval_precision": 0.971830985915493,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8748043818466354,
+      "eval_runtime": 5.1236,
+      "eval_samples_per_second": 31.228,
+      "eval_steps_per_second": 0.586,
+      "step": 82
+    },
+    {
+      "epoch": 41.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.972027972027972,
+      "eval_loss": 0.1505597084760666,
+      "eval_precision": 0.9652777777777778,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.850547730829421,
+      "eval_runtime": 4.2192,
+      "eval_samples_per_second": 37.921,
+      "eval_steps_per_second": 0.711,
+      "step": 84
+    },
+    {
+      "epoch": 42.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.972027972027972,
+      "eval_loss": 0.1549244374036789,
+      "eval_precision": 0.9652777777777778,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.850547730829421,
+      "eval_runtime": 3.8602,
+      "eval_samples_per_second": 41.448,
+      "eval_steps_per_second": 0.777,
+      "step": 86
+    },
+    {
+      "epoch": 43.8,
+      "eval_accuracy": 0.95625,
+      "eval_f1": 0.975609756097561,
+      "eval_loss": 0.13305585086345673,
+      "eval_precision": 0.9655172413793104,
+      "eval_recall": 0.9859154929577465,
+      "eval_roc_auc": 0.8540688575899843,
+      "eval_runtime": 4.2919,
+      "eval_samples_per_second": 37.28,
+      "eval_steps_per_second": 0.699,
+      "step": 88
+    },
+    {
+      "epoch": 44.8,
+      "learning_rate": 2.222222222222222e-06,
+      "loss": 0.1872,
+      "step": 90
+    },
+    {
+      "epoch": 44.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.9688581314878894,
+      "eval_loss": 0.14087018370628357,
+      "eval_precision": 0.9523809523809523,
+      "eval_recall": 0.9859154929577465,
+      "eval_roc_auc": 0.7985133020344288,
+      "eval_runtime": 4.0748,
+      "eval_samples_per_second": 39.266,
+      "eval_steps_per_second": 0.736,
+      "step": 90
+    },
+    {
+      "epoch": 45.8,
+      "eval_accuracy": 0.9375,
+      "eval_f1": 0.965034965034965,
+      "eval_loss": 0.1639305055141449,
+      "eval_precision": 0.9583333333333334,
+      "eval_recall": 0.971830985915493,
+      "eval_roc_auc": 0.8192488262910799,
+      "eval_runtime": 3.9376,
+      "eval_samples_per_second": 40.634,
+      "eval_steps_per_second": 0.762,
+      "step": 92
+    },
+    {
+      "epoch": 46.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.9722222222222222,
+      "eval_loss": 0.1390833854675293,
+      "eval_precision": 0.958904109589041,
+      "eval_recall": 0.9859154929577465,
+      "eval_roc_auc": 0.8262910798122067,
+      "eval_runtime": 3.9934,
+      "eval_samples_per_second": 40.066,
+      "eval_steps_per_second": 0.751,
+      "step": 94
+    },
+    {
+      "epoch": 47.8,
+      "eval_accuracy": 0.95625,
+      "eval_f1": 0.975609756097561,
+      "eval_loss": 0.14361494779586792,
+      "eval_precision": 0.9655172413793104,
+      "eval_recall": 0.9859154929577465,
+      "eval_roc_auc": 0.8540688575899843,
+      "eval_runtime": 4.2477,
+      "eval_samples_per_second": 37.667,
+      "eval_steps_per_second": 0.706,
+      "step": 96
+    },
+    {
+      "epoch": 48.8,
+      "eval_accuracy": 0.94375,
+      "eval_f1": 0.9686411149825783,
+      "eval_loss": 0.1442493200302124,
+      "eval_precision": 0.9586206896551724,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.8227699530516432,
+      "eval_runtime": 4.0963,
+      "eval_samples_per_second": 39.059,
+      "eval_steps_per_second": 0.732,
+      "step": 98
+    },
+    {
+      "epoch": 49.8,
+      "learning_rate": 0.0,
+      "loss": 0.185,
+      "step": 100
+    },
+    {
+      "epoch": 49.8,
+      "eval_accuracy": 0.95,
+      "eval_f1": 0.972027972027972,
+      "eval_loss": 0.1484707146883011,
+      "eval_precision": 0.9652777777777778,
+      "eval_recall": 0.9788732394366197,
+      "eval_roc_auc": 0.850547730829421,
+      "eval_runtime": 3.8936,
+      "eval_samples_per_second": 41.093,
+      "eval_steps_per_second": 0.77,
+      "step": 100
+    },
+    {
+      "epoch": 49.8,
+      "step": 100,
+      "total_flos": 3.197753854288036e+17,
+      "train_loss": 0.3222511351108551,
+      "train_runtime": 425.6784,
+      "train_samples_per_second": 74.704,
+      "train_steps_per_second": 0.235
     }
   ],
+  "max_steps": 100,
+  "num_train_epochs": 50,
+  "total_flos": 3.197753854288036e+17,
   "trial_name": null,
   "trial_params": null
 }