Training in progress, epoch 2, checkpoint

Browse files

Files changed (5) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +152 -5

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8b948a914e39fad4e65020c5a428e98d9ef510b3c5699b312791549222200834
 size 344814656

 version https://git-lfs.github.com/spec/v1
+oid sha256:f5c64c281a4cde322ef3eb6901f5acc80b324755fe3573a877fca65b6fdaa614
 size 344814656

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:370a3783788e3426f46911174c6ecf5ee6c66358da5df6ada20646ce9f2ad264
 size 689741690

 version https://git-lfs.github.com/spec/v1
+oid sha256:1fb4798e31a0c379f8d2aea2f62c93a4ebb0f2223f0b6871e830c00610a07c83
 size 689741690

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9196a1e708bf24d6abba41cce3f8558820acc3e50f9394c5955e29eb41ffea3d
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:c062f7f375beded48b5337f5a3f3a5cb38807fa3e85dbf3e294c0ab6b627bfc2
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d1556c40535abe1ed34e2654d4ee34ba195375d3a724579fc6d1e890cfd9ace7
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:08b0fce6ed4085eabc1083cc6543ed01efa76540d9e0ff5ac4e32bdd796f6655
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.83,
-  "best_model_checkpoint": "ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan/checkpoint-113",
-  "epoch": 1.0,
   "eval_steps": 500,
-  "global_step": 113,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -148,13 +148,160 @@
       "eval_samples_per_second": 6.377,
       "eval_steps_per_second": 0.829,
       "step": 113
     }
   ],
   "logging_steps": 5,
   "max_steps": 1130,
   "num_train_epochs": 10,
   "save_steps": 500,
-  "total_flos": 6.094112254328832e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.87,
+  "best_model_checkpoint": "ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan/checkpoint-226",
+  "epoch": 2.0,
   "eval_steps": 500,
+  "global_step": 226,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 6.377,
       "eval_steps_per_second": 0.829,
       "step": 113
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 4.990167158308752e-05,
+      "loss": 0.5449,
+      "step": 115
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 4.9655850540806295e-05,
+      "loss": 0.5122,
+      "step": 120
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 4.941002949852507e-05,
+      "loss": 0.5462,
+      "step": 125
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 4.9164208456243856e-05,
+      "loss": 0.5006,
+      "step": 130
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 4.891838741396263e-05,
+      "loss": 0.4551,
+      "step": 135
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 4.867256637168142e-05,
+      "loss": 0.7397,
+      "step": 140
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 4.8426745329400195e-05,
+      "loss": 0.4615,
+      "step": 145
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 4.818092428711898e-05,
+      "loss": 0.3942,
+      "step": 150
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 4.7935103244837756e-05,
+      "loss": 0.4799,
+      "step": 155
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 4.768928220255654e-05,
+      "loss": 0.421,
+      "step": 160
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 4.7443461160275324e-05,
+      "loss": 0.694,
+      "step": 165
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 4.71976401179941e-05,
+      "loss": 0.3993,
+      "step": 170
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 4.6951819075712886e-05,
+      "loss": 0.5977,
+      "step": 175
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 4.670599803343166e-05,
+      "loss": 0.974,
+      "step": 180
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 4.646017699115045e-05,
+      "loss": 0.5518,
+      "step": 185
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 4.6214355948869224e-05,
+      "loss": 0.5082,
+      "step": 190
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 4.596853490658801e-05,
+      "loss": 0.5166,
+      "step": 195
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 4.5722713864306786e-05,
+      "loss": 0.6408,
+      "step": 200
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 4.547689282202557e-05,
+      "loss": 0.6056,
+      "step": 205
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 4.523107177974435e-05,
+      "loss": 0.6339,
+      "step": 210
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 4.498525073746313e-05,
+      "loss": 0.7673,
+      "step": 215
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 4.473942969518191e-05,
+      "loss": 0.2352,
+      "step": 220
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 4.449360865290069e-05,
+      "loss": 0.3513,
+      "step": 225
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.87,
+      "eval_loss": 0.5030723810195923,
+      "eval_runtime": 15.1706,
+      "eval_samples_per_second": 6.592,
+      "eval_steps_per_second": 0.857,
+      "step": 226
     }
   ],
   "logging_steps": 5,
   "max_steps": 1130,
   "num_train_epochs": 10,
   "save_steps": 500,
+  "total_flos": 1.2188224508657664e+17,
   "trial_name": null,
   "trial_params": null
 }