End of training

Browse files

Files changed (4) hide show

all_results.json +8 -0
runs/Nov18_14-14-28_ml-server03/events.out.tfevents.1731962748.ml-server03.3189854.1 +2 -2
trainer_state.json +290 -0
val_results.json +8 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 2.326530612244898,
+    "eval_accuracy": 0.8075,
+    "eval_loss": 0.47592803835868835,
+    "eval_runtime": 236.8069,
+    "eval_samples_per_second": 3.378,
+    "eval_steps_per_second": 0.211
+}

runs/Nov18_14-14-28_ml-server03/events.out.tfevents.1731962748.ml-server03.3189854.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6e15e90374286354023d60ad00ffad206395e573dfbb12e08364fdf642d3bc6d
-size 363

 version https://git-lfs.github.com/spec/v1
+oid sha256:817c4904f887a16ea341b724d7cf65892c876dc1ea44d98e2cfac3c621b963ac
+size 686

trainer_state.json ADDED Viewed

	@@ -0,0 +1,290 @@

+{
+  "best_metric": 0.8075,
+  "best_model_checkpoint": "videomae-base-finetuned-rwf2000-subset/checkpoint-99",
+  "epoch": 2.326530612244898,
+  "eval_steps": 500,
+  "global_step": 294,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.034013605442176874,
+      "grad_norm": 4.7393035888671875,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.6905,
+      "step": 10
+    },
+    {
+      "epoch": 0.06802721088435375,
+      "grad_norm": 7.800499439239502,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.683,
+      "step": 20
+    },
+    {
+      "epoch": 0.10204081632653061,
+      "grad_norm": 4.713344097137451,
+      "learning_rate": 5e-05,
+      "loss": 0.6734,
+      "step": 30
+    },
+    {
+      "epoch": 0.1360544217687075,
+      "grad_norm": 4.479344367980957,
+      "learning_rate": 4.810606060606061e-05,
+      "loss": 0.5734,
+      "step": 40
+    },
+    {
+      "epoch": 0.17006802721088435,
+      "grad_norm": 12.256854057312012,
+      "learning_rate": 4.621212121212121e-05,
+      "loss": 0.5376,
+      "step": 50
+    },
+    {
+      "epoch": 0.20408163265306123,
+      "grad_norm": 3.8227643966674805,
+      "learning_rate": 4.431818181818182e-05,
+      "loss": 0.6064,
+      "step": 60
+    },
+    {
+      "epoch": 0.23809523809523808,
+      "grad_norm": 3.2429208755493164,
+      "learning_rate": 4.242424242424243e-05,
+      "loss": 0.5943,
+      "step": 70
+    },
+    {
+      "epoch": 0.272108843537415,
+      "grad_norm": 2.612661361694336,
+      "learning_rate": 4.053030303030303e-05,
+      "loss": 0.5576,
+      "step": 80
+    },
+    {
+      "epoch": 0.30612244897959184,
+      "grad_norm": 11.458771705627441,
+      "learning_rate": 3.8636363636363636e-05,
+      "loss": 0.4016,
+      "step": 90
+    },
+    {
+      "epoch": 0.336734693877551,
+      "eval_accuracy": 0.8075,
+      "eval_loss": 0.47592800855636597,
+      "eval_runtime": 226.6726,
+      "eval_samples_per_second": 3.529,
+      "eval_steps_per_second": 0.221,
+      "step": 99
+    },
+    {
+      "epoch": 1.0034013605442176,
+      "grad_norm": 8.344210624694824,
+      "learning_rate": 3.6742424242424246e-05,
+      "loss": 0.5466,
+      "step": 100
+    },
+    {
+      "epoch": 1.0374149659863945,
+      "grad_norm": 3.3535470962524414,
+      "learning_rate": 3.484848484848485e-05,
+      "loss": 0.5042,
+      "step": 110
+    },
+    {
+      "epoch": 1.0714285714285714,
+      "grad_norm": 7.865573883056641,
+      "learning_rate": 3.295454545454545e-05,
+      "loss": 0.4416,
+      "step": 120
+    },
+    {
+      "epoch": 1.1054421768707483,
+      "grad_norm": 2.2295467853546143,
+      "learning_rate": 3.106060606060606e-05,
+      "loss": 0.4595,
+      "step": 130
+    },
+    {
+      "epoch": 1.1394557823129252,
+      "grad_norm": 7.118393421173096,
+      "learning_rate": 2.916666666666667e-05,
+      "loss": 0.4775,
+      "step": 140
+    },
+    {
+      "epoch": 1.1734693877551021,
+      "grad_norm": 8.748396873474121,
+      "learning_rate": 2.7272727272727273e-05,
+      "loss": 0.4132,
+      "step": 150
+    },
+    {
+      "epoch": 1.2074829931972788,
+      "grad_norm": 6.271174430847168,
+      "learning_rate": 2.537878787878788e-05,
+      "loss": 0.4926,
+      "step": 160
+    },
+    {
+      "epoch": 1.2414965986394557,
+      "grad_norm": 7.936441898345947,
+      "learning_rate": 2.3484848484848487e-05,
+      "loss": 0.4532,
+      "step": 170
+    },
+    {
+      "epoch": 1.2755102040816326,
+      "grad_norm": 3.373074531555176,
+      "learning_rate": 2.1590909090909093e-05,
+      "loss": 0.5067,
+      "step": 180
+    },
+    {
+      "epoch": 1.3095238095238095,
+      "grad_norm": 2.5091629028320312,
+      "learning_rate": 1.9696969696969697e-05,
+      "loss": 0.2963,
+      "step": 190
+    },
+    {
+      "epoch": 1.336734693877551,
+      "eval_accuracy": 0.72,
+      "eval_loss": 0.691987156867981,
+      "eval_runtime": 248.5517,
+      "eval_samples_per_second": 3.219,
+      "eval_steps_per_second": 0.201,
+      "step": 198
+    },
+    {
+      "epoch": 2.006802721088435,
+      "grad_norm": 3.1143054962158203,
+      "learning_rate": 1.7803030303030303e-05,
+      "loss": 0.336,
+      "step": 200
+    },
+    {
+      "epoch": 2.0408163265306123,
+      "grad_norm": 7.136720180511475,
+      "learning_rate": 1.590909090909091e-05,
+      "loss": 0.3749,
+      "step": 210
+    },
+    {
+      "epoch": 2.074829931972789,
+      "grad_norm": 4.782387733459473,
+      "learning_rate": 1.4015151515151515e-05,
+      "loss": 0.3953,
+      "step": 220
+    },
+    {
+      "epoch": 2.108843537414966,
+      "grad_norm": 5.702661514282227,
+      "learning_rate": 1.2121212121212122e-05,
+      "loss": 0.3348,
+      "step": 230
+    },
+    {
+      "epoch": 2.142857142857143,
+      "grad_norm": 7.018678665161133,
+      "learning_rate": 1.0227272727272729e-05,
+      "loss": 0.3232,
+      "step": 240
+    },
+    {
+      "epoch": 2.17687074829932,
+      "grad_norm": 3.7905936241149902,
+      "learning_rate": 8.333333333333334e-06,
+      "loss": 0.3215,
+      "step": 250
+    },
+    {
+      "epoch": 2.2108843537414966,
+      "grad_norm": 3.4865996837615967,
+      "learning_rate": 6.43939393939394e-06,
+      "loss": 0.4199,
+      "step": 260
+    },
+    {
+      "epoch": 2.2448979591836733,
+      "grad_norm": 4.849910259246826,
+      "learning_rate": 4.5454545454545455e-06,
+      "loss": 0.2796,
+      "step": 270
+    },
+    {
+      "epoch": 2.2789115646258504,
+      "grad_norm": 6.265749931335449,
+      "learning_rate": 2.651515151515152e-06,
+      "loss": 0.4186,
+      "step": 280
+    },
+    {
+      "epoch": 2.312925170068027,
+      "grad_norm": 5.316267013549805,
+      "learning_rate": 7.575757575757576e-07,
+      "loss": 0.3408,
+      "step": 290
+    },
+    {
+      "epoch": 2.326530612244898,
+      "eval_accuracy": 0.7875,
+      "eval_loss": 0.45441704988479614,
+      "eval_runtime": 261.2996,
+      "eval_samples_per_second": 3.062,
+      "eval_steps_per_second": 0.191,
+      "step": 294
+    },
+    {
+      "epoch": 2.326530612244898,
+      "step": 294,
+      "total_flos": 5.841550795443536e+18,
+      "train_loss": 0.46131317631727986,
+      "train_runtime": 2481.7838,
+      "train_samples_per_second": 1.895,
+      "train_steps_per_second": 0.118
+    },
+    {
+      "epoch": 2.326530612244898,
+      "eval_accuracy": 0.8075,
+      "eval_loss": 0.47592803835868835,
+      "eval_runtime": 242.7873,
+      "eval_samples_per_second": 3.295,
+      "eval_steps_per_second": 0.206,
+      "step": 294
+    },
+    {
+      "epoch": 2.326530612244898,
+      "eval_accuracy": 0.8075,
+      "eval_loss": 0.47592803835868835,
+      "eval_runtime": 236.8069,
+      "eval_samples_per_second": 3.378,
+      "eval_steps_per_second": 0.211,
+      "step": 294
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 294,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 5.841550795443536e+18,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

val_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 2.326530612244898,
+    "eval_accuracy": 0.8075,
+    "eval_loss": 0.47592803835868835,
+    "eval_runtime": 236.8069,
+    "eval_samples_per_second": 3.378,
+    "eval_steps_per_second": 0.211
+}