End of training

Browse files

Files changed (11) hide show

README.md +111 -0
all_results.json +12 -0
config.json +50 -0
eval_results.json +8 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
runs/Dec01_10-42-21_DESKTOP-SKBE9FB/events.out.tfevents.1733071343.DESKTOP-SKBE9FB.11644.0 +3 -0
runs/Dec01_10-42-21_DESKTOP-SKBE9FB/events.out.tfevents.1733071478.DESKTOP-SKBE9FB.11644.1 +3 -0
train_results.json +7 -0
trainer_state.json +417 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,111 @@

+---
+base_model: MBZUAI/swiftformer-xs
+tags:
+- generated_from_trainer
+datasets:
+- imagefolder
+metrics:
+- accuracy
+model-index:
+- name: swiftformer-xs-DMAE
+  results:
+  - task:
+      name: Image Classification
+      type: image-classification
+    dataset:
+      name: imagefolder
+      type: imagefolder
+      config: default
+      split: validation
+      args: default
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.10869565217391304
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# swiftformer-xs-DMAE
+This model is a fine-tuned version of [MBZUAI/swiftformer-xs](https://huggingface.co/MBZUAI/swiftformer-xs) on the imagefolder dataset.
+It achieves the following results on the evaluation set:
+- Loss: 113.9563
+- Accuracy: 0.1087
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.00015
+- train_batch_size: 16
+- eval_batch_size: 16
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 64
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 40
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 0.86  | 3    | 113.9563        | 0.1087   |
+| No log        | 2.0   | 7    | 113.9524        | 0.1087   |
+| 114.2271      | 2.86  | 10   | 113.9454        | 0.1087   |
+| 114.2271      | 4.0   | 14   | 113.9389        | 0.1087   |
+| 114.2271      | 4.86  | 17   | 113.9226        | 0.1087   |
+| 113.5566      | 6.0   | 21   | 113.8982        | 0.1087   |
+| 113.5566      | 6.86  | 24   | 113.8425        | 0.1087   |
+| 113.5566      | 8.0   | 28   | 113.7478        | 0.1087   |
+| 111.6907      | 8.86  | 31   | 113.6538        | 0.1087   |
+| 111.6907      | 10.0  | 35   | 113.5589        | 0.1087   |
+| 111.6907      | 10.86 | 38   | 113.5002        | 0.1087   |
+| 115.67        | 12.0  | 42   | 113.4496        | 0.1087   |
+| 115.67        | 12.86 | 45   | 113.3752        | 0.1087   |
+| 115.67        | 14.0  | 49   | 113.2129        | 0.1087   |
+| 111.8054      | 14.86 | 52   | 113.0828        | 0.1087   |
+| 111.8054      | 16.0  | 56   | 112.8805        | 0.1087   |
+| 111.8054      | 16.86 | 59   | 112.9013        | 0.1087   |
+| 112.3831      | 18.0  | 63   | 112.8123        | 0.1087   |
+| 112.3831      | 18.86 | 66   | 113.0190        | 0.1087   |
+| 113.1097      | 20.0  | 70   | 113.2929        | 0.1087   |
+| 113.1097      | 20.86 | 73   | 112.8861        | 0.1087   |
+| 113.1097      | 22.0  | 77   | 112.7154        | 0.1087   |
+| 113.3674      | 22.86 | 80   | 112.6943        | 0.1087   |
+| 113.3674      | 24.0  | 84   | 112.3937        | 0.1087   |
+| 113.3674      | 24.86 | 87   | 112.3862        | 0.1087   |
+| 113.1472      | 26.0  | 91   | 112.2693        | 0.1087   |
+| 113.1472      | 26.86 | 94   | 112.3107        | 0.1087   |
+| 113.1472      | 28.0  | 98   | 112.4216        | 0.1087   |
+| 111.3252      | 28.86 | 101  | 112.3318        | 0.1087   |
+| 111.3252      | 30.0  | 105  | 112.3517        | 0.1087   |
+| 111.3252      | 30.86 | 108  | 112.4213        | 0.1087   |
+| 112.827       | 32.0  | 112  | 112.4838        | 0.1087   |
+| 112.827       | 32.86 | 115  | 112.4490        | 0.1087   |
+| 112.827       | 34.0  | 119  | 112.1525        | 0.1087   |
+| 112.5631      | 34.29 | 120  | 112.1956        | 0.1087   |
+### Framework versions
+- Transformers 4.36.2
+- Pytorch 2.1.2+cu118
+- Datasets 2.16.1
+- Tokenizers 0.15.0

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 34.29,
+    "eval_accuracy": 0.10869565217391304,
+    "eval_loss": 113.95629119873047,
+    "eval_runtime": 0.6942,
+    "eval_samples_per_second": 66.266,
+    "eval_steps_per_second": 4.322,
+    "train_loss": 112.97269897460937,
+    "train_runtime": 134.324,
+    "train_samples_per_second": 63.429,
+    "train_steps_per_second": 0.893
+}

config.json ADDED Viewed

	@@ -0,0 +1,50 @@

+{
+  "_name_or_path": "MBZUAI/swiftformer-xs",
+  "architectures": [
+    "SwiftFormerForImageClassification"
+  ],
+  "batch_norm_eps": 1e-05,
+  "depths": [
+    3,
+    3,
+    6,
+    4
+  ],
+  "down_pad": 1,
+  "down_patch_size": 3,
+  "down_stride": 2,
+  "downsamples": [
+    true,
+    true,
+    true,
+    true
+  ],
+  "drop_path_rate": 0.0,
+  "embed_dims": [
+    48,
+    56,
+    112,
+    220
+  ],
+  "hidden_act": "gelu",
+  "id2label": {
+    "0": "avanzada",
+    "1": "leve",
+    "2": "moderada",
+    "3": "no dmae"
+  },
+  "label2id": {
+    "avanzada": 0,
+    "leve": 1,
+    "moderada": 2,
+    "no dmae": 3
+  },
+  "layer_scale_init_value": 1e-05,
+  "mlp_ratio": 4,
+  "model_type": "swiftformer",
+  "num_channels": 3,
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.36.2",
+  "use_layer_scale": true
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 34.29,
+    "eval_accuracy": 0.10869565217391304,
+    "eval_loss": 113.95629119873047,
+    "eval_runtime": 0.6942,
+    "eval_samples_per_second": 66.266,
+    "eval_steps_per_second": 4.322
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8fc36f501fe972e0a07bf8fed8813c2c5211b54394de8eaa01f7bad55db3aae1
+size 12203648

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

runs/Dec01_10-42-21_DESKTOP-SKBE9FB/events.out.tfevents.1733071343.DESKTOP-SKBE9FB.11644.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4177d74506b736f9d14b6b696eeb693f9412ffd092e75c62fbd6f6340e61160f
+size 17835

runs/Dec01_10-42-21_DESKTOP-SKBE9FB/events.out.tfevents.1733071478.DESKTOP-SKBE9FB.11644.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f5ac2946f52f34d412df781fbedc43b7d62b160c5184bcb2ba02b5c72d7e3cd
+size 405

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 34.29,
+    "train_loss": 112.97269897460937,
+    "train_runtime": 134.324,
+    "train_samples_per_second": 63.429,
+    "train_steps_per_second": 0.893
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,417 @@

+{
+  "best_metric": 0.10869565217391304,
+  "best_model_checkpoint": "swiftformer-xs-DMAE\\checkpoint-3",
+  "epoch": 34.285714285714285,
+  "eval_steps": 500,
+  "global_step": 120,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.95629119873047,
+      "eval_runtime": 0.6964,
+      "eval_samples_per_second": 66.055,
+      "eval_steps_per_second": 4.308,
+      "step": 3
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.952392578125,
+      "eval_runtime": 0.6137,
+      "eval_samples_per_second": 74.961,
+      "eval_steps_per_second": 4.889,
+      "step": 7
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 0.000125,
+      "loss": 114.2271,
+      "step": 10
+    },
+    {
+      "epoch": 2.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.94542694091797,
+      "eval_runtime": 0.6086,
+      "eval_samples_per_second": 75.578,
+      "eval_steps_per_second": 4.929,
+      "step": 10
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.93885803222656,
+      "eval_runtime": 0.6092,
+      "eval_samples_per_second": 75.515,
+      "eval_steps_per_second": 4.925,
+      "step": 14
+    },
+    {
+      "epoch": 4.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.9226303100586,
+      "eval_runtime": 0.6577,
+      "eval_samples_per_second": 69.945,
+      "eval_steps_per_second": 4.562,
+      "step": 17
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 0.0001388888888888889,
+      "loss": 113.5566,
+      "step": 20
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.89823913574219,
+      "eval_runtime": 0.6091,
+      "eval_samples_per_second": 75.517,
+      "eval_steps_per_second": 4.925,
+      "step": 21
+    },
+    {
+      "epoch": 6.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.84252166748047,
+      "eval_runtime": 0.6192,
+      "eval_samples_per_second": 74.295,
+      "eval_steps_per_second": 4.845,
+      "step": 24
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.7478256225586,
+      "eval_runtime": 0.6437,
+      "eval_samples_per_second": 71.467,
+      "eval_steps_per_second": 4.661,
+      "step": 28
+    },
+    {
+      "epoch": 8.57,
+      "learning_rate": 0.000125,
+      "loss": 111.6907,
+      "step": 30
+    },
+    {
+      "epoch": 8.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.65383911132812,
+      "eval_runtime": 0.6171,
+      "eval_samples_per_second": 74.538,
+      "eval_steps_per_second": 4.861,
+      "step": 31
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.55889892578125,
+      "eval_runtime": 0.6282,
+      "eval_samples_per_second": 73.23,
+      "eval_steps_per_second": 4.776,
+      "step": 35
+    },
+    {
+      "epoch": 10.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.500244140625,
+      "eval_runtime": 0.6501,
+      "eval_samples_per_second": 70.753,
+      "eval_steps_per_second": 4.614,
+      "step": 38
+    },
+    {
+      "epoch": 11.43,
+      "learning_rate": 0.00011111111111111109,
+      "loss": 115.67,
+      "step": 40
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.4496078491211,
+      "eval_runtime": 0.6246,
+      "eval_samples_per_second": 73.641,
+      "eval_steps_per_second": 4.803,
+      "step": 42
+    },
+    {
+      "epoch": 12.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.37518310546875,
+      "eval_runtime": 0.6266,
+      "eval_samples_per_second": 73.406,
+      "eval_steps_per_second": 4.787,
+      "step": 45
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.21294403076172,
+      "eval_runtime": 0.7182,
+      "eval_samples_per_second": 64.052,
+      "eval_steps_per_second": 4.177,
+      "step": 49
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 9.722222222222222e-05,
+      "loss": 111.8054,
+      "step": 50
+    },
+    {
+      "epoch": 14.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.0827865600586,
+      "eval_runtime": 0.6252,
+      "eval_samples_per_second": 73.582,
+      "eval_steps_per_second": 4.799,
+      "step": 52
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.88050842285156,
+      "eval_runtime": 0.6316,
+      "eval_samples_per_second": 72.825,
+      "eval_steps_per_second": 4.749,
+      "step": 56
+    },
+    {
+      "epoch": 16.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.90125274658203,
+      "eval_runtime": 0.6246,
+      "eval_samples_per_second": 73.642,
+      "eval_steps_per_second": 4.803,
+      "step": 59
+    },
+    {
+      "epoch": 17.14,
+      "learning_rate": 8.333333333333333e-05,
+      "loss": 112.3831,
+      "step": 60
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.812255859375,
+      "eval_runtime": 0.6547,
+      "eval_samples_per_second": 70.263,
+      "eval_steps_per_second": 4.582,
+      "step": 63
+    },
+    {
+      "epoch": 18.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.01899719238281,
+      "eval_runtime": 0.6161,
+      "eval_samples_per_second": 74.659,
+      "eval_steps_per_second": 4.869,
+      "step": 66
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 6.944444444444444e-05,
+      "loss": 113.1097,
+      "step": 70
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 113.29285430908203,
+      "eval_runtime": 0.6286,
+      "eval_samples_per_second": 73.173,
+      "eval_steps_per_second": 4.772,
+      "step": 70
+    },
+    {
+      "epoch": 20.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.88607025146484,
+      "eval_runtime": 0.6372,
+      "eval_samples_per_second": 72.196,
+      "eval_steps_per_second": 4.708,
+      "step": 73
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.71536254882812,
+      "eval_runtime": 0.6587,
+      "eval_samples_per_second": 69.838,
+      "eval_steps_per_second": 4.555,
+      "step": 77
+    },
+    {
+      "epoch": 22.86,
+      "learning_rate": 5.5555555555555545e-05,
+      "loss": 113.3674,
+      "step": 80
+    },
+    {
+      "epoch": 22.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.69425964355469,
+      "eval_runtime": 0.6142,
+      "eval_samples_per_second": 74.9,
+      "eval_steps_per_second": 4.885,
+      "step": 80
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.39366912841797,
+      "eval_runtime": 0.6652,
+      "eval_samples_per_second": 69.156,
+      "eval_steps_per_second": 4.51,
+      "step": 84
+    },
+    {
+      "epoch": 24.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.38623809814453,
+      "eval_runtime": 0.6241,
+      "eval_samples_per_second": 73.701,
+      "eval_steps_per_second": 4.807,
+      "step": 87
+    },
+    {
+      "epoch": 25.71,
+      "learning_rate": 4.1666666666666665e-05,
+      "loss": 113.1472,
+      "step": 90
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.26931762695312,
+      "eval_runtime": 0.6136,
+      "eval_samples_per_second": 74.962,
+      "eval_steps_per_second": 4.889,
+      "step": 91
+    },
+    {
+      "epoch": 26.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.31065368652344,
+      "eval_runtime": 0.7012,
+      "eval_samples_per_second": 65.606,
+      "eval_steps_per_second": 4.279,
+      "step": 94
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.42163848876953,
+      "eval_runtime": 0.6231,
+      "eval_samples_per_second": 73.819,
+      "eval_steps_per_second": 4.814,
+      "step": 98
+    },
+    {
+      "epoch": 28.57,
+      "learning_rate": 2.7777777777777772e-05,
+      "loss": 111.3252,
+      "step": 100
+    },
+    {
+      "epoch": 28.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.33184051513672,
+      "eval_runtime": 0.6136,
+      "eval_samples_per_second": 74.962,
+      "eval_steps_per_second": 4.889,
+      "step": 101
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.3516616821289,
+      "eval_runtime": 0.6282,
+      "eval_samples_per_second": 73.23,
+      "eval_steps_per_second": 4.776,
+      "step": 105
+    },
+    {
+      "epoch": 30.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.42131042480469,
+      "eval_runtime": 0.6367,
+      "eval_samples_per_second": 72.253,
+      "eval_steps_per_second": 4.712,
+      "step": 108
+    },
+    {
+      "epoch": 31.43,
+      "learning_rate": 1.3888888888888886e-05,
+      "loss": 112.827,
+      "step": 110
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.48377227783203,
+      "eval_runtime": 0.6321,
+      "eval_samples_per_second": 72.768,
+      "eval_steps_per_second": 4.746,
+      "step": 112
+    },
+    {
+      "epoch": 32.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.44902801513672,
+      "eval_runtime": 0.6151,
+      "eval_samples_per_second": 74.779,
+      "eval_steps_per_second": 4.877,
+      "step": 115
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.15248107910156,
+      "eval_runtime": 0.6382,
+      "eval_samples_per_second": 72.082,
+      "eval_steps_per_second": 4.701,
+      "step": 119
+    },
+    {
+      "epoch": 34.29,
+      "learning_rate": 0.0,
+      "loss": 112.5631,
+      "step": 120
+    },
+    {
+      "epoch": 34.29,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 112.195556640625,
+      "eval_runtime": 0.6527,
+      "eval_samples_per_second": 70.482,
+      "eval_steps_per_second": 4.597,
+      "step": 120
+    },
+    {
+      "epoch": 34.29,
+      "step": 120,
+      "total_flos": 2.0027429927092224e+16,
+      "train_loss": 112.97269897460937,
+      "train_runtime": 134.324,
+      "train_samples_per_second": 63.429,
+      "train_steps_per_second": 0.893
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 120,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 40,
+  "save_steps": 500,
+  "total_flos": 2.0027429927092224e+16,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca22fbcceedf6a1587f3bdfcbff82d0938662a5874b0085c375ade4d287a4278
+size 4728