add model configuration

Browse files

Files changed (13) hide show

.DS_Store +0 -0
config.json +38 -0
merges.txt +0 -0
optimizer.pt +3 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +1 -0
tokenizer.json +0 -0
tokenizer_config.json +1 -0
trainer_state.json +118 -0
training_args.bin +3 -0
vocab.json +0 -0

.DS_Store ADDED Viewed

Binary file (6.15 kB). View file

config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "./SocalDisner-weak/run-12/checkpoint-70880",
+  "architectures": [
+    "RobertaForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-DISEASE",
+    "2": "I-DISEASE"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "B-DISEASE": "1",
+    "I-DISEASE": "2",
+    "O": "0"
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.19.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50262
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:50ffdfb60c6f6105239d0be1862928d5f1e0ce7f3b6c0f8333e44af64c1a1546
+size 992555749

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0c43e05b044524db452be1850eea9fd40d1fb9250323ab4b8d0c451ad38a2ac
+size 496291249

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:639dfe1ce4b858e0f7c786bcfbe164dc29e83d8a57f05ef4a77297828e9a32c4
+size 14567

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c6a6f556935337b5c0ed6bc2112a979ba4254a8dc2b72befff66c6196ff897ba
+size 623

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"bos_token": {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, "eos_token": {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, "unk_token": {"content": "<unk>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, "sep_token": {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, "pad_token": {"content": "<pad>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, "cls_token": {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true}}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"errors": "replace", "bos_token": {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "eos_token": {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "sep_token": {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "cls_token": {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "unk_token": {"content": "<unk>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "pad_token": {"content": "<pad>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "add_prefix_space": true, "trim_offsets": true, "max_len": 512, "special_tokens_map_file": null, "name_or_path": "./SocalDisner-weak/run-12/checkpoint-70880", "tokenizer_class": "RobertaTokenizer"}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,118 @@

+{
+  "best_metric": 0.9128113879003559,
+  "best_model_checkpoint": "./SocalDisner-strong/run-1/checkpoint-4430",
+  "epoch": 7.122186495176849,
+  "global_step": 4430,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.8,
+      "learning_rate": 2.3346599605377065e-05,
+      "loss": 0.0902,
+      "step": 500
+    },
+    {
+      "epoch": 1.42,
+      "eval_f1": 0.9015075376884422,
+      "eval_loss": 0.04874825105071068,
+      "eval_runtime": 13.1719,
+      "eval_samples_per_second": 189.797,
+      "eval_steps_per_second": 23.763,
+      "step": 886
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 2.963685146642776e-05,
+      "loss": 0.0494,
+      "step": 1000
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 2.5909883223667728e-05,
+      "loss": 0.0284,
+      "step": 1500
+    },
+    {
+      "epoch": 2.85,
+      "eval_f1": 0.9087016748520338,
+      "eval_loss": 0.049770649522542953,
+      "eval_runtime": 13.2365,
+      "eval_samples_per_second": 188.871,
+      "eval_steps_per_second": 23.647,
+      "step": 1772
+    },
+    {
+      "epoch": 3.22,
+      "learning_rate": 2.21829149809077e-05,
+      "loss": 0.0141,
+      "step": 2000
+    },
+    {
+      "epoch": 4.02,
+      "learning_rate": 1.845594673814767e-05,
+      "loss": 0.0075,
+      "step": 2500
+    },
+    {
+      "epoch": 4.27,
+      "eval_f1": 0.9092276830491474,
+      "eval_loss": 0.0691143274307251,
+      "eval_runtime": 13.1876,
+      "eval_samples_per_second": 189.573,
+      "eval_steps_per_second": 23.734,
+      "step": 2658
+    },
+    {
+      "epoch": 4.82,
+      "learning_rate": 1.472897849538764e-05,
+      "loss": 0.0029,
+      "step": 3000
+    },
+    {
+      "epoch": 5.63,
+      "learning_rate": 1.1002010252627608e-05,
+      "loss": 0.0024,
+      "step": 3500
+    },
+    {
+      "epoch": 5.7,
+      "eval_f1": 0.9093625498007968,
+      "eval_loss": 0.06731252372264862,
+      "eval_runtime": 13.216,
+      "eval_samples_per_second": 189.165,
+      "eval_steps_per_second": 23.683,
+      "step": 3544
+    },
+    {
+      "epoch": 6.43,
+      "learning_rate": 7.275042009867579e-06,
+      "loss": 0.0017,
+      "step": 4000
+    },
+    {
+      "epoch": 7.12,
+      "eval_f1": 0.9128113879003559,
+      "eval_loss": 0.07908429950475693,
+      "eval_runtime": 13.1476,
+      "eval_samples_per_second": 190.149,
+      "eval_steps_per_second": 23.807,
+      "step": 4430
+    }
+  ],
+  "max_steps": 4976,
+  "num_train_epochs": 8,
+  "total_flos": 1557691318801926.0,
+  "trial_name": null,
+  "trial_params": {
+    "adam_epsilon": 1.0695999090544144e-10,
+    "learning_rate": 3.198484145936658e-05,
+    "num_train_epochs": 8,
+    "per_device_eval_batch_size": 8,
+    "per_device_train_batch_size": 32,
+    "seed": 326,
+    "warmup_steps": 685,
+    "weight_decay": 7.355540557094741e-05
+  }
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:661800da7b186f0de416d22040b782b2c79796490673c92daadf38ad11c1027a
+size 3183

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff