Thinh Truong commited on Oct 14, 2022

Commit

447dfe2

1 Parent(s): 73ff1ab

update model files

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +56 -0
all_results.json +14 -0
config.json +38 -0
eval_results.json +9 -0
merges.txt +0 -0
pytorch_model.bin +3 -0
roberta2-base-mnli-negnli/README.md +56 -0
roberta2-base-mnli-negnli/all_results.json +14 -0
roberta2-base-mnli-negnli/checkpoint-500/config.json +38 -0
roberta2-base-mnli-negnli/checkpoint-500/merges.txt +0 -0
roberta2-base-mnli-negnli/checkpoint-500/optimizer.pt +3 -0
roberta2-base-mnli-negnli/checkpoint-500/pytorch_model.bin +3 -0
roberta2-base-mnli-negnli/checkpoint-500/rng_state.pth +3 -0
roberta2-base-mnli-negnli/checkpoint-500/scheduler.pt +3 -0
roberta2-base-mnli-negnli/checkpoint-500/special_tokens_map.json +15 -0
roberta2-base-mnli-negnli/checkpoint-500/tokenizer.json +0 -0
roberta2-base-mnli-negnli/checkpoint-500/tokenizer_config.json +16 -0
roberta2-base-mnli-negnli/checkpoint-500/trainer_state.json +22 -0
roberta2-base-mnli-negnli/checkpoint-500/training_args.bin +3 -0
roberta2-base-mnli-negnli/checkpoint-500/vocab.json +0 -0
roberta2-base-mnli-negnli/config.json +38 -0
roberta2-base-mnli-negnli/eval_results.json +9 -0
roberta2-base-mnli-negnli/merges.txt +0 -0
roberta2-base-mnli-negnli/pytorch_model.bin +3 -0
roberta2-base-mnli-negnli/runs/Jul07_23-50-30_doe/1657201850.622683/events.out.tfevents.1657201850.doe.63764.1 +3 -0
roberta2-base-mnli-negnli/runs/Jul07_23-50-30_doe/events.out.tfevents.1657201850.doe.63764.0 +3 -0
roberta2-base-mnli-negnli/runs/Jul07_23-50-30_doe/events.out.tfevents.1657201943.doe.63764.2 +3 -0
roberta2-base-mnli-negnli/runs/Jul07_23-54-02_doe/1657202061.6067924/events.out.tfevents.1657202061.doe.2632.1 +3 -0
roberta2-base-mnli-negnli/runs/Jul07_23-54-02_doe/events.out.tfevents.1657202061.doe.2632.0 +3 -0
roberta2-base-mnli-negnli/runs/Jul07_23-54-02_doe/events.out.tfevents.1657202129.doe.2632.2 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_00-57-12_doe/1657205852.4321375/events.out.tfevents.1657205852.doe.4547.1 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_00-57-12_doe/events.out.tfevents.1657205852.doe.4547.0 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_00-57-12_doe/events.out.tfevents.1657206008.doe.4547.2 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-08-17_doe/1657206517.7561595/events.out.tfevents.1657206517.doe.16385.1 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-08-17_doe/events.out.tfevents.1657206517.doe.16385.0 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-08-17_doe/events.out.tfevents.1657206612.doe.16385.2 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-12-22_doe/1657206761.9519951/events.out.tfevents.1657206761.doe.20937.1 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-12-22_doe/events.out.tfevents.1657206761.doe.20937.0 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-12-22_doe/events.out.tfevents.1657206857.doe.20937.2 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-15-21_doe/1657206941.3139427/events.out.tfevents.1657206941.doe.25921.1 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-15-21_doe/events.out.tfevents.1657206941.doe.25921.0 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-15-21_doe/events.out.tfevents.1657207104.doe.25921.2 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-22-31_doe/1657207371.2546418/events.out.tfevents.1657207371.doe.33741.1 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-22-31_doe/events.out.tfevents.1657207371.doe.33741.0 +3 -0
roberta2-base-mnli-negnli/runs/Jul08_01-22-31_doe/events.out.tfevents.1657207536.doe.33741.2 +3 -0
roberta2-base-mnli-negnli/special_tokens_map.json +15 -0
roberta2-base-mnli-negnli/tokenizer.json +0 -0
roberta2-base-mnli-negnli/tokenizer_config.json +16 -0
roberta2-base-mnli-negnli/train_results.json +8 -0
roberta2-base-mnli-negnli/trainer_state.json +31 -0

README.md ADDED Viewed

	@@ -0,0 +1,56 @@

+---
+license: mit
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: roberta2-base-mnli-negnli
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# roberta2-base-mnli-negnli
+This model is a fine-tuned version of [sileod/roberta-base-mnli](https://huggingface.co/sileod/roberta-base-mnli) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.8397
+- Accuracy: 0.8400
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 8
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 5.0
+### Training results
+### Framework versions
+- Transformers 4.21.0.dev0
+- Pytorch 1.8.0
+- Datasets 1.18.3
+- Tokenizers 0.12.1

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 5.0,
+    "eval_accuracy": 0.8399999737739563,
+    "eval_loss": 0.8397448658943176,
+    "eval_runtime": 1.7729,
+    "eval_samples": 300,
+    "eval_samples_per_second": 169.214,
+    "eval_steps_per_second": 21.434,
+    "train_loss": 0.444431884765625,
+    "train_runtime": 158.4081,
+    "train_samples": 1200,
+    "train_samples_per_second": 37.877,
+    "train_steps_per_second": 4.735
+}

config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "sileod/roberta-base-mnli",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "CONTRADICTION",
+    "1": "ENTAILMENT",
+    "2": "NEUTRAL"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "CONTRADICTION": 0,
+    "ENTAILMENT": 1,
+    "NEUTRAL": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.21.0.dev0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 5.0,
+    "eval_accuracy": 0.8399999737739563,
+    "eval_loss": 0.8397448658943176,
+    "eval_runtime": 1.7729,
+    "eval_samples": 300,
+    "eval_samples_per_second": 169.214,
+    "eval_steps_per_second": 21.434
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f28c6566a80bf80b26a2e5cc10639cbdb067568ff4892835ccb87fe6371ac35b
+size 498668617

roberta2-base-mnli-negnli/README.md ADDED Viewed

	@@ -0,0 +1,56 @@

+---
+license: mit
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: roberta2-base-mnli-negnli
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# roberta2-base-mnli-negnli
+This model is a fine-tuned version of [sileod/roberta-base-mnli](https://huggingface.co/sileod/roberta-base-mnli) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.8397
+- Accuracy: 0.8400
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 8
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 5.0
+### Training results
+### Framework versions
+- Transformers 4.21.0.dev0
+- Pytorch 1.8.0
+- Datasets 1.18.3
+- Tokenizers 0.12.1

roberta2-base-mnli-negnli/all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 5.0,
+    "eval_accuracy": 0.8399999737739563,
+    "eval_loss": 0.8397448658943176,
+    "eval_runtime": 1.7729,
+    "eval_samples": 300,
+    "eval_samples_per_second": 169.214,
+    "eval_steps_per_second": 21.434,
+    "train_loss": 0.444431884765625,
+    "train_runtime": 158.4081,
+    "train_samples": 1200,
+    "train_samples_per_second": 37.877,
+    "train_steps_per_second": 4.735
+}

roberta2-base-mnli-negnli/checkpoint-500/config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "sileod/roberta-base-mnli",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "CONTRADICTION",
+    "1": "ENTAILMENT",
+    "2": "NEUTRAL"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "CONTRADICTION": 0,
+    "ENTAILMENT": 1,
+    "NEUTRAL": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.21.0.dev0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

roberta2-base-mnli-negnli/checkpoint-500/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

roberta2-base-mnli-negnli/checkpoint-500/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2e9551da3c73121e547aa394625b20438e8a11b4245def5cae7805c1bc86e83c
+size 997309649

roberta2-base-mnli-negnli/checkpoint-500/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17766a4377f17b6610496612f147935767e3bc8738819ade326f26428061adb3
+size 498668617

roberta2-base-mnli-negnli/checkpoint-500/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b52f8bf55ed105f0f2d1c981187dc836c4a58af053360add9d9a3266f9fd3b1
+size 14657

roberta2-base-mnli-negnli/checkpoint-500/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:519f1a7aac1e26b93c5dc8fd29b1ba14a602229a9976e9a4f11ec0084c0506e1
+size 623

roberta2-base-mnli-negnli/checkpoint-500/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

roberta2-base-mnli-negnli/checkpoint-500/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

roberta2-base-mnli-negnli/checkpoint-500/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "add_prefix_space": false,
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "name_or_path": "roberta-base",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

roberta2-base-mnli-negnli/checkpoint-500/trainer_state.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.3333333333333335,
+  "global_step": 500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 3.33,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.5834,
+      "step": 500
+    }
+  ],
+  "max_steps": 750,
+  "num_train_epochs": 5,
+  "total_flos": 263113417728000.0,
+  "trial_name": null,
+  "trial_params": null
+}

roberta2-base-mnli-negnli/checkpoint-500/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d8ac10c632bedfc183e887aabf3ba8bb835486176969bfa525240f0f4f51ac7
+size 3311

roberta2-base-mnli-negnli/checkpoint-500/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

roberta2-base-mnli-negnli/config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_name_or_path": "sileod/roberta-base-mnli",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "CONTRADICTION",
+    "1": "ENTAILMENT",
+    "2": "NEUTRAL"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "CONTRADICTION": 0,
+    "ENTAILMENT": 1,
+    "NEUTRAL": 2
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.21.0.dev0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

roberta2-base-mnli-negnli/eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 5.0,
+    "eval_accuracy": 0.8399999737739563,
+    "eval_loss": 0.8397448658943176,
+    "eval_runtime": 1.7729,
+    "eval_samples": 300,
+    "eval_samples_per_second": 169.214,
+    "eval_steps_per_second": 21.434
+}

roberta2-base-mnli-negnli/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

roberta2-base-mnli-negnli/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f28c6566a80bf80b26a2e5cc10639cbdb067568ff4892835ccb87fe6371ac35b
+size 498668617

roberta2-base-mnli-negnli/runs/Jul07_23-50-30_doe/1657201850.622683/events.out.tfevents.1657201850.doe.63764.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4eefc6dd2cc4695bd0f63bffbbd0533708dcb84d82c5ca338c92e366c5d64846
+size 5365

roberta2-base-mnli-negnli/runs/Jul07_23-50-30_doe/events.out.tfevents.1657201850.doe.63764.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ee2e90b2d788565553ebd5878c2b5606cb503e2714bbcfe49a35dffcc7e5762
+size 4215

roberta2-base-mnli-negnli/runs/Jul07_23-50-30_doe/events.out.tfevents.1657201943.doe.63764.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee715a065059002451302c27b446ca8dfbc200031d44ea4ed32123de54ab7def
+size 363

roberta2-base-mnli-negnli/runs/Jul07_23-54-02_doe/1657202061.6067924/events.out.tfevents.1657202061.doe.2632.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7b96e4de1cc2f0c22feafe25fbde21e41266a99ee6ea55d71ac849a31c99124a
+size 5365

roberta2-base-mnli-negnli/runs/Jul07_23-54-02_doe/events.out.tfevents.1657202061.doe.2632.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55fb8b1e827be004241cdeeaa1afab3479f43c26f94bfd65ab9692aebcdbd76c
+size 4215

roberta2-base-mnli-negnli/runs/Jul07_23-54-02_doe/events.out.tfevents.1657202129.doe.2632.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3d26a7d40ef50f6c4521a21ff0912102037aea093d50638826be6914494d79b
+size 363

roberta2-base-mnli-negnli/runs/Jul08_00-57-12_doe/1657205852.4321375/events.out.tfevents.1657205852.doe.4547.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bdea2c00555620bc8d641c32aaea93537577589515f8368c1e48d024dc9101b8
+size 5365

roberta2-base-mnli-negnli/runs/Jul08_00-57-12_doe/events.out.tfevents.1657205852.doe.4547.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:129c745c8128bc9abc69b7d043df76197bdf3f5230e3ef1a61dd519a255acaf4
+size 4445

roberta2-base-mnli-negnli/runs/Jul08_00-57-12_doe/events.out.tfevents.1657206008.doe.4547.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41814716da87e078ad112b437f2d16a1e4f205ed0123fc6710265a37ce042d37
+size 363

roberta2-base-mnli-negnli/runs/Jul08_01-08-17_doe/1657206517.7561595/events.out.tfevents.1657206517.doe.16385.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f986d4bb16a3aeddb300cf944f37db69f563e84c7e08b83238d71c7ae6a31271
+size 5365

roberta2-base-mnli-negnli/runs/Jul08_01-08-17_doe/events.out.tfevents.1657206517.doe.16385.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77ebd2278c753d388b8c5ffcdaf0a98fbff43cd241ef963546610c42ddd22e45
+size 4215

roberta2-base-mnli-negnli/runs/Jul08_01-08-17_doe/events.out.tfevents.1657206612.doe.16385.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b1a60159001ce313ad8ecc1a27c52e24a82f18fb32cad5e979b12d3d1155600
+size 363

roberta2-base-mnli-negnli/runs/Jul08_01-12-22_doe/1657206761.9519951/events.out.tfevents.1657206761.doe.20937.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f73b0655c7c22c157f08feb5fd5b079430c6974f976c602e863d2acc35961f01
+size 5365

roberta2-base-mnli-negnli/runs/Jul08_01-12-22_doe/events.out.tfevents.1657206761.doe.20937.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9750c7e2b2837d2176aba17d8c5f47cf47dc06e73b72a5162d9e6e0208c3c3e7
+size 4249

roberta2-base-mnli-negnli/runs/Jul08_01-12-22_doe/events.out.tfevents.1657206857.doe.20937.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c970e9141055c4f2a314c219a9a8403acd07c5e6d2bc723518a3f1bdfffa343
+size 363

roberta2-base-mnli-negnli/runs/Jul08_01-15-21_doe/1657206941.3139427/events.out.tfevents.1657206941.doe.25921.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2e4bc0171d172a263aecf4a88587c394f2e4b13abcd4724fcf2cae98bd8dc1b7
+size 5365

roberta2-base-mnli-negnli/runs/Jul08_01-15-21_doe/events.out.tfevents.1657206941.doe.25921.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2343c15b57f947fe9ddbd3ea1db5f66a111013901d5cacadeddb72c3b82ced6
+size 4406

roberta2-base-mnli-negnli/runs/Jul08_01-15-21_doe/events.out.tfevents.1657207104.doe.25921.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:98b4f4109f27eb713949884555036a225f29554c68fd6690d580ca4f7bc19fce
+size 363

roberta2-base-mnli-negnli/runs/Jul08_01-22-31_doe/1657207371.2546418/events.out.tfevents.1657207371.doe.33741.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1285fb859702ce1e7ad8ab9c725d482ebd2ac1c769c61fbfb3aa54a17efe84b9
+size 5365

roberta2-base-mnli-negnli/runs/Jul08_01-22-31_doe/events.out.tfevents.1657207371.doe.33741.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c06ceed443ee396d79106660494c31cdfe84bd675323f59efe192bd3e2915ee5
+size 4445

roberta2-base-mnli-negnli/runs/Jul08_01-22-31_doe/events.out.tfevents.1657207536.doe.33741.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:328a9c6f9adab7a18c86e781f03655c14449695e2135aeb02b3af07aaca7418e
+size 363

roberta2-base-mnli-negnli/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

roberta2-base-mnli-negnli/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

roberta2-base-mnli-negnli/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "add_prefix_space": false,
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "name_or_path": "roberta-base",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

roberta2-base-mnli-negnli/train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.444431884765625,
+    "train_runtime": 158.4081,
+    "train_samples": 1200,
+    "train_samples_per_second": 37.877,
+    "train_steps_per_second": 4.735
+}

roberta2-base-mnli-negnli/trainer_state.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 750,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 3.33,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.5834,
+      "step": 500
+    },
+    {
+      "epoch": 5.0,
+      "step": 750,
+      "total_flos": 394670126592000.0,
+      "train_loss": 0.444431884765625,
+      "train_runtime": 158.4081,
+      "train_samples_per_second": 37.877,
+      "train_steps_per_second": 4.735
+    }
+  ],
+  "max_steps": 750,
+  "num_train_epochs": 5,
+  "total_flos": 394670126592000.0,
+  "trial_name": null,
+  "trial_params": null
+}