model improved

Files changed (5) hide show

README.md CHANGED Viewed

@@ -6,7 +6,7 @@ tags:
 - "pos"
 - "dependency-parsing"
 - "modernbert"
-base_model: KoichiYasuoka/modernbert-base-japanese-aozora
 datasets:
 - "universal_dependencies"
 license: "apache-2.0"
@@ -19,7 +19,7 @@ widget:
 ## Model Description
-This is a ModernBERT model pretrained for POS-tagging and dependency-parsing (using `goeswith` for subwords), derived from [modernbert-base-japanese-aozora](https://huggingface.co/KoichiYasuoka/modernbert-base-japanese-aozora) and [UD_Japanese-GSDLUW](https://github.com/UniversalDependencies/UD_Japanese-GSDLUW).
 ## How to Use

 - "pos"
 - "dependency-parsing"
 - "modernbert"
+base_model: KoichiYasuoka/modernbert-base-japanese-aozora-upos
 datasets:
 - "universal_dependencies"
 license: "apache-2.0"
 ## Model Description
+This is a ModernBERT model pretrained for POS-tagging and dependency-parsing (using `goeswith` for subwords), derived from [modernbert-base-japanese-aozora-upos](https://huggingface.co/KoichiYasuoka/modernbert-base-japanese-aozora-upos) and [UD_Japanese-GSDLUW](https://github.com/UniversalDependencies/UD_Japanese-GSDLUW).
 ## How to Use

maker.py CHANGED Viewed

@@ -1,5 +1,5 @@
 #! /usr/bin/python3
-src="KoichiYasuoka/modernbert-base-japanese-aozora"
 tgt="KoichiYasuoka/modernbert-base-japanese-aozora-ud-goeswith"
 url="https://github.com/UniversalDependencies/UD_Japanese-GSDLUW"
 import os

 #! /usr/bin/python3
+src="KoichiYasuoka/modernbert-base-japanese-aozora-upos"
 tgt="KoichiYasuoka/modernbert-base-japanese-aozora-ud-goeswith"
 url="https://github.com/UniversalDependencies/UD_Japanese-GSDLUW"
 import os

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:59986e96524b43b5cf379da759af0304a39d83e53a634d78efed2355ea3b6f96
 size 643697266

 version https://git-lfs.github.com/spec/v1
+oid sha256:24f7cf26d7d271e1e48ce615240d1c2edfea7a0d4efb9bedee6f02e00f6d63ae
 size 643697266

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -49,7 +49,10 @@
   "extra_special_tokens": {},
   "keep_accents": true,
   "mask_token": "[MASK]",
-  "model_input_names": ["input_ids", "attention_mask"],
   "model_max_length": 1000000000000000019884624838656,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",

   "extra_special_tokens": {},
   "keep_accents": true,
   "mask_token": "[MASK]",
+  "model_input_names": [
+    "input_ids",
+    "attention_mask"
+  ],
   "model_max_length": 1000000000000000019884624838656,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",