Google's mt5-base fine-tuned in Japanese to solve error detection and correction task.

日本語誤り訂正

  • "吾輩をは猫である。名前えはまだない。"→"吾輩は猫である。名前はまだない。"
  • "-small" has been trained on 20,000 text pairs only.
  • dataset: link *used only first 20,000 text pairs.
  • prefix: "correction: " (notice: single task trained.)
  • text-to-textのお気持ち体験版ぐらいの感覚でどうぞ.

参考

  • "東北大学でMASKが研究をしています。"→"東北大学でMASKの研究をしています。" ジム・キャリーを主語とした唯一のガ格が消され、ジム・キャリーは研究対象となった。易読化のために用いられる主語と動詞を近づける記法は誤り扱い?
  • "東北大学でマスクが研究をしています。"→"東北大学でマスクの研究をしています。"
  • "東北大学でイーロン・マスクが研究をしています。"→"東北大学でイーロン・マスクが研究をしています。"
  • "東北大学で「イーロン・マスク」が研究をしています。"→"東北大学で「イーロン・マスク」の研究をしています。" 単語の意味も考慮されている?
  • "東北大学でイマスクが研究をしています。"→"東北大学でイマスクの研究をしています。"
  • "東北大学でクが研究をしています。"→"東北大学でコンピューターが研究をしています。" それはちょっと待って。

参考 extra_idを用い探索 <>は半角に変更してください

  • "東北大学で <extra_id_0> の研究をしています。"→"東北大学で化学の研究をしています。"
  • "東北大学で <extra_id_0> が研究をしています。"→"東北大学で工学が研究をしています。" 工学さん。
  • "吾輩は <extra_id_0> である。"→"吾輩は吾輩である。"
  • "答えは猫です。吾輩は <extra_id_0> である。"→"答えは猫です。吾輩は猫である。"
  • "答えは猫です。吾輩の <extra_id_0> である。"→"答えは猫です。吾輩の心は猫である。"
  • "私は猫です。私は <extra_id_0>"→"私は猫です。私は猫です。"
  • "私は猫です。N/A <extra_id_0>"→"猫です。"
  • "あなたは女性で猫です。彼は犬です。彼女は <extra_id_0>"→"あなたは女性で猫です。彼は犬です。彼女は猫です。"
  • "あなたは女性で猫です。彼は犬です。彼は <extra_id_0>"→"あなたは女性で猫です。彼は犬です。"
  • "あなたは女性で猫です。彼は犬です。彼は男性で <extra_id_0>"→"あなたは女性で猫です。彼は犬です。彼は男性で猫です。"
  • "あなたは女性で猫です。彼は犬です。ライオンは <extra_id_0>"→"あなたは女性で猫です。彼は犬です。ライオンは猫です。"
  • "あなたがは女性で猫です。彼はが犬です。ライオンが <extra_id_0>"→"あなたが女性で猫です。彼は犬です。ライオンが犬です。"
  • "Aは11、Bは9。Aは <extra_id_0> 。Bは <extra_id_1> 。"→"Aは11、Bは9。Aは11。Bは9。"
  • "彼の名前はallenです。彼のnameは <extra_id_0>"→"彼の名前はallenです。彼の名前は英語です。"
  • "translate japanease to english: 赤い花. => red flower. 青い花. => "→"赤い花. => red flower. 青い花. => blue flower" タスク比依存翻訳可能性の片鱗.japaneseをjapaneaseと間違えたことは秘密だ・・・と言うか間違えても動くのか

Prompting参考

Chain of Thought Prompting Elicits Reasoning in Large Language Models https://arxiv.org/abs/2201.11903

check in progress

Licenese

  • The MIT license
Downloads last month
18
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.