tirthadagr8
/

Japanese_to_english_gpt2CasualLM_GemmaTokenizer

Model card Files Files and versions Community

tirthadagr8 commited on Nov 16, 2024

Commit

97ecea1

·

verified ·

1 Parent(s): 3533493

Update README.md

Files changed (1) hide show

README.md +14 -2

README.md CHANGED Viewed

@@ -1,8 +1,20 @@
 ---
-license: gemma
 ---
 Made using Gpt-Small from scratch for learning purpose.
 Tokenizer used is from Gemma 2-2B-JPN-IT which is trained on japanese dataset from JESC.
 ```bibtex
 @ARTICLE{pryzant_jesc_2018,
    author = {{Pryzant}, R. and {Chung}, Y. and {Jurafsky}, D. and {Britz}, D.},
@@ -10,4 +22,4 @@ Tokenizer used is from Gemma 2-2B-JPN-IT which is trained on japanese dataset fr
   journal = {Language Resources and Evaluation Conference (LREC)},
  keywords = {Computer Science - Computation and Language},
      year = 2018
-}

 ---
+license: mit
+datasets:
+- Hoshikuzu/JESC
+language:
+- en
+- ja
+base_model:
+- openai-community/gpt2
+- google/gemma-2-2b-jpn-it
 ---
 Made using Gpt-Small from scratch for learning purpose.
 Tokenizer used is from Gemma 2-2B-JPN-IT which is trained on japanese dataset from JESC.
+Model usage:-
 ```bibtex
 @ARTICLE{pryzant_jesc_2018,
    author = {{Pryzant}, R. and {Chung}, Y. and {Jurafsky}, D. and {Britz}, D.},
   journal = {Language Resources and Evaluation Conference (LREC)},
  keywords = {Computer Science - Computation and Language},
      year = 2018
+}