demimomi
/

llm-jp-3-13b-finetune-ex

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

demimomi commited on Nov 30, 2024

Commit

7d18a09

·

verified ·

1 Parent(s): 76ffd3a

Update README.md

Files changed (1) hide show

README.md +7 -4

README.md CHANGED Viewed

@@ -42,10 +42,13 @@ language:
 https://weblab.t.u-tokyo.ac.jp/lecture/course-list/large-language-model/
-2024年11月30日時点で「第7位」記念スクショ！
-SampleCodeベース。おススメ設定を幾つか実施しただけ。。((((;ﾟДﾟ))))
-![image/png](https://cdn-uploads.huggingface.co/production/uploads/66d5258f3c8270397e0328b4/tVGia9H3cwWQRIkW8Gx9V.png)
 # Sample Use
 以下は、elyza-tasks-100-TV_0.jsonlの回答用モデルコードです！
@@ -85,7 +88,7 @@ pip install torch torchvision torchaudio --index-url https://download.pytorch.or
 from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 from unsloth import FastLanguageModel
 import torch
-max_seq_length = 888 # unslothではRoPEをサポートしているのでコンテキスト長は自由に設定可能。2回目Tryは少し大きめ設定
 dtype = None # Noneにしておけば自動で設定
 load_in_4bit = True # 今回は8Bクラスのモデルを扱うためTrue

 https://weblab.t.u-tokyo.ac.jp/lecture/course-list/large-language-model/
+2024年11月30日時点で驚きの「第〇位」記念スクショはコンペ終了後に公開。。
+SampleCodeベース。
+おススメ設定を幾つか実施しただけ。。((((;ﾟДﾟ))))
+コンテキスト長の設定がドンピシャだったのか（感）？？
 # Sample Use
 以下は、elyza-tasks-100-TV_0.jsonlの回答用モデルコードです！
 from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 from unsloth import FastLanguageModel
 import torch
+max_seq_length = ？？？ # unslothではRoPEをサポートしているのでコンテキスト長は自由に設定可能。2回目Tryは少し大きめ設定。いったん非公開に
 dtype = None # Noneにしておけば自動で設定
 load_in_4bit = True # 今回は8Bクラスのモデルを扱うためTrue