demimomi
/

llm-jp-3-13b-finetune-ex

@@ -38,7 +38,7 @@ language:
 東京大学 松尾・岩澤研究室　大規模言語モデル2024 最終課題
-（作成日：2024年11月24日　作成者：出水 利樹  #SoftBank  #MONET Technologies）
 https://weblab.t.u-tokyo.ac.jp/lecture/course-list/large-language-model/
@@ -46,13 +46,14 @@ https://weblab.t.u-tokyo.ac.jp/lecture/course-list/large-language-model/
 以下は、elyza-tasks-100-TV_0.jsonlの回答用モデルコードです！
 # -*- coding: utf-8 -*-
-"""llm-jp-3-13b-finetune2.ipynb
 Automatically generated by Colab.
 Original file is located at
     https://colab.research.google.com/drive/1TLF_HtVz6ng9ZAWe7lHy59kiHBg3_3y0
-"""
 !pip uninstall unsloth -y
 !pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
@@ -106,7 +107,7 @@ model = FastLanguageModel.get_peft_model(
     loftq_config = None,
     max_seq_length = max_seq_length,)
-HF_TOKEN = "*****" #@param {type:"string"} #My token is secret!
 from datasets import load_dataset
@@ -123,9 +124,9 @@ prompt = """### 指示
-"""
 formatting_prompts_func: 各データをプロンプトに合わせた形式に合わせる
-"""
 EOS_TOKEN = tokenizer.eos_token # トークナイザーのEOSトークン（文末トークン）
 def formatting_prompts_func(examples):
     input = examples["text"] # 入力データ
@@ -152,7 +153,7 @@ output.disable_custom_widget_manager()
 print(dataset["test"]["formatted_text"][3])
-"""
 training_arguments: 学習の設定
   - output_dir:
@@ -211,7 +212,7 @@ training_arguments: 学習の設定
   - report_to:
       - ログの送信先 ("wandb"/"tensorboard"など)
-"""
 from trl import SFTTrainer
 from transformers import TrainingArguments
 from unsloth import is_bfloat16_supported

 東京大学 松尾・岩澤研究室　大規模言語モデル2024 最終課題
+（作成日：2024年11月30日　作成者：出水 利樹  #SoftBank  #MONET Technologies）
 https://weblab.t.u-tokyo.ac.jp/lecture/course-list/large-language-model/
 以下は、elyza-tasks-100-TV_0.jsonlの回答用モデルコードです！
 # -*- coding: utf-8 -*-
+```
+llm-jp-3-13b-finetune2.ipynb
 Automatically generated by Colab.
 Original file is located at
     https://colab.research.google.com/drive/1TLF_HtVz6ng9ZAWe7lHy59kiHBg3_3y0
+```
 !pip uninstall unsloth -y
 !pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
     loftq_config = None,
     max_seq_length = max_seq_length,)
+HF_TOKEN = "*****" #@param {type:"string"} #My token is secret! by demimomi
 from datasets import load_dataset
+```
 formatting_prompts_func: 各データをプロンプトに合わせた形式に合わせる
+```
 EOS_TOKEN = tokenizer.eos_token # トークナイザーのEOSトークン（文末トークン）
 def formatting_prompts_func(examples):
     input = examples["text"] # 入力データ
 print(dataset["test"]["formatted_text"][3])
+```
 training_arguments: 学習の設定
   - output_dir:
   - report_to:
       - ログの送信先 ("wandb"/"tensorboard"など)
+```
 from trl import SFTTrainer
 from transformers import TrainingArguments
 from unsloth import is_bfloat16_supported