takeofuture
/

llm-jp-3-13b-finetune-22_lora

Text Generation

Model card Files Files and versions Community

takeofuture commited on 26 days ago

Commit

3875cf0

·

verified ·

1 Parent(s): f46baf7

Update README.md

Files changed (1) hide show

README.md +36 -1

README.md CHANGED Viewed

@@ -37,7 +37,42 @@
   snapshot_download(repo_id=model_name, local_dir=local_dir, local_dir_use_symlinks=False)
   print(f"Model downloaded to: {local_dir}")
   ```
 ## **GOOGLE　COLABORATORYでのelyza_100_tvでの推論方法**
 以下のノートを参照してください
 - [Model_Inference_Template_unsloth_20241127.ipynb](./Model_Inference_Template_unsloth_20241127.ipynb)

   snapshot_download(repo_id=model_name, local_dir=local_dir, local_dir_use_symlinks=False)
   print(f"Model downloaded to: {local_dir}")
   ```
+- 推論
+  ```
+  from unsloth import FastLanguageModel
+  from peft import PeftModel
+  import torch
+  import json
+  from tqdm import tqdm
+  import re
+  #ベースとなるモデルと学習したLoRAのアダプタ（Hugging FaceのIDを指定）。
+  #model_id = "llm-jp/llm-jp-3-13 #HUGGINGFACEをよりダウンロードするときはこちらを使いください
+  local_model_dir = "./models/llm-jp/llm-jp-3-13b"  # 事前にダウンロードしたモデルのローカルディレクトリ
+  adapter_id = "takeofuture/llm-jp-3-13b-finetune-22_lora"
+  HF_TOKEN = "HUGGINGFACEのTOKENを入れてください"
+  #unslothのFastLanguageModelで元のモデルをロード。
+  dtype = None # Noneにしておけば自動で設定
+  load_in_4bit = True # 今回は13Bモデルを扱うためTrue
+  model, tokenizer = FastLanguageModel.from_pretrained(
+    #model_name=model_id,
+    model_name=local_model_dir,
+    dtype=dtype,
+    load_in_4bit=load_in_4bit,
+    trust_remote_code=True,
+  )
+  model = PeftModel.from_pretrained(model, adapter_id, token = HF_TOKEN)
+  #推論モードに切り替え
+  FastLanguageModel.for_inference(model)
+  prompt = f"""### 指示\n名古屋の有名なグルメは何ですか？\n### 回答\n"""
+  inputs = tokenizer([prompt], return_tensors = "pt").to(model.device)
+  #不要な `token_type_ids` を削除
+  if "token_type_ids" in inputs:
+    del inputs["token_type_ids"]
+  outputs = model.generate(**inputs, max_new_tokens = 512, use_cache = True, do_sample=False, repetition_penalty=1.2)
+  prediction = tokenizer.decode(outputs[0], skip_special_tokens=True).split('\n### 回答')[-1]
+  print(prediction)
+  ```
 ## **GOOGLE　COLABORATORYでのelyza_100_tvでの推論方法**
 以下のノートを参照してください
 - [Model_Inference_Template_unsloth_20241127.ipynb](./Model_Inference_Template_unsloth_20241127.ipynb)