kazuHF
/

llm-jp-3-13b-it2_lora

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

kazuHF commited on 24 days ago

Commit

0855753

·

verified ·

1 Parent(s): 73f1952

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -24,7 +24,7 @@ This llama model was trained 2x faster with [Unsloth](https://github.com/unsloth
 # ■ kazuHF/llm-jp-3-13b-it2_loraの概要
-1. モデル概要
 - ベースモデル: llm-jp/llm-jp-3-13b (https://huggingface.co/llm-jp/llm-jp-3-13b)
 - 用途: 日本語によるQ&A形式の文章生成
 - アーキテクチャ: FrameworkやLibraryとしてはPyTorch、Transformers、Unsloth、trl、LoRA、xformers、Flash Attentionなどを利用。UnslothによりFine TuningやInferenceを高速化し、メモリも削減した。llm-jp/llm-jp-3-13bを4bitで量子化するLoRAでロードし、SFTで事後学習を行った。

 # ■ kazuHF/llm-jp-3-13b-it2_loraの概要
+1. モデルの概要
 - ベースモデル: llm-jp/llm-jp-3-13b (https://huggingface.co/llm-jp/llm-jp-3-13b)
 - 用途: 日本語によるQ&A形式の文章生成
 - アーキテクチャ: FrameworkやLibraryとしてはPyTorch、Transformers、Unsloth、trl、LoRA、xformers、Flash Attentionなどを利用。UnslothによりFine TuningやInferenceを高速化し、メモリも削減した。llm-jp/llm-jp-3-13bを4bitで量子化するLoRAでロードし、SFTで事後学習を行った。