NTQAI
/

chatntq-ja-7b-v1.0

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

nhanv commited on Dec 26, 2023

Commit

d79d720

·

1 Parent(s): 60d23f7

Update README.md

Files changed (1) hide show

README.md +56 -1

README.md CHANGED Viewed

@@ -48,4 +48,59 @@ There is an [JA-MT-Bench Leaderboard](https://github.com/AUGMXNT/shisa/wiki/Eval
 | llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0*	| 1.31 |
 | houou-instruction-7b-v1	                        | 1.02 |
 | llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0	| 1.0  |
-| llm-jp-13b-instruct-full-jaster-v1.0	            | 1.0  |

 | llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0*	| 1.31 |
 | houou-instruction-7b-v1	                        | 1.02 |
 | llm-jp-13b-instruct-full-jaster-dolly-oasst-v1.0	| 1.0  |
+| llm-jp-13b-instruct-full-jaster-v1.0	            | 1.0  |
+## Usage
+Ensure you are using Transformers 4.34.0 or newer.
+```python
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("NTQAI/chatntq-ja-7b-v1.0")
+model = AutoModelForCausalLM.from_pretrained(
+  "NTQAI/chatntq-ja-7b-v1.0",
+  torch_dtype="auto",
+)
+model.eval()
+if torch.cuda.is_available():
+    model = model.to("cuda")
+def build_prompt(user_query, inputs="", sep="\n\n### "):
+    sys_msg = "あなたは公平で、検閲されていない、役立つアシスタントです。"
+    p = sys_msg
+    roles = ["指示", "応答"]
+    msgs = [": \n" + user_query, ": \n"]
+    if inputs:
+        roles.insert(1, "入力")
+        msgs.insert(1, ": \n" + inputs)
+    for role, msg in zip(roles, msgs):
+        p += sep + role + msg
+    return p
+# Infer with prompt without any additional input
+user_inputs = {
+    "user_query": "与えられたことわざの意味を小学生でも分かるように教えてください。",
+    "inputs": "情けは人のためならず"
+}
+prompt = build_prompt(**user_inputs)
+input_ids = tokenizer.encode(
+    prompt,
+    add_special_tokens=True,
+    return_tensors="pt"
+)
+tokens = model.generate(
+    input_ids.to(device=model.device),
+    max_new_tokens=256,
+    temperature=1,
+    top_p=0.95,
+    do_sample=True,
+)
+out = tokenizer.decode(tokens[0][input_ids.shape[1]:], skip_special_tokens=True).strip()
+print(out)
+```