Spaces:

alfredplpl
/

Sarashina-7B-Instruct

Sleeping

alfredplpl commited on Jun 11, 2024

Commit

07ef311

verified ·

1 Parent(s): a20a7a4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -69,12 +69,12 @@ def chat_llama3_8b(message: str,
         conversation.extend([{"role": "user", "content": user}, {"role": "assistant", "content": assistant}])
     conversation.append({"role": "user", "content": message})
-    input_ids = tokenizer.apply_chat_template(conversation, return_tensors="pt").to(model.device)
     streamer = TextIteratorStreamer(tokenizer, timeout=10.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(
-        input_ids= input_ids,
         streamer=streamer,
         max_new_tokens=max_new_tokens,
         do_sample=True,

         conversation.extend([{"role": "user", "content": user}, {"role": "assistant", "content": assistant}])
     conversation.append({"role": "user", "content": message})
+    input_ids = tokenizer.apply_chat_template(conversation, return_tensors="pt")
     streamer = TextIteratorStreamer(tokenizer, timeout=10.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(
+        input_ids= input_ids.to(model.device),
         streamer=streamer,
         max_new_tokens=max_new_tokens,
         do_sample=True,