Model-Test-2

Sleeping

gmonsoon commited on Nov 30, 2024

Commit

f39147d

verified ·

1 Parent(s): 9891db7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,17 +17,14 @@ MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "4096"))
 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
-model_id = "Skywork/Skywork-o1-Open-PRM-Qwen-2.5-7B"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     device_map="auto",
     torch_dtype=torch.bfloat16,
 )
-terminators = [
-    tokenizer.eos_token_id,
-    tokenizer.convert_tokens_to_ids("<|eot_id|>")
-]
 model.config.sliding_window = 4096
 model.eval()
@@ -61,7 +58,6 @@ def generate(
         temperature=temperature,
         num_beams=1,
         repetition_penalty=repetition_penalty,
-        eos_token_id=terminators,
     )
     t = Thread(target=model.generate, kwargs=generate_kwargs)
     t.start()

 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
+model_id = "gmonsoon/SeaMarco-o1-7B-v1"
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     device_map="auto",
     torch_dtype=torch.bfloat16,
 )
 model.config.sliding_window = 4096
 model.eval()
         temperature=temperature,
         num_beams=1,
         repetition_penalty=repetition_penalty,
     )
     t = Thread(target=model.generate, kwargs=generate_kwargs)
     t.start()