Spaces:

robinhad
/

UAlpaca

Sleeping

robinhad commited on Jul 9, 2024

Commit

e27a3d0

verified ·

1 Parent(s): 4d8faf1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,10 +23,9 @@ quant_config = BitsAndBytesConfig(
 tokenizer = LlamaTokenizer.from_pretrained(model_name)
 model = LlamaForCausalLM.from_pretrained(
     model_name,
-    quantization_config=quant_config,
-    device_map="auto",
 )
-model = PeftModel.from_pretrained(model, lora_name)
 # will be used with normal template

 tokenizer = LlamaTokenizer.from_pretrained(model_name)
 model = LlamaForCausalLM.from_pretrained(
     model_name,
+    quantization_config=quant_config
 )
+model = PeftModel.from_pretrained(model, lora_name).to("cuda")
 # will be used with normal template