Update utils.py
Browse files
utils.py
CHANGED
@@ -155,6 +155,7 @@ EMBEDDING_MODELL = "sentence-transformers/all-mpnet-base-v2"
|
|
155 |
HF_MODELL ="EleutherAI/gpt-neo-2.7B"
|
156 |
modell_rag = GPTNeoForCausalLM.from_pretrained(HF_MODELL)
|
157 |
tokenizer_rag = GPT2Tokenizer.from_pretrained(HF_MODELL)
|
|
|
158 |
|
159 |
"""
|
160 |
HF_MODELL = "microsoft/Phi-3-mini-4k-instruct"
|
@@ -391,7 +392,7 @@ def llm_chain2(prompt, context):
|
|
391 |
attention_mask = (inputs != tokenizer_rag.pad_token_id).long()
|
392 |
#Generiere die Antwort
|
393 |
outputs = modell_rag.generate(
|
394 |
-
inputs,
|
395 |
attention_mask=attention_mask,
|
396 |
max_new_tokens=1024,
|
397 |
do_sample=True,
|
@@ -589,6 +590,22 @@ def list_pdfs():
|
|
589 |
return []
|
590 |
return [f for f in os.listdir(SAVE_DIR) if f.endswith('.pdf')]
|
591 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
592 |
|
593 |
#################################################
|
594 |
#Klasse mit zuständen - z.B. für interrupt wenn Stop gedrückt...
|
|
|
155 |
HF_MODELL ="EleutherAI/gpt-neo-2.7B"
|
156 |
modell_rag = GPTNeoForCausalLM.from_pretrained(HF_MODELL)
|
157 |
tokenizer_rag = GPT2Tokenizer.from_pretrained(HF_MODELL)
|
158 |
+
tokenizer_rag.pad_token = tokenizer_rag.eos_token
|
159 |
|
160 |
"""
|
161 |
HF_MODELL = "microsoft/Phi-3-mini-4k-instruct"
|
|
|
392 |
attention_mask = (inputs != tokenizer_rag.pad_token_id).long()
|
393 |
#Generiere die Antwort
|
394 |
outputs = modell_rag.generate(
|
395 |
+
inputs.input_ids,
|
396 |
attention_mask=attention_mask,
|
397 |
max_new_tokens=1024,
|
398 |
do_sample=True,
|
|
|
590 |
return []
|
591 |
return [f for f in os.listdir(SAVE_DIR) if f.endswith('.pdf')]
|
592 |
|
593 |
+
##########################################
|
594 |
+
#Extension des hochgeladenen Files bestimmen
|
595 |
+
def analyze_file(file):
|
596 |
+
file_extension = file.name.split('.')[-1] # Holen Sie sich die Dateiendung
|
597 |
+
return file_extension
|
598 |
+
|
599 |
+
########################################
|
600 |
+
#Aus dem File-Pfad nur den Namen herausholen
|
601 |
+
def get_filename(file_pfad):
|
602 |
+
parts = file_pfad.rsplit('/', 1) # Den String nach dem letzten '/' aufteilen
|
603 |
+
if len(parts) == 2:
|
604 |
+
result = parts[1] # Der Teil nach dem letzten '/' ist in parts[1]
|
605 |
+
else:
|
606 |
+
result = "Ein Fehler im Filenamen ist aufgetreten..."
|
607 |
+
return result
|
608 |
+
|
609 |
|
610 |
#################################################
|
611 |
#Klasse mit zuständen - z.B. für interrupt wenn Stop gedrückt...
|