alexkueck commited on
Commit
c2b81d1
·
verified ·
1 Parent(s): 8f16105

Update utils.py

Browse files
Files changed (1) hide show
  1. utils.py +18 -1
utils.py CHANGED
@@ -155,6 +155,7 @@ EMBEDDING_MODELL = "sentence-transformers/all-mpnet-base-v2"
155
  HF_MODELL ="EleutherAI/gpt-neo-2.7B"
156
  modell_rag = GPTNeoForCausalLM.from_pretrained(HF_MODELL)
157
  tokenizer_rag = GPT2Tokenizer.from_pretrained(HF_MODELL)
 
158
 
159
  """
160
  HF_MODELL = "microsoft/Phi-3-mini-4k-instruct"
@@ -391,7 +392,7 @@ def llm_chain2(prompt, context):
391
  attention_mask = (inputs != tokenizer_rag.pad_token_id).long()
392
  #Generiere die Antwort
393
  outputs = modell_rag.generate(
394
- inputs,
395
  attention_mask=attention_mask,
396
  max_new_tokens=1024,
397
  do_sample=True,
@@ -589,6 +590,22 @@ def list_pdfs():
589
  return []
590
  return [f for f in os.listdir(SAVE_DIR) if f.endswith('.pdf')]
591
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
592
 
593
  #################################################
594
  #Klasse mit zuständen - z.B. für interrupt wenn Stop gedrückt...
 
155
  HF_MODELL ="EleutherAI/gpt-neo-2.7B"
156
  modell_rag = GPTNeoForCausalLM.from_pretrained(HF_MODELL)
157
  tokenizer_rag = GPT2Tokenizer.from_pretrained(HF_MODELL)
158
+ tokenizer_rag.pad_token = tokenizer_rag.eos_token
159
 
160
  """
161
  HF_MODELL = "microsoft/Phi-3-mini-4k-instruct"
 
392
  attention_mask = (inputs != tokenizer_rag.pad_token_id).long()
393
  #Generiere die Antwort
394
  outputs = modell_rag.generate(
395
+ inputs.input_ids,
396
  attention_mask=attention_mask,
397
  max_new_tokens=1024,
398
  do_sample=True,
 
590
  return []
591
  return [f for f in os.listdir(SAVE_DIR) if f.endswith('.pdf')]
592
 
593
+ ##########################################
594
+ #Extension des hochgeladenen Files bestimmen
595
+ def analyze_file(file):
596
+ file_extension = file.name.split('.')[-1] # Holen Sie sich die Dateiendung
597
+ return file_extension
598
+
599
+ ########################################
600
+ #Aus dem File-Pfad nur den Namen herausholen
601
+ def get_filename(file_pfad):
602
+ parts = file_pfad.rsplit('/', 1) # Den String nach dem letzten '/' aufteilen
603
+ if len(parts) == 2:
604
+ result = parts[1] # Der Teil nach dem letzten '/' ist in parts[1]
605
+ else:
606
+ result = "Ein Fehler im Filenamen ist aufgetreten..."
607
+ return result
608
+
609
 
610
  #################################################
611
  #Klasse mit zuständen - z.B. für interrupt wenn Stop gedrückt...