Spaces:

igoracmorais
/

gerador_QA

Sleeping

igoracmorais commited on Aug 6, 2024

Commit

40f834a

verified ·

1 Parent(s): 9247897

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,12 +16,14 @@ def generate_qa_pairs(text):
     tokenizer = AutoTokenizer.from_pretrained("valhalla/t5-base-qg-hl")
     model = AutoModelForSeq2SeqLM.from_pretrained("valhalla/t5-base-qg-hl")
-    input_text = "highlight: " + text
-    input_ids = tokenizer.encode(input_text, return_tensors="pt")
-    outputs = model.generate(input_ids)
-    questions = tokenizer.decode(outputs[0])
-    return questions
 # Função para converter os pares de QA no formato SQuAD
 def convert_to_squad_format(qas, context):
@@ -33,8 +35,8 @@ def convert_to_squad_format(qas, context):
             "question": qa['question'],
             "id": str(i),
             "answers": {
-                "answer_start": [qa['answer']['start']],
-                "text": [qa['answer']['text']]
             }
         }
         squad_data.append(entry)

     tokenizer = AutoTokenizer.from_pretrained("valhalla/t5-base-qg-hl")
     model = AutoModelForSeq2SeqLM.from_pretrained("valhalla/t5-base-qg-hl")
+    inputs = tokenizer.encode("generate questions: " + text, return_tensors="pt", max_length=512, truncation=True)
+    outputs = model.generate(inputs, max_length=512, num_beams=4, early_stopping=True)
+    questions = [tokenizer.decode(output, skip_special_tokens=True) for output in outputs]
+    # O modelo retorna apenas as perguntas, então precisamos criar respostas fictícias para o exemplo
+    qas = [{"question": question, "answer": "answer", "answer_start": 0} for question in questions]
+    return qas
 # Função para converter os pares de QA no formato SQuAD
 def convert_to_squad_format(qas, context):
             "question": qa['question'],
             "id": str(i),
             "answers": {
+                "answer_start": [qa['answer_start']],
+                "text": [qa['answer']]
             }
         }
         squad_data.append(entry)