JaCzat / app.py
jaczad's picture
Update app.py
6f4b8b6 verified
raw
history blame
1.97 kB
import pickle
import numpy as np
from sentence_transformers import SentenceTransformer
from scipy.spatial.distance import cosine
import gradio as gr
from openai import OpenAI
client=OpenAI()
model = SentenceTransformer("quanthome/paraphrase-multilingual-MiniLM-L12-v2")
# Funkcja do znajdowania najbardziej podobnych tekstów
def find_similar(text, vector_map, model, top_n=5):
query_embedding = model.encode([text])[0]
similarities = []
for key, embedding in vector_map.items():
similarity = 1 - cosine(query_embedding, embedding) # 1 - cosine distance gives similarity
similarities.append((key, similarity))
# Sortowanie po podobieństwie malejąco
similarities = sorted(similarities, key=lambda x: x[1], reverse=True)
return similarities[:top_n]
# Odczytanie słownika z pliku
with open('vector_map.pkl', 'rb') as f:
vector_map = pickle.load(f)
# Przykładowe wyszukiwanie
def szukaj(query_text, history):
top_n_results = find_similar(query_text, vector_map, model, top_n=2)
context=''
for text, similarity in top_n_results:
context=context+text
jaczat=client.chat.completions.create(
model='gpt-4o-mini',
temperature=0.0,
max_tokens=1024,
messages=[
{'role': 'system',
'content': 'Nazywasz się Jacek Zadrożny i jesteś ekspertem cyfrowej dostępności. Odpowiadasz zwięźle na pytania. Przed wysłaniem odpowiedzi sprawdzasz jej poprawność.'+context},
{'role': 'user',
'content': query_text}
]
)
return jaczat.choices[0].message.content
demo=gr.ChatInterface(
fn=szukaj,
theme=gr.themes.Monochrome(),
autofocus=True,
title='Jacek',
description='Tu możesz zapytać o wszystko dotyczące cyfrowej dostępności, w tym przede wszystkim WCAG.',
submit_btn='Zapytaj',
clear_btn=None,
retry_btn=None,
undo_btn=None,
show_progress='minimal',
).launch()