LIRAGTBackup

Runtime error

App Files Files Community

alexkueck commited on Feb 9, 2024

Commit

a3ed49b

verified ·

1 Parent(s): b222373

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -2

app.py CHANGED Viewed

@@ -26,7 +26,7 @@ from langchain.document_loaders.blob_loaders.youtube_audio import YoutubeAudioLo
 from langchain.document_loaders.generic import GenericLoader
 from langchain.document_loaders.parsers import OpenAIWhisperParser
 from langchain.schema import AIMessage, HumanMessage
-from langchain.llms import HuggingFaceHub, HuggingFaceChain
 from langchain.llms import HuggingFaceTextGenInference
 from langchain.embeddings import HuggingFaceInstructEmbeddings, HuggingFaceEmbeddings, HuggingFaceBgeEmbeddings, HuggingFaceInferenceAPIEmbeddings
 from langchain.retrievers.tavily_search_api import TavilySearchAPIRetriever
@@ -535,7 +535,7 @@ def generate_text (prompt, chatbot, history, rag_option, model_option, openai_ap
                 print("HF Anfrage.......................")
                 model_kwargs={"temperature": 0.5, "max_length": 512, "num_return_sequences": 1, "top_k": top_k, "top_p": top_p, "repetition_penalty": repetition_penalty}
                 #llm = HuggingFaceHub(repo_id=repo_id, model_kwargs=model_kwargs)
-                llm = HuggingFaceChain(model=MODEL_NAME_HF, model_kwargs={"temperature": 0.5, "max_length": 128})
                 #llm = HuggingFaceHub(url_??? = "https://wdgsjd6zf201mufn.us-east-1.aws.endpoints.huggingface.cloud", model_kwargs={"temperature": 0.5, "max_length": 64})
                 #llm = HuggingFaceTextGenInference( inference_server_url="http://localhost:8010/", max_new_tokens=max_new_tokens,top_k=10,top_p=top_p,typical_p=0.95,temperature=temperature,repetition_penalty=repetition_penalty,)
                 #llm via HuggingChat

 from langchain.document_loaders.generic import GenericLoader
 from langchain.document_loaders.parsers import OpenAIWhisperParser
 from langchain.schema import AIMessage, HumanMessage
+from langchain.llms import HuggingFaceHub, HuggingFaceTransformerChain
 from langchain.llms import HuggingFaceTextGenInference
 from langchain.embeddings import HuggingFaceInstructEmbeddings, HuggingFaceEmbeddings, HuggingFaceBgeEmbeddings, HuggingFaceInferenceAPIEmbeddings
 from langchain.retrievers.tavily_search_api import TavilySearchAPIRetriever
                 print("HF Anfrage.......................")
                 model_kwargs={"temperature": 0.5, "max_length": 512, "num_return_sequences": 1, "top_k": top_k, "top_p": top_p, "repetition_penalty": repetition_penalty}
                 #llm = HuggingFaceHub(repo_id=repo_id, model_kwargs=model_kwargs)
+                llm = HuggingFaceTransformerChain(model=MODEL_NAME_HF, model_kwargs={"temperature": 0.5, "max_length": 128})
                 #llm = HuggingFaceHub(url_??? = "https://wdgsjd6zf201mufn.us-east-1.aws.endpoints.huggingface.cloud", model_kwargs={"temperature": 0.5, "max_length": 64})
                 #llm = HuggingFaceTextGenInference( inference_server_url="http://localhost:8010/", max_new_tokens=max_new_tokens,top_k=10,top_p=top_p,typical_p=0.95,temperature=temperature,repetition_penalty=repetition_penalty,)
                 #llm via HuggingChat