Spaces:

CyranoB
/

search_agent

Sleeping

App Files Files Community

Eddie Pick commited on Aug 8, 2024

Commit

2f49709

1 Parent(s): 52f91c6

fixes

Browse files

Files changed (3) hide show

requirements.txt +2 -1
search_agent_ui.py +1 -1
web_rag.py +22 -24

requirements.txt CHANGED Viewed

@@ -12,10 +12,11 @@ langchain
 langchain-aws
 langchain-fireworks
 langchain_core
-langchain_cohere
 langchain_community
 langchain_experimental
 langchain_openai
 langchain_groq
 langsmith
 schema

 langchain-aws
 langchain-fireworks
 langchain_core
+langchain-cohere
 langchain_community
 langchain_experimental
 langchain_openai
+langchain-ollama
 langchain_groq
 langsmith
 schema

search_agent_ui.py CHANGED Viewed

@@ -75,7 +75,7 @@ with st.sidebar.expander("Options", expanded=False):
     temperature = st.slider("Model temperature 🌡️", 0.0, 1.0, 0.1, help="The higher the more creative")
     max_pages = st.slider("Max pages to retrieve 🔍", 1, 20, 15, help="How many web pages to retrive from the internet")
     top_k_documents = st.slider("Nbr of doc extracts to consider 📄", 1, 20, 5, help="How many of the top extracts to consider")
-    reviewer_mode =  st.checkbox("Draft / Comment / Rewrite mode ✍️", value=False, help="First generate a write, then comments and then rewrite")
 with st.sidebar.expander("Links", expanded=False):
     links_md = st.markdown("")

     temperature = st.slider("Model temperature 🌡️", 0.0, 1.0, 0.1, help="The higher the more creative")
     max_pages = st.slider("Max pages to retrieve 🔍", 1, 20, 15, help="How many web pages to retrive from the internet")
     top_k_documents = st.slider("Nbr of doc extracts to consider 📄", 1, 20, 5, help="How many of the top extracts to consider")
+    reviewer_mode =  st.checkbox("Draft / Comment / Rewrite mode ✍️", value=False, help="First generate a draft, then comments and then rewrite")
 with st.sidebar.expander("Links", expanded=False):
     links_md = st.markdown("")

web_rag.py CHANGED Viewed

@@ -28,16 +28,14 @@ from langchain.prompts.chat import (
 from langchain.prompts.prompt import PromptTemplate
 from langchain.retrievers.multi_query import MultiQueryRetriever
-from langchain_aws import ChatBedrock
-from langchain_cohere.chat_models import ChatCohere
-from langchain_cohere.embeddings import CohereEmbeddings
 from langchain_fireworks.chat_models import ChatFireworks
-#from langchain_groq import ChatGroq
 from langchain_groq.chat_models import ChatGroq
 from langchain_openai import ChatOpenAI
 from langchain_openai.embeddings import OpenAIEmbeddings
-from langchain_community.embeddings.bedrock import BedrockEmbeddings
-from langchain_community.chat_models.ollama import ChatOllama
 def get_models(provider, model=None, temperature=0.0):
     match provider:
@@ -45,10 +43,10 @@ def get_models(provider, model=None, temperature=0.0):
             credentials_profile_name=os.getenv('CREDENTIALS_PROFILE_NAME')
             if model is None:
                 model = "anthropic.claude-3-sonnet-20240229-v1:0"
-            chat_llm = ChatBedrock(
                 credentials_profile_name=credentials_profile_name,
-                model_id=model,
-                model_kwargs={"temperature": temperature, "max_tokens":4096 },
             )
             embedding_model = BedrockEmbeddings(
                 model_id='cohere.embed-multilingual-v3',
@@ -57,7 +55,7 @@ def get_models(provider, model=None, temperature=0.0):
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'openai':
             if model is None:
-                model = "gpt-3.5-turbo"
             chat_llm = ChatOpenAI(model_name=model, temperature=temperature)
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'groq':
@@ -67,7 +65,7 @@ def get_models(provider, model=None, temperature=0.0):
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'ollama':
             if model is None:
-                model = 'llama2'
             chat_llm = ChatOllama(model=model, temperature=temperature)
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'cohere':
@@ -78,9 +76,8 @@ def get_models(provider, model=None, temperature=0.0):
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'fireworks':
             if model is None:
-                #model = 'accounts/fireworks/models/dbrx-instruct'
-                model = 'accounts/fireworks/models/llama-v3-70b-instruct'
-            chat_llm = ChatFireworks(model_name=model, temperature=temperature, max_tokens=8192)
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case _:
             raise ValueError(f"Unknown LLM provider {provider}")
@@ -162,7 +159,7 @@ def optimize_search_query(chat_llm, query, callbacks=[]):
     messages = get_optimized_search_messages(query)
     response = chat_llm.invoke(messages, config={"callbacks": callbacks})
     optimized_search_query = response.content
-    return optimized_search_query.strip('"').split("**", 1)[0]
 def get_rag_prompt_template():
@@ -242,23 +239,24 @@ def get_context_size(chat_llm):
         else:
             return 16385
     if isinstance(chat_llm, ChatFireworks):
-        return 8192
     if isinstance(chat_llm, ChatGroq):
-        return 37862
     if isinstance(chat_llm, ChatOllama):
-        return 8192
     if isinstance(chat_llm, ChatCohere):
         return 128000
-    if isinstance(chat_llm, ChatBedrock):
         if chat_llm.model_id.startswith("anthropic.claude-3"):
             return 200000
         if chat_llm.model_id.startswith("anthropic.claude"):
             return 100000
         if chat_llm.model_id.startswith("mistral"):
-            if chat_llm.model_id.startswith("mistral.mixtral-8x7b"):
-                return 4096
-            else:
-                return 8192
     return 4096
@@ -280,4 +278,4 @@ def build_rag_prompt(chat_llm, question, search_query, vectorstore, top_k = 10,
 def query_rag(chat_llm, question, search_query, vectorstore, top_k = 10, callbacks = []):
     prompt = build_rag_prompt(chat_llm, question, search_query, vectorstore, top_k=top_k, callbacks = callbacks)
     response = chat_llm.invoke(prompt, config={"callbacks": callbacks})
-    return response.content

 from langchain.prompts.prompt import PromptTemplate
 from langchain.retrievers.multi_query import MultiQueryRetriever
+from langchain_aws import BedrockEmbeddings
+from langchain_aws.chat_models.bedrock_converse import ChatBedrockConverse
+from langchain_cohere import ChatCohere
 from langchain_fireworks.chat_models import ChatFireworks
 from langchain_groq.chat_models import ChatGroq
 from langchain_openai import ChatOpenAI
 from langchain_openai.embeddings import OpenAIEmbeddings
+from langchain_ollama.chat_models import ChatOllama
 def get_models(provider, model=None, temperature=0.0):
     match provider:
             credentials_profile_name=os.getenv('CREDENTIALS_PROFILE_NAME')
             if model is None:
                 model = "anthropic.claude-3-sonnet-20240229-v1:0"
+            chat_llm = ChatBedrockConverse(
                 credentials_profile_name=credentials_profile_name,
+                model=model,
+                temperature=temperature,
             )
             embedding_model = BedrockEmbeddings(
                 model_id='cohere.embed-multilingual-v3',
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'openai':
             if model is None:
+                model = "gpt-4o-mini"
             chat_llm = ChatOpenAI(model_name=model, temperature=temperature)
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'groq':
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'ollama':
             if model is None:
+                model = 'llama3.1'
             chat_llm = ChatOllama(model=model, temperature=temperature)
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'cohere':
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case 'fireworks':
             if model is None:
+                model = 'accounts/fireworks/models/llama-v3p1-8b-instruct'
+            chat_llm = ChatFireworks(model_name=model, temperature=temperature, max_tokens=120000)
             embedding_model = OpenAIEmbeddings(model='text-embedding-3-small')
         case _:
             raise ValueError(f"Unknown LLM provider {provider}")
     messages = get_optimized_search_messages(query)
     response = chat_llm.invoke(messages, config={"callbacks": callbacks})
     optimized_search_query = response.content
+    return optimized_search_query.strip('"').split("**", 1)[0].strip()
 def get_rag_prompt_template():
         else:
             return 16385
     if isinstance(chat_llm, ChatFireworks):
+        32768
     if isinstance(chat_llm, ChatGroq):
+        return 32768
     if isinstance(chat_llm, ChatOllama):
+        return 120000
     if isinstance(chat_llm, ChatCohere):
         return 128000
+    if isinstance(chat_llm, ChatBedrockConverse):
+        if chat_llm.model_id.startswith("meta.llama3-1"):
+            return 128000
         if chat_llm.model_id.startswith("anthropic.claude-3"):
             return 200000
         if chat_llm.model_id.startswith("anthropic.claude"):
             return 100000
         if chat_llm.model_id.startswith("mistral"):
+            if chat_llm.model_id.startswith("mistral.mistral.mistral-large-2407"):
+                return 128000
+            return 32000
     return 4096
 def query_rag(chat_llm, question, search_query, vectorstore, top_k = 10, callbacks = []):
     prompt = build_rag_prompt(chat_llm, question, search_query, vectorstore, top_k=top_k, callbacks = callbacks)
     response = chat_llm.invoke(prompt, config={"callbacks": callbacks})
+    return response.content