Spaces:

twn39
/

starship

Runtime error

App Files Files Community

curry tang commited on Jul 22, 2024

Commit

03b5791

1 Parent(s): 9105300

update

Browse files

Files changed (2) hide show

app.py +58 -111
llm.py +4 -2

app.py CHANGED Viewed

@@ -1,7 +1,11 @@
 import gradio as gr
 from langchain_core.messages import HumanMessage, AIMessage
 from llm import DeepSeekLLM, OpenRouterLLM, TongYiLLM
 from config import settings
 deep_seek_llm = DeepSeekLLM(api_key=settings.deep_seek_api_key)
@@ -14,13 +18,28 @@ def init_chat():
 def predict(message, history, chat):
     if chat is None:
         chat = init_chat()
     history_messages = []
     for human, assistant in history:
         history_messages.append(HumanMessage(content=human))
-        history_messages.append(AIMessage(content=assistant))
-    history_messages.append(HumanMessage(content=message.text))
     response_message = ''
     for chunk in chat.stream(history_messages):
@@ -63,120 +82,48 @@ with gr.Blocks() as app:
                     @gr.render(inputs=provider)
                     def show_model_config_panel(_provider):
-                        if _provider == 'DeepSeek':
-                            with gr.Column():
-                                model = gr.Dropdown(
-                                    label='模型',
-                                    choices=deep_seek_llm.support_models,
-                                    value=deep_seek_llm.default_model
-                                )
-                                temperature = gr.Slider(
-                                    minimum=0.0,
-                                    maximum=1.0,
-                                    step=0.1,
-                                    value=deep_seek_llm.default_temperature,
-                                    label="Temperature",
-                                    key="temperature",
-                                )
-                                max_tokens = gr.Slider(
-                                    minimum=1024,
-                                    maximum=1024 * 20,
-                                    step=128,
-                                    value=deep_seek_llm.default_max_tokens,
-                                    label="Max Tokens",
-                                    key="max_tokens",
-                                )
-                            model.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
-                            )
-                            temperature.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
-                            )
-                            max_tokens.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
-                            )
                         if _provider == 'OpenRouter':
-                            with gr.Column():
-                                model = gr.Dropdown(
-                                    label='模型',
-                                    choices=open_router_llm.support_models,
-                                    value=open_router_llm.default_model
-                                )
-                                temperature = gr.Slider(
-                                    minimum=0.0,
-                                    maximum=1.0,
-                                    step=0.1,
-                                    value=open_router_llm.default_temperature,
-                                    label="Temperature",
-                                    key="temperature",
-                                )
-                                max_tokens = gr.Slider(
-                                    minimum=1024,
-                                    maximum=1024 * 20,
-                                    step=128,
-                                    value=open_router_llm.default_max_tokens,
-                                    label="Max Tokens",
-                                    key="max_tokens",
-                                )
-                            model.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
-                            )
-                            temperature.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
-                            )
-                            max_tokens.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
-                            )
                         if _provider == 'Tongyi':
-                            with gr.Column():
-                                model = gr.Dropdown(
-                                    label='模型',
-                                    choices=tongyi_llm.support_models,
-                                    value=tongyi_llm.default_model
-                                )
-                                temperature = gr.Slider(
-                                    minimum=0.0,
-                                    maximum=1.0,
-                                    step=0.1,
-                                    value=tongyi_llm.default_temperature,
-                                    label="Temperature",
-                                    key="temperature",
-                                )
-                                max_tokens = gr.Slider(
-                                    minimum=1000,
-                                    maximum=2000,
-                                    step=100,
-                                    value=tongyi_llm.default_max_tokens,
-                                    label="Max Tokens",
-                                    key="max_tokens",
-                                )
-                            model.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
                             )
-                            temperature.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
                             )
-                            max_tokens.change(
-                                fn=update_chat,
-                                inputs=[provider, chat_engine, model, temperature, max_tokens],
-                                outputs=[chat_engine],
                             )
 app.launch(debug=settings.debug, show_api=False)

 import gradio as gr
+from gradio import FileData
 from langchain_core.messages import HumanMessage, AIMessage
 from llm import DeepSeekLLM, OpenRouterLLM, TongYiLLM
 from config import settings
+import base64
+from PIL import Image
+import io
 deep_seek_llm = DeepSeekLLM(api_key=settings.deep_seek_api_key)
 def predict(message, history, chat):
+    file_len = len(message.files)
     if chat is None:
         chat = init_chat()
     history_messages = []
     for human, assistant in history:
         history_messages.append(HumanMessage(content=human))
+        if assistant is not None:
+            history_messages.append(AIMessage(content=assistant))
+    if file_len == 0:
+        history_messages.append(HumanMessage(content=message.text))
+    else:
+        file = message.files[0]
+        with Image.open(file.path) as img:
+            buffer = io.BytesIO()
+            img = img.convert('RGB')
+            img.save(buffer, format="JPEG")
+            image_data = base64.b64encode(buffer.getvalue()).decode("utf-8")
+            history_messages.append(HumanMessage(content=[
+                {"type": "text", "text": message.text},
+                {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"}}
+            ]))
     response_message = ''
     for chunk in chat.stream(history_messages):
                     @gr.render(inputs=provider)
                     def show_model_config_panel(_provider):
+                        _support_llm = deep_seek_llm
                         if _provider == 'OpenRouter':
+                            _support_llm = open_router_llm
                         if _provider == 'Tongyi':
+                            _support_llm = tongyi_llm
+                        with gr.Column():
+                            model = gr.Dropdown(
+                                label='模型',
+                                choices=_support_llm.support_models,
+                                value=_support_llm.default_model
                             )
+                            temperature = gr.Slider(
+                                minimum=0.0,
+                                maximum=1.0,
+                                step=0.1,
+                                value=_support_llm.default_temperature,
+                                label="Temperature",
+                                key="temperature",
                             )
+                            max_tokens = gr.Slider(
+                                minimum=1024,
+                                maximum=_support_llm.default_max_tokens,
+                                step=128,
+                                value=_support_llm.default_max_tokens,
+                                label="Max Tokens",
+                                key="max_tokens",
                             )
+                        model.change(
+                            fn=update_chat,
+                            inputs=[provider, chat_engine, model, temperature, max_tokens],
+                            outputs=[chat_engine],
+                        )
+                        temperature.change(
+                            fn=update_chat,
+                            inputs=[provider, chat_engine, model, temperature, max_tokens],
+                            outputs=[chat_engine],
+                        )
+                        max_tokens.change(
+                            fn=update_chat,
+                            inputs=[provider, chat_engine, model, temperature, max_tokens],
+                            outputs=[chat_engine],
+                        )
 app.launch(debug=settings.debug, show_api=False)

llm.py CHANGED Viewed

@@ -55,11 +55,12 @@ class DeepSeekLLM(BaseLLM):
     _support_models = ['deepseek-chat', 'deepseek-coder']
     _base_url = 'https://api.deepseek.com/v1'
     _default_model = 'deepseek-chat'
 class OpenRouterLLM(BaseLLM):
     _support_models = [
-        'anthropic/claude-3.5-sonnet', 'openai/gpt-4o',
         'nvidia/nemotron-4-340b-instruct', 'deepseek/deepseek-coder',
         'google/gemini-flash-1.5', 'deepseek/deepseek-chat',
         'liuhaotian/llava-yi-34b', 'qwen/qwen-110b-chat',
@@ -68,10 +69,11 @@ class OpenRouterLLM(BaseLLM):
     ]
     _base_url = 'https://openrouter.ai/api/v1'
     _default_model = 'anthropic/claude-3.5-sonnet'
 class TongYiLLM(BaseLLM):
     _support_models = ['qwen-turbo', 'qwen-plus', 'qwen-max', 'qwen-long']
     _default_model = 'qwen-turbo'
     _base_url = 'https://dashscope.aliyuncs.com/compatible-mode/v1'
-    _default_max_tokens: int = 2000

     _support_models = ['deepseek-chat', 'deepseek-coder']
     _base_url = 'https://api.deepseek.com/v1'
     _default_model = 'deepseek-chat'
+    _default_max_tokens = 4096
 class OpenRouterLLM(BaseLLM):
     _support_models = [
+        'openai/gpt-4o-mini', 'anthropic/claude-3.5-sonnet', 'openai/gpt-4o',
         'nvidia/nemotron-4-340b-instruct', 'deepseek/deepseek-coder',
         'google/gemini-flash-1.5', 'deepseek/deepseek-chat',
         'liuhaotian/llava-yi-34b', 'qwen/qwen-110b-chat',
     ]
     _base_url = 'https://openrouter.ai/api/v1'
     _default_model = 'anthropic/claude-3.5-sonnet'
+    _default_max_tokens = 16 * 1024
 class TongYiLLM(BaseLLM):
     _support_models = ['qwen-turbo', 'qwen-plus', 'qwen-max', 'qwen-long']
     _default_model = 'qwen-turbo'
     _base_url = 'https://dashscope.aliyuncs.com/compatible-mode/v1'
+    _default_max_tokens: int = 32 * 1024