Spaces:

Svngoku
/

afrimmlu-iroko-bench-deepseek

Running

Svngoku commited on 7 days ago

Commit

66791db

verified ·

1 Parent(s): 0e88496

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -144,19 +144,25 @@ def create_visualization(results_dict):
     return summary_df, fig
 def evaluate_and_display(test_file, model_name):
-    """
-    Process uploaded file and run evaluation.
-    """
     test_data = pd.read_json(test_file.name)
     preprocessed_data = preprocess_dataset(test_data.to_dict('records'))
     results = evaluate_afrimmlu(preprocessed_data, model_name)
     summary_df, plot = create_visualization(results)
-    detailed_df = pd.read_csv('detailed_results.csv')
     return summary_df, plot, detailed_df
 def create_gradio_interface():
     """
     Create and configure the Gradio interface.
@@ -174,9 +180,9 @@ def create_gradio_interface():
                     file_types=[".json"]
                 )
                 model_input = gr.Dropdown(
-                    choices=["deepseek-chat", "gpt-3.5-turbo", "gpt-4"],
                     label="Select Model",
-                    value="deepseek-chat"
                 )
                 evaluate_btn = gr.Button("Evaluate", variant="primary")

     return summary_df, fig
 def evaluate_and_display(test_file, model_name):
+    # Load and preprocess data
     test_data = pd.read_json(test_file.name)
     preprocessed_data = preprocess_dataset(test_data.to_dict('records'))
+    # Run evaluation
     results = evaluate_afrimmlu(preprocessed_data, model_name)
+    # Create visualizations
     summary_df, plot = create_visualization(results)
+    # Load detailed results with error handling
+    try:
+        detailed_df = pd.read_csv('detailed_results.csv')
+    except (FileNotFoundError, pd.errors.EmptyDataError):
+        detailed_df = pd.DataFrame(results["detailed_results"])
     return summary_df, plot, detailed_df
 def create_gradio_interface():
     """
     Create and configure the Gradio interface.
                     file_types=[".json"]
                 )
                 model_input = gr.Dropdown(
+                    choices=["deepseek/deepseek-chat"],
                     label="Select Model",
+                    value="deepseek/deepseek-chat"
                 )
                 evaluate_btn = gr.Button("Evaluate", variant="primary")