Spaces:

aail-hf
/

ensemble_machine

Sleeping

App Files Files Community

evaluation; minor UI change

by floydchow7 - opened Nov 17, 2024

base: refs/heads/main

←

from: refs/pr/3

Discussion Files changed

+48

-32

Files changed (3) hide show

app.py +34 -31
instructions.py +9 -0
utils.py +5 -1

app.py CHANGED Viewed

@@ -82,7 +82,7 @@ def handle_create_parallel(task, human_input, session_manager, api_key, identifi
     session_manager.update(session_index, ai_initial_answer, 'ai_initial_answer')
     session_manager.update(session_index, final_answer, 'merged_final_answer')
     session_manager.update(session_index, identification_code, 'user_identification_code')
-    return ai_initial_answer, final_answer, session_index
 def handle_create_reverse_sequential(task, session_manager, api_key, identification_code):
     cooperate_style = "reverse_sequential"
@@ -99,7 +99,8 @@ def handle_modify_reverse_sequential(session_index, modification_suggestions, se
     if word_limit_validation(modification_suggestions):
         final_answer = word_limit_validation(modification_suggestions)
     else:
-        final_answer = modify_with_suggestion(session['task'], modification_suggestions, api_key)
     session_manager.update(session_index, final_answer, 'final_answer')
     return final_answer, session_index
@@ -151,10 +152,21 @@ if __name__ == "__main__":
     session_manager = SessionManager()
-    with gr.Blocks() as app:
         with gr.Row():
             identification_code = gr.Textbox(label="Enter your identification code")
             login_button = gr.Button("Login")
         login_status = gr.Textbox(label="Next Tasks", interactive=False)
         group = gr.State()
@@ -205,16 +217,13 @@ if __name__ == "__main__":
                 outputs=[ai_output, session_index]
             )
-            ai_output.change(
-                fn = lambda session_index: on_textbox_change(session_index, session_manager, service, SHEET_ID1),
-                inputs = [session_index]
-            )
             # evaluate same for every group
-            evaluate_btn = gr.Button("Evaluate")
-            evaluation_result = gr.Textbox(label="Evaluation Result")
-            evaluate_btn.click(
                 fn=lambda session_index: evaluate_interaction(session_index, session_manager, api_key),
                 inputs=[session_index],
                 outputs=[evaluation_result]
@@ -235,8 +244,6 @@ if __name__ == "__main__":
                 outputs=[save_result]
             )
-            with gr.Accordion(label="Appendix: AI instructions", open=False):
-                gr.Markdown(GPT_PROMPT_sequential)
         with group_b_content:
             with gr.Row():
@@ -270,15 +277,11 @@ if __name__ == "__main__":
                 outputs=[final_answer, session_index]
             )
-            final_answer.change(
-                fn = lambda session_index: on_textbox_change(session_index, session_manager, service, SHEET_ID3),
-                inputs = [session_index]
-            )
-            evaluate_btn = gr.Button("Evaluate")
-            evaluation_result = gr.Textbox(label="Evaluation Result")
-            evaluate_btn.click(
                 fn=lambda session_index: evaluate_interaction(session_index, session_manager, api_key),
                 inputs=[session_index],
                 outputs=[evaluation_result]
@@ -298,8 +301,6 @@ if __name__ == "__main__":
                 outputs=[save_result]
             )
-            with gr.Accordion(label="Appendix: AI instructions", open=False):
-                gr.Markdown(GPT_PROMPT_reverse_sequential)
         with group_c_content:
@@ -311,25 +312,29 @@ if __name__ == "__main__":
                 create_btn = gr.Button("Submit & See AI Output")
             with gr.Row():
                 ai_initial_output = gr.Textbox(label="AI Output")
                 final_output = gr.Textbox(label="Final Merged Output")
                 session_index = gr.Number(label="Session Index", visible=False)
             create_btn.click(
                 fn=lambda task, human_input, id: handle_create_parallel(task, human_input, session_manager, api_key, id),
                 inputs=[description, human_input, identification_code],
-                outputs=[ai_initial_output, final_output, session_index]
             )
-            ai_initial_output.change(
-                fn = lambda session_index: on_textbox_change(session_index, session_manager, service, SHEET_ID2),
-                inputs = [session_index]
             )
-            evaluate_btn = gr.Button("Evaluate")
-            evaluation_result = gr.Textbox(label="Evaluation Result")
-            evaluate_btn.click(
                 fn=lambda session_index: evaluate_interaction(session_index, session_manager, api_key),
                 inputs=[session_index],
                 outputs=[evaluation_result]
@@ -349,7 +354,5 @@ if __name__ == "__main__":
                 outputs=[save_result]
             )
-            with gr.Accordion(label="Appendix: AI instructions", open=False):
-                gr.Markdown(GPT_PROMPT_parallel)
         app.launch(share=True)

     session_manager.update(session_index, ai_initial_answer, 'ai_initial_answer')
     session_manager.update(session_index, final_answer, 'merged_final_answer')
     session_manager.update(session_index, identification_code, 'user_identification_code')
+    return ai_initial_answer, session_index
 def handle_create_reverse_sequential(task, session_manager, api_key, identification_code):
     cooperate_style = "reverse_sequential"
     if word_limit_validation(modification_suggestions):
         final_answer = word_limit_validation(modification_suggestions)
     else:
+        final_answer = modification_suggestions
+        #final_answer = modify_with_suggestion(session['task'], modification_suggestions, api_key)
     session_manager.update(session_index, final_answer, 'final_answer')
     return final_answer, session_index
     session_manager = SessionManager()
+    with gr.Blocks(fill_width=True,
+        css = """
+        .gradio-container {
+            background: url('https://platform.vox.com/wp-content/uploads/sites/2/chorus/uploads/chorus_asset/file/9376591/blade3.jpg');
+            background-size: cover;
+            background-attachment: fixed;
+            background-position: center;
+        }
+        """) as app:
+        title = gr.HTML("<h1> Human-AI Ensemble </h1>")
         with gr.Row():
             identification_code = gr.Textbox(label="Enter your identification code")
             login_button = gr.Button("Login")
+        experiment_notes = gr.Textbox(label ="Notes for the participants",
+                                      value = notes_for_participants())
         login_status = gr.Textbox(label="Next Tasks", interactive=False)
         group = gr.State()
                 outputs=[ai_output, session_index]
             )
             # evaluate same for every group
+            #evaluate_btn = gr.Button("Evaluate", visible=False)
+            # Evaluate without showing
+            evaluation_result = gr.Textbox(label="Evaluation Result", visible=False)
+            ai_output.change(
                 fn=lambda session_index: evaluate_interaction(session_index, session_manager, api_key),
                 inputs=[session_index],
                 outputs=[evaluation_result]
                 outputs=[save_result]
             )
         with group_b_content:
             with gr.Row():
                 outputs=[final_answer, session_index]
             )
+            #evaluate_btn = gr.Button("Evaluate")
+            evaluation_result = gr.Textbox(label="Evaluation Result", visible=False)
+            final_answer.change(
                 fn=lambda session_index: evaluate_interaction(session_index, session_manager, api_key),
                 inputs=[session_index],
                 outputs=[evaluation_result]
                 outputs=[save_result]
             )
         with group_c_content:
                 create_btn = gr.Button("Submit & See AI Output")
             with gr.Row():
                 ai_initial_output = gr.Textbox(label="AI Output")
+            with gr.Row():
+                merge_btn = gr.Button("Merge Your Input")
+            with gr.Row():
                 final_output = gr.Textbox(label="Final Merged Output")
                 session_index = gr.Number(label="Session Index", visible=False)
             create_btn.click(
                 fn=lambda task, human_input, id: handle_create_parallel(task, human_input, session_manager, api_key, id),
                 inputs=[description, human_input, identification_code],
+                outputs=[ai_initial_output, session_index]
             )
+            merge_btn.click(
+                fn= lambda session_index : display_merged_output(session_index, session_manager),
+                inputs = [session_index],
+                outputs=[final_output]
             )
+            #evaluate_btn = gr.Button("Evaluate")
+            evaluation_result = gr.Textbox(label="Evaluation Result", visible=False)
+            final_output.change(
                 fn=lambda session_index: evaluate_interaction(session_index, session_manager, api_key),
                 inputs=[session_index],
                 outputs=[evaluation_result]
                 outputs=[save_result]
             )
         app.launch(share=True)

instructions.py CHANGED Viewed

@@ -43,6 +43,15 @@ def group_c_instructions():
 def invalid_group():
     return "Invalid group, please check your identification code."
 def default_task_discription():
     TASK_DESCRIPTION = """
     Given Airbnb's current business model below, please propose three ideas to make it comply with the 17 SDGs.

 def invalid_group():
     return "Invalid group, please check your identification code."
+def notes_for_participants():
+    NOTES = """
+    You will receive basic compensation 💰 for a valid response of at least 50 words.
+    Your final answer will be evaluated by an AI. If it ranks in the top 30 of 600 participants, you’ll earn an extra 🎁  $15.
+    """
+    return NOTES
 def default_task_discription():
     TASK_DESCRIPTION = """
     Given Airbnb's current business model below, please propose three ideas to make it comply with the 17 SDGs.

utils.py CHANGED Viewed

@@ -89,4 +89,8 @@ def get_evaluation_with_gpt(task_description, text, api_key=None):
 	    f"Inimitability: [Score]\n"
 	    f"Alignment: [Score]\n"
     )
-    return generate_text_with_gpt(prompt, api_key)

 	    f"Inimitability: [Score]\n"
 	    f"Alignment: [Score]\n"
     )
+    return generate_text_with_gpt(prompt, api_key)
+def display_merged_output(session_index, session_manager):
+    session = session_manager.get_session(session_index)
+    return session['merged_final_answer']