Spaces:

wandb
/

guardrails-genie

Running

App Files Files Community

geekyrakshit commited on Nov 25, 2024

Commit

98a3259

1 Parent(s): 15915d9

add: eval page to app

Browse files

Files changed (4) hide show

.gitignore +2 -1
README.md +1 -1
app.py +1 -1
application_pages/evaluation_app.py +38 -0

.gitignore CHANGED Viewed

@@ -164,4 +164,5 @@ cython_debug/
 cursor_prompts/
 uv.lock
 test.py
-temp.txt

 cursor_prompts/
 uv.lock
 test.py
+temp.txt
+**.csv

README.md CHANGED Viewed

@@ -10,7 +10,7 @@ cd guardrails-genie
 pip install -u pip uv
 uv venv
 # If you want to install for torch CPU, uncomment the following line
-# export PIP_EXTRA_INDEX_URL=https://download.pytorch.org/whl/cpu
 uv pip install -e .
 source .venv/bin/activate
 ```

 pip install -u pip uv
 uv venv
 # If you want to install for torch CPU, uncomment the following line
+# export PIP_EXTRA_INDEX_URL="https://download.pytorch.org/whl/cpu"
 uv pip install -e .
 source .venv/bin/activate
 ```

app.py CHANGED Viewed

@@ -13,4 +13,4 @@ evaluation_page = st.Page(
 )
 page_navigation = st.navigation([intro_page, chat_page, evaluation_page])
 st.set_page_config(page_title="Guardrails Genie", page_icon=":material/guardian:")
-page_navigation.run()

 )
 page_navigation = st.navigation([intro_page, chat_page, evaluation_page])
 st.set_page_config(page_title="Guardrails Genie", page_icon=":material/guardian:")
+page_navigation.run()

application_pages/evaluation_app.py CHANGED Viewed

@@ -1,3 +1,41 @@
 import streamlit as st
 st.title(":material/monitoring: Evaluation")

+import pandas as pd
 import streamlit as st
+import weave
+from dotenv import load_dotenv
+load_dotenv()
+weave.init(project_name="guardrails-genie")
 st.title(":material/monitoring: Evaluation")
+if "start_evaluation" not in st.session_state:
+    st.session_state.start_evaluation = False
+if "ref" not in st.session_state:
+    st.session_state.ref = None
+uploaded_file = st.sidebar.file_uploader("Choose a CSV file", type="csv")
+dataset_name = st.sidebar.text_input("Dataset name", value="")
+visualize_in_app = st.sidebar.toggle("Visualize in app", value=False)
+if uploaded_file is not None:
+    with st.expander("Dataset Preview"):
+        dataframe = pd.read_csv(uploaded_file)
+        data_list = dataframe.to_dict(orient="records")
+        if dataset_name != "":
+            dataset = weave.Dataset(name=dataset_name, rows=data_list)
+            st.session_state.ref = weave.publish(dataset)
+            st.write(
+                f"Dataset published at https://wandb.ai/{st.session_state.ref.entity}/{st.session_state.ref.project}/weave/objects/{st.session_state.ref.name}/versions/{st.session_state.ref._digest}"
+            )
+            if visualize_in_app:
+                st.dataframe(data_list)
+                # dataset = weave.ref("weave:///geekyrakshit/guardrails-genie/object/sample-dataset:RvdLm7KZ5KXFGcXUHWMGoJBWRVmdxiH6VgWu4cpsDHM").get()
+    run_evaluation_button = st.sidebar.button("Run Evaluation")
+    st.session_state.start_evaluation = run_evaluation_button
+    if st.session_state.start_evaluation:
+        with st.expander("Evaluation Results"):
+            st.write("Evaluation results will be displayed here.")