Spaces:

KwabsHug
/

GameConfigIdea

Running on Zero

kwabs22 commited on Jul 16, 2024

Commit

7e4c949

1 Parent(s): 43647c4

RAG Placeholder demo test

Files changed (1) hide show

app.py CHANGED Viewed

@@ -172,13 +172,29 @@ def llmguide_generate_response(prompt, stream=False):
     # torch.cuda.empty_cache()
     # gc.collect()
 def rag(query, stream=False):
     retrieved_docs = retrieve(query)
     context = " ".join(retrieved_docs)
     prompt = f"Context: {context}\nQuestion: {query}\nAnswer:"
-    return llmguide_generate_response(prompt, stream)
 #--------------------------------------------------------------------------------------------------------------------------------

     # torch.cuda.empty_cache()
     # gc.collect()
+# def rag(query, stream=False):
+#     retrieved_docs = retrieve(query)
+#     context = " ".join(retrieved_docs)
+#     prompt = f"Context: {context}\nQuestion: {query}\nAnswer:"
+#     return llmguide_generate_response(prompt, stream)
 def rag(query, stream=False):
     retrieved_docs = retrieve(query)
     context = " ".join(retrieved_docs)
     prompt = f"Context: {context}\nQuestion: {query}\nAnswer:"
+    generator = llmguide_generate_response(prompt, stream)
+    if stream:
+        def stream_output():
+            for generated_text, tokens_per_second, ram_usage in generator:
+                yield generated_text, tokens_per_second, ram_usage
+        return stream_output()
+    else:
+        # For non-streaming, we just need to get the final output
+        for generated_text, tokens_per_second, ram_usage in generator:
+            pass  # This will iterate to the last yield
+        return generated_text, tokens_per_second, ram_usage
 #--------------------------------------------------------------------------------------------------------------------------------