Spaces:

Ocillus
/

Arcana

Running

Ocillus commited on Jul 20, 2024

Commit

f7f0bde

verified ·

1 Parent(s): 5215e98

Update Arcana.py

Files changed (1) hide show

Arcana.py CHANGED Viewed

@@ -21,7 +21,7 @@ def process_text_into_paragraphs(text):
     text = re.sub(r'^\s*\d+\s*$', '', text, flags=re.MULTILINE)
     # Split text into paragraphs
-    paragraphs = re.split(r'\n{2,}', text)
     # Clean up each paragraph
     cleaned_paragraphs = []
@@ -58,16 +58,17 @@ def process_pdfs(directory, db):
             pbar.set_postfix({"Current File": filename})
             print(filename)
-def main():
-    db_filename = 'memory.txt'
     if os.path.exists(db_filename):
         print(f"Database file '{db_filename}' already exists. Rewriting existing database...")
         #db = ChatDatabase(db_filename)
         #else:
         print(f"Creating new database '{db_filename}'...")
         db = ChatDatabase(db_filename)
-        pdf_directory = 'cache'
         start_time = time.time()
         process_pdfs(pdf_directory, db)

     text = re.sub(r'^\s*\d+\s*$', '', text, flags=re.MULTILINE)
     # Split text into paragraphs
+    paragraphs = list(set(re.split(r'\n{2,}', text)))
     # Clean up each paragraph
     cleaned_paragraphs = []
             pbar.set_postfix({"Current File": filename})
             print(filename)
+def main(foldername):
+    db_filename = foldername
     if os.path.exists(db_filename):
+        db_filename += '.txt'
         print(f"Database file '{db_filename}' already exists. Rewriting existing database...")
         #db = ChatDatabase(db_filename)
         #else:
         print(f"Creating new database '{db_filename}'...")
         db = ChatDatabase(db_filename)
+        pdf_directory = foldername
         start_time = time.time()
         process_pdfs(pdf_directory, db)