Update utils.py
Browse files
utils.py
CHANGED
@@ -322,9 +322,15 @@ def load_word_with_metadata(file_path):
|
|
322 |
#Vektorstore
|
323 |
################################################
|
324 |
#liste aller files in einem dir...
|
325 |
-
def list_files_in_hf_repo(repo_id):
|
326 |
-
|
327 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
328 |
|
329 |
################################################
|
330 |
# Document Splitting
|
@@ -361,7 +367,7 @@ def document_loading_splitting():
|
|
361 |
#os.makedirs(download_dir, exist_ok=True)
|
362 |
|
363 |
# Dateien im Hugging Face Space auflisten
|
364 |
-
files_in_repo = list_files_in_hf_repo(STORAGE_REPO_ID)
|
365 |
print("hier.....................................")
|
366 |
# Dateien aus dem Hugging Face Space mit der STORAGE_REPO_ID herunterladen
|
367 |
for file_name in files_in_repo:
|
|
|
322 |
#Vektorstore
|
323 |
################################################
|
324 |
#liste aller files in einem dir...
|
325 |
+
def list_files_in_hf_repo(repo_id, directory=""):
|
326 |
+
try:
|
327 |
+
repo_info = api.list_repo_files(repo_id=repo_id, repo_type=REPO_TYPE)
|
328 |
+
if directory:
|
329 |
+
repo_info = [file for file in repo_info if file.startswith(directory)]
|
330 |
+
return repo_info
|
331 |
+
except Exception as e:
|
332 |
+
print(f"Fehler beim Zugriff auf das Repository.........................:{repo_id} {e}")
|
333 |
+
return []
|
334 |
|
335 |
################################################
|
336 |
# Document Splitting
|
|
|
367 |
#os.makedirs(download_dir, exist_ok=True)
|
368 |
|
369 |
# Dateien im Hugging Face Space auflisten
|
370 |
+
files_in_repo = list_files_in_hf_repo(STORAGE_REPO_ID, "chroma/kkg/pdf/")
|
371 |
print("hier.....................................")
|
372 |
# Dateien aus dem Hugging Face Space mit der STORAGE_REPO_ID herunterladen
|
373 |
for file_name in files_in_repo:
|