Spaces:

Ofiroz91
/

HelloWorldTranscription

Sleeping

Ofiroz91 commited on Nov 12, 2024

Commit

7f10f20

verified ·

1 Parent(s): b93e08b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,10 +16,16 @@ def summarize_audio_or_video(file_path):
         else:
             audio_file = file_path
-        # תמלול האודיו
-        transcript = transcriber(audio_file)["text"]
-        # יצירת סיכום של התמלול
         summary = summarizer(transcript, max_length=50, min_length=25, do_sample=False)[0]["summary_text"]
         # מחיקת קובץ האודיו במידת הצורך (אם היה וידאו)
@@ -38,10 +44,20 @@ def convert_video_to_audio(video_file):
     video.export(temp_audio, format="wav")
     return temp_audio
 # הגדרת ממשק Gradio
 interface = gr.Interface(
     fn=summarize_audio_or_video,
-    inputs=gr.Audio(type="filepath"),  # מתאים לאודיו ווידאו
     outputs="text",
     title="ממיר אודיו/וידאו לסיכום",
     description="העלה קובץ אודיו או וידאו של מרצה וקבל סיכום קצר של התוכן."

         else:
             audio_file = file_path
+        # חלוקת האודיו לקטעים של 30 שניות
+        segments = split_audio(audio_file)
+        # תמלול כל קטע והצטרפות התמלול הסופי
+        transcript = ""
+        for segment in segments:
+            segment_text = transcriber(segment, return_timestamps=False)["text"]
+            transcript += " " + segment_text
+        # סיכום התמלול
         summary = summarizer(transcript, max_length=50, min_length=25, do_sample=False)[0]["summary_text"]
         # מחיקת קובץ האודיו במידת הצורך (אם היה וידאו)
     video.export(temp_audio, format="wav")
     return temp_audio
+def split_audio(audio_file, segment_length=30 * 1000):  # 30 שניות במילישניות
+    audio = AudioSegment.from_file(audio_file)
+    segments = []
+    for i in range(0, len(audio), segment_length):
+        segment = audio[i:i + segment_length]
+        temp_segment = tempfile.mktemp(suffix=".wav")
+        segment.export(temp_segment, format="wav")
+        segments.append(temp_segment)
+    return segments
 # הגדרת ממשק Gradio
 interface = gr.Interface(
     fn=summarize_audio_or_video,
+    inputs=gr.Audio(type="filepath"),
     outputs="text",
     title="ממיר אודיו/וידאו לסיכום",
     description="העלה קובץ אודיו או וידאו של מרצה וקבל סיכום קצר של התוכן."