Spaces:

MarcoM003
/

PruebaSpeechTranslate

Sleeping

App Files Files Community

MarcoM003 commited on Nov 16, 2024

Commit

eb80a74

verified ·

1 Parent(s): 538404c

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -12

app.py CHANGED Viewed

@@ -2,17 +2,19 @@ import gradio as gr
 import whisper
 from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
-# Cargar modelos de Whisper y MBart
 whisper_model = whisper.load_model("base.en")
 translation_model = MBartForConditionalGeneration.from_pretrained("SnypzZz/Llama2-13b-Language-translate")
 tokenizer = MBart50TokenizerFast.from_pretrained("SnypzZz/Llama2-13b-Language-translate", src_lang="en_XX")
-# Función para transcribir y traducir el audio
-def transcribe_and_translate(audio_file, target_language):
-    # Transcribir el audio con Whisper
     transcription = whisper_model.transcribe(audio_file, language="english")["text"]
-    # Traducir el texto al idioma seleccionado
     model_inputs = tokenizer(transcription, return_tensors="pt")
     generated_tokens = translation_model.generate(
         **model_inputs,
@@ -21,29 +23,38 @@ def transcribe_and_translate(audio_file, target_language):
     translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
     return translated_text.strip("[]' ")
-# Interfaz de Gradio
 with gr.Blocks() as app:
     gr.Markdown("## Transcripción y Traducción de Audio")
-    # Entrada de audio y selección de idioma
     with gr.Row():
-        audio_input = gr.Audio(label="Sube o graba un audio en inglés", sources=["upload", "microphone"], type="filepath")
         language_dropdown = gr.Dropdown(
             ["de_DE", "es_XX", "fr_XX", "sv_SE", "ru_RU"],
             label="Selecciona el idioma de traducción",
             value="es_XX"
         )
-    # Botón y salida de texto traducido
     with gr.Row():
         translate_button = gr.Button("Transcribir y Traducir")
         translation_output = gr.Textbox(label="Texto Traducido")
-    # Configuración del botón
     translate_button.click(
-        transcribe_and_translate,
         inputs=[audio_input, language_dropdown],
         outputs=translation_output
     )
-app.queue().launch()

 import whisper
 from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
+## Cargar modelos de Whisper
 whisper_model = whisper.load_model("base.en")
+## Cargar modelos de MBart
 translation_model = MBartForConditionalGeneration.from_pretrained("SnypzZz/Llama2-13b-Language-translate")
 tokenizer = MBart50TokenizerFast.from_pretrained("SnypzZz/Llama2-13b-Language-translate", src_lang="en_XX")
+## Función para transcribir y traducir el audio
+def transcribe_translate(audio_file, target_language):
+    # Transcribir audio con Whisper (aquí se usa la variable whisper_model)
     transcription = whisper_model.transcribe(audio_file, language="english")["text"]
+    # Traducir texto a idioma seleccionado (aquí se usa translation_model y tokenizer)
     model_inputs = tokenizer(transcription, return_tensors="pt")
     generated_tokens = translation_model.generate(
         **model_inputs,
     translated_text = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]
     return translated_text.strip("[]' ")
+## Interfaz de Gradio
+# Está creado en filas para "organizar" la distribución de cada caja
 with gr.Blocks() as app:
+    # Título
     gr.Markdown("## Transcripción y Traducción de Audio")
+    # Primera fila -> Input de audio y elección del idioma
     with gr.Row():
+        # Audio
+        audio_input = gr.Audio(label="Subir o grabar audio en **inglés**", sources=["upload", "microphone"], type="filepath")
+        # Elección de idioma
         language_dropdown = gr.Dropdown(
             ["de_DE", "es_XX", "fr_XX", "sv_SE", "ru_RU"],
             label="Selecciona el idioma de traducción",
             value="es_XX"
         )
+    # Segunda fila -> Botón y salida de texto traducido
     with gr.Row():
+        # Boton
         translate_button = gr.Button("Transcribir y Traducir")
+        # Caja de texto (output)
         translation_output = gr.Textbox(label="Texto Traducido")
+    # Configuración botón
     translate_button.click(
+        transcribe_translate,
         inputs=[audio_input, language_dropdown],
         outputs=translation_output
     )
+##Iniciar aplicacion
+app.queue().launch()