MarcoM003 commited on
Commit
d0787ff
verified
1 Parent(s): f97b690

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +42 -0
README.md CHANGED
@@ -11,3 +11,45 @@ short_description: Traducci贸n de ingl茅s a otros idiomas mediante ASR
11
  ---
12
 
13
  Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
11
  ---
12
 
13
  Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
14
+
15
+ ---
16
+ Problema, soluci贸n, input y output:
17
+ ===================================
18
+ - Problema principal:
19
+ La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
20
+
21
+ - Soluci贸n:
22
+ Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
23
+
24
+ - Especificaciones:
25
+ Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
26
+ Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
27
+ Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
28
+
29
+ Descripci贸n de los modelos, clasificaci贸n y limitaciones:
30
+ =========================================================
31
+ Modelos utilizados.
32
+ - Whisper:
33
+ *Descripci贸n: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
34
+
35
+ *Clasificacion:
36
+ Tipo de tarea -> ASR.
37
+ Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas.
38
+ Dominio de uso -> Procesamiento de Lenguaje Natural y Reconocimiento de Voz
39
+
40
+ - MBart:
41
+ *Descripci贸n: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
42
+
43
+ *Clasificaci贸n:
44
+ Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto.
45
+ Modelo preentrenado -> preentrenado en tareas de m煤ltiples idiomas y ajustable para traducci贸n espec铆fica.
46
+ Dominio de uso -> Procesamiento de lenguaje natural y traducci贸n.
47
+
48
+ - Sinergia para estos dos modelos:
49
+ Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente.
50
+
51
+ - Posibles limitaciones generales:
52
+ 1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n.
53
+ 2.Los recursos necesarios aumentan significativamente cuando ambos modelos se usan en tiempo real
54
+ 3.Existe la posibilidad de incompatibilidades ling眉isticas o culturales cuando se precise de traducir frases, dichos o expresiones que no tienen un significado directo en otro idioma.
55
+