Update README.md
Browse files
README.md
CHANGED
@@ -11,3 +11,45 @@ short_description: Traducci贸n de ingl茅s a otros idiomas mediante ASR
|
|
11 |
---
|
12 |
|
13 |
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
---
|
12 |
|
13 |
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
|
14 |
+
|
15 |
+
---
|
16 |
+
Problema, soluci贸n, input y output:
|
17 |
+
===================================
|
18 |
+
- Problema principal:
|
19 |
+
La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
|
20 |
+
|
21 |
+
- Soluci贸n:
|
22 |
+
Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
|
23 |
+
|
24 |
+
- Especificaciones:
|
25 |
+
Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
|
26 |
+
Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
|
27 |
+
Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
|
28 |
+
|
29 |
+
Descripci贸n de los modelos, clasificaci贸n y limitaciones:
|
30 |
+
=========================================================
|
31 |
+
Modelos utilizados.
|
32 |
+
- Whisper:
|
33 |
+
*Descripci贸n: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
|
34 |
+
|
35 |
+
*Clasificacion:
|
36 |
+
Tipo de tarea -> ASR.
|
37 |
+
Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas.
|
38 |
+
Dominio de uso -> Procesamiento de Lenguaje Natural y Reconocimiento de Voz
|
39 |
+
|
40 |
+
- MBart:
|
41 |
+
*Descripci贸n: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
|
42 |
+
|
43 |
+
*Clasificaci贸n:
|
44 |
+
Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto.
|
45 |
+
Modelo preentrenado -> preentrenado en tareas de m煤ltiples idiomas y ajustable para traducci贸n espec铆fica.
|
46 |
+
Dominio de uso -> Procesamiento de lenguaje natural y traducci贸n.
|
47 |
+
|
48 |
+
- Sinergia para estos dos modelos:
|
49 |
+
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s, y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente.
|
50 |
+
|
51 |
+
- Posibles limitaciones generales:
|
52 |
+
1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n.
|
53 |
+
2.Los recursos necesarios aumentan significativamente cuando ambos modelos se usan en tiempo real
|
54 |
+
3.Existe la posibilidad de incompatibilidades ling眉isticas o culturales cuando se precise de traducir frases, dichos o expresiones que no tienen un significado directo en otro idioma.
|
55 |
+
|