Delete Descripcion.txt
Browse files- Descripcion.txt +0 -53
Descripcion.txt
DELETED
@@ -1,53 +0,0 @@
|
|
1 |
-
# Problema, soluci贸n, input y output
|
2 |
-
|
3 |
-
- *Problema principal*:
|
4 |
-
|
5 |
-
La comunicaci贸n entre distintas lenguas es imprescindible en la actualidad, por ello surge una necesidad de contar con una herramienta que permita la traducir contenido, en este caso, del ingl茅s a otros idiomas ampliamente utilizados. Este sistema est谩 en la integraci贸n de tecnolog铆as de reconocimiento de voz, tambi茅n conocido como ASR (Automatic Speech Recognition) y procesamiento de lenguaje natural para facilitar la traducci贸n.
|
6 |
-
|
7 |
-
- *Soluci贸n*:
|
8 |
-
|
9 |
-
Consiste en desarrollar un sistema que procese audios en formatos comunes, como .mp3 o .wav, transcriba autom谩ticamente el contenido previamente grabado en ingl茅s y proporcione su traducci贸n al idioma seleccionado. Aprovechando modelos de IA como Whisper y MBart, adaptadas al contexto del mensaje.
|
10 |
-
|
11 |
-
- *Especificaciones*:
|
12 |
-
|
13 |
-
Input: Un archivo de audio en formato compatible (MP3, WAV, etc.), cargado o grabado directamente por el usuario.
|
14 |
-
Output: Una transcripci贸n del audio en texto traducido al idioma seleccionado (espa帽ol, alem谩n, ruso o franc茅s).
|
15 |
-
Adem谩s de responder a la necesidad de superar barreras a nivel de idiomas, tambi茅n ofrece una experiencia intuitiva.
|
16 |
-
|
17 |
-
# Descripci贸n de los modelos, clasificaci贸n y limitaciones
|
18 |
-
|
19 |
-
## Modelos utilizados
|
20 |
-
### Whisper:
|
21 |
-
**Descripci贸n**: Modelo de transcripci贸n de audio desarrollado por OpenAI. Tiene como objetivo pasar audios a texto. Basado en Transformer y entrenado con un conjunto grande de datos de muchos idiomas distintos, lo que permite tareas relacionadas con el ASR.
|
22 |
-
|
23 |
-
**Clasificaci贸n**:
|
24 |
-
|
25 |
-
- Tipo de tarea -> ASR
|
26 |
-
|
27 |
-
- Modelo preentrenado -> preentrenado en datos multiling眉es y ajustable para tareas espec铆ficas
|
28 |
-
|
29 |
-
- Dominio de uso -> Procesamiento de Lenguaje Natural y Reconocimiento de Voz
|
30 |
-
|
31 |
-
|
32 |
-
### MBart:
|
33 |
-
**Descripci贸n**: Otro modelo multiling眉e basado en Transformer. 脷til para la traducci贸n autom谩tica y dem谩s tareas de generaci贸n de texto en m煤ltiples idiomas. Preentrenado en tareas de reducci贸n de ruido y puede ser ajustado para traducir espec铆ficamente entre dos pares de idiomas.
|
34 |
-
|
35 |
-
**Clasificaci贸n**:
|
36 |
-
|
37 |
-
- Tipo de tarea -> Traducci贸n autom谩tica y generaci贸n de texto
|
38 |
-
|
39 |
-
- Modelo preentrenado -> preentrenado en tareas de m煤ltiples idiomas y ajustable para traducci贸n espec铆fica
|
40 |
-
|
41 |
-
- Dominio de uso -> Procesamiento de lenguaje natural y traducci贸n
|
42 |
-
|
43 |
-
### Sinergia para estos dos modelos:
|
44 |
-
Tomamos como base que Whisper lo usamos para convertir un archivo de audio a texto en ingl茅s,
|
45 |
-
y MBart toma el texto transcrito, el cual lo traduce a otro idioma seleccionado previamente
|
46 |
-
|
47 |
-
**Posibles limitaciones generales**
|
48 |
-
|
49 |
-
1.La precisi贸n general depender谩 tanto de la calidad de la transcripci贸n como de la traducci贸n. A la hora de la traducci贸n, puede llegar err贸nea por culpa de la transcripci贸n
|
50 |
-
|
51 |
-
2.Los recursos necesarios aumentan significativamente cuando ambos modelos se usan en tiempo real
|
52 |
-
|
53 |
-
3.Existe la posibilidad de incompatibilidades ling眉isticas o culturales cuando se precise de traducir frases, dichos o expresiones que no tienen un significado directo en otro idioma
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|