Update informacio.md
Browse files- informacio.md +3 -6
informacio.md
CHANGED
@@ -233,14 +233,11 @@ utilitzant score matching.
|
|
233 |
## Adaptaci贸 al catal脿
|
234 |
|
235 |
El model original de Matcha-TTS excel路leix en angl猫s, per貌 per adaptar-lo al catal脿, hem dut a terme un proc茅s multi-etapa.
|
236 |
-
En primer lloc, hem fet el _fine-tuning_ del model d'angl猫s al catal脿 central creant un Matxa-base, fent servir
|
|
|
237 |
|
238 |
-
* [La nostra versi贸 del conjunt de dades openslr-slr69.](https://huggingface.co/datasets/projecte-aina/openslr-slr69-ca-trimmed-denoised)
|
239 |
-
|
240 |
-
* [La nostra versi贸 del conjunt de dades Festcat.](https://huggingface.co/datasets/projecte-aina/festcat_trimmed_denoised)
|
241 |
-
|
242 |
A continuaci贸, hem fet un altre _fine-tuning_ de Matxa-base amb el conjunt de dades LaFresCat per introduir les variants dialectals.
|
243 |
-
Aquest conjunt dades, que es publicar脿 aviat, t茅
|
244 |
|
245 |
* Balear
|
246 |
|
|
|
233 |
## Adaptaci贸 al catal脿
|
234 |
|
235 |
El model original de Matcha-TTS excel路leix en angl猫s, per貌 per adaptar-lo al catal脿, hem dut a terme un proc茅s multi-etapa.
|
236 |
+
En primer lloc, hem fet el _fine-tuning_ del model d'angl猫s al catal脿 central creant un Matxa-base, fent servir un subconjunt de 100h de la base de dades del catal脿 de [CommonVoice](https://commonvoice.mozilla.org/es/datasets) v.16.
|
237 |
+
La tria d'aquest petit conjunt de mostres s'ha realitzat de manera autom脿tica amb l'ajuda del sistema [UTMOS](https://arxiv.org/abs/2204.02152), un predictor de valors de la m猫trica _Mean Opinion Score_ (MOS) que sol ser decidida per humans segons la qualitat de la parla.
|
238 |
|
|
|
|
|
|
|
|
|
239 |
A continuaci贸, hem fet un altre _fine-tuning_ de Matxa-base amb el conjunt de dades LaFresCat per introduir les variants dialectals.
|
240 |
+
Aquest conjunt dades, que es publicar脿 aviat, t茅 3,5 hores d'enregistraments per a quatre variants dialectals:
|
241 |
|
242 |
* Balear
|
243 |
|