AlexK-PL commited on
Commit
77a1fb2
verified
1 Parent(s): be60d0f

Update informacio.md

Browse files
Files changed (1) hide show
  1. informacio.md +3 -6
informacio.md CHANGED
@@ -233,14 +233,11 @@ utilitzant score matching.
233
  ## Adaptaci贸 al catal脿
234
 
235
  El model original de Matcha-TTS excel路leix en angl猫s, per貌 per adaptar-lo al catal脿, hem dut a terme un proc茅s multi-etapa.
236
- En primer lloc, hem fet el _fine-tuning_ del model d'angl猫s al catal脿 central creant un Matxa-base, fent servir dos conjunts de dades:
 
237
 
238
- * [La nostra versi贸 del conjunt de dades openslr-slr69.](https://huggingface.co/datasets/projecte-aina/openslr-slr69-ca-trimmed-denoised)
239
-
240
- * [La nostra versi贸 del conjunt de dades Festcat.](https://huggingface.co/datasets/projecte-aina/festcat_trimmed_denoised)
241
-
242
  A continuaci贸, hem fet un altre _fine-tuning_ de Matxa-base amb el conjunt de dades LaFresCat per introduir les variants dialectals.
243
- Aquest conjunt dades, que es publicar脿 aviat, t茅 8,5 hores d'enregistraments per a quatre variants dialectals:
244
 
245
  * Balear
246
 
 
233
  ## Adaptaci贸 al catal脿
234
 
235
  El model original de Matcha-TTS excel路leix en angl猫s, per貌 per adaptar-lo al catal脿, hem dut a terme un proc茅s multi-etapa.
236
+ En primer lloc, hem fet el _fine-tuning_ del model d'angl猫s al catal脿 central creant un Matxa-base, fent servir un subconjunt de 100h de la base de dades del catal脿 de [CommonVoice](https://commonvoice.mozilla.org/es/datasets) v.16.
237
+ La tria d'aquest petit conjunt de mostres s'ha realitzat de manera autom脿tica amb l'ajuda del sistema [UTMOS](https://arxiv.org/abs/2204.02152), un predictor de valors de la m猫trica _Mean Opinion Score_ (MOS) que sol ser decidida per humans segons la qualitat de la parla.
238
 
 
 
 
 
239
  A continuaci贸, hem fet un altre _fine-tuning_ de Matxa-base amb el conjunt de dades LaFresCat per introduir les variants dialectals.
240
+ Aquest conjunt dades, que es publicar脿 aviat, t茅 3,5 hores d'enregistraments per a quatre variants dialectals:
241
 
242
  * Balear
243