catalan information added
Browse files- about.md +1 -1
- infer_onnx.py +7 -3
- about_català.md → informacio.md +11 -5
about.md
CHANGED
@@ -1,7 +1,7 @@
|
|
1 |
## 📄 About
|
2 |
Natural and efficient TTS in Catalan: 🍵+🥑 .
|
3 |
|
4 |
-
Here you
|
5 |
|
6 |
## Table of Contents
|
7 |
<details>
|
|
|
1 |
## 📄 About
|
2 |
Natural and efficient TTS in Catalan: 🍵+🥑 .
|
3 |
|
4 |
+
Here you can find all the information regarding our models 🍵 Matxa and 🥑 alVoCat, which have been trained with the use of deep learning. If you want specific information on how to train these model you can find it [here](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) and [here](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectively. The code we've used is also on Github [here](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
|
5 |
|
6 |
## Table of Contents
|
7 |
<details>
|
infer_onnx.py
CHANGED
@@ -213,6 +213,9 @@ You can synthesize test sentences below and check the technical details in the "
|
|
213 |
with open("about.md", "r", encoding="utf-8") as f:
|
214 |
about = f.read()
|
215 |
|
|
|
|
|
|
|
216 |
article = "Training and demo by The Language Technologies Unit from Barcelona Supercomputing Center."
|
217 |
|
218 |
|
@@ -262,17 +265,18 @@ matcha_inference = gr.Interface(
|
|
262 |
info=f"Controls speech pace, larger values for slower pace and smaller values for faster pace",
|
263 |
),
|
264 |
],
|
265 |
-
outputs=[gr.Audio(label="
|
266 |
)
|
267 |
|
268 |
-
|
|
|
269 |
|
270 |
demo = gr.Blocks(theme=theme, css="./styles.css")
|
271 |
|
272 |
with demo:
|
273 |
gr.Markdown(title)
|
274 |
gr.Markdown(description)
|
275 |
-
gr.TabbedInterface([matcha_inference,
|
276 |
accent_dropdown.select(fn=rs_change, inputs=accent_dropdown, outputs=speaker_dropdown)
|
277 |
gr.Markdown(article)
|
278 |
|
|
|
213 |
with open("about.md", "r", encoding="utf-8") as f:
|
214 |
about = f.read()
|
215 |
|
216 |
+
with open("informacio.md", "r", encoding="utf-8") as f:
|
217 |
+
informacio = f.read()
|
218 |
+
|
219 |
article = "Training and demo by The Language Technologies Unit from Barcelona Supercomputing Center."
|
220 |
|
221 |
|
|
|
265 |
info=f"Controls speech pace, larger values for slower pace and smaller values for faster pace",
|
266 |
),
|
267 |
],
|
268 |
+
outputs=[gr.Audio(label="Matxa + alVoCat", interactive=False, type="filepath")]
|
269 |
)
|
270 |
|
271 |
+
about_tab = gr.Markdown(about)
|
272 |
+
informacio_tab = gr.Markdown(informacio)
|
273 |
|
274 |
demo = gr.Blocks(theme=theme, css="./styles.css")
|
275 |
|
276 |
with demo:
|
277 |
gr.Markdown(title)
|
278 |
gr.Markdown(description)
|
279 |
+
gr.TabbedInterface([matcha_inference, about_tab, informacio_tab], ["Demo", "About", "Informació"])
|
280 |
accent_dropdown.select(fn=rs_change, inputs=accent_dropdown, outputs=speaker_dropdown)
|
281 |
gr.Markdown(article)
|
282 |
|
about_català.md → informacio.md
RENAMED
@@ -1,7 +1,7 @@
|
|
1 |
## 📄 Sobre
|
2 |
TTS natural i eficient en català: utilitzant Matcha-TTS amb la llengua catalana.
|
3 |
|
4 |
-
Aquí trobaràs tota la informació sobre els nostres models Matxa
|
5 |
|
6 |
## Taula de continguts
|
7 |
<details>
|
@@ -22,12 +22,14 @@ Aquí trobaràs tota la informació sobre els nostres models Matxa 🍵 i alVoCa
|
|
22 |
|
23 |
La importància de les tecnologies de text-a-veu (TTS) de codi obert per a les llengües minoritàries mai és exagerada. Aquestes tecnologies democratitzen l'accés a les solucions de TTS, proporcionant un marc perquè les comunitats desenvolupin i adapten models segons les seves necessitats lingüístiques. Per això, utilitzant un conjunt de tecnologies, hem desenvolupat diferents solucions de TTS de codi obert i en català.
|
24 |
|
25 |
-
|
26 |
|
27 |
* Balear
|
28 |
-
*
|
|
|
29 |
* Valencià
|
30 |
|
|
|
31 |
|
32 |
## Usos previstos i limitacions
|
33 |
|
@@ -276,7 +278,11 @@ Per a més informació, si us plau, envia un correu electrònic a <langtech@bsc.
|
|
276 |
Copyright(c) 2023 by Language Technologies Unit, Barcelona Supercomputing Center.
|
277 |
|
278 |
### Llicència
|
279 |
-
[
|
|
|
|
|
280 |
|
281 |
### Finançament
|
282 |
-
Aquest treball ha estat promogut i finançat per la Generalitat de Catalunya a través del [Projecte Aina](https://projecteaina.cat/).
|
|
|
|
|
|
1 |
## 📄 Sobre
|
2 |
TTS natural i eficient en català: utilitzant Matcha-TTS amb la llengua catalana.
|
3 |
|
4 |
+
Aquí trobaràs tota la informació sobre els nostres models 🍵 Matxa i 🥑 alVoCat ,els quals han estat entrenats amb l'ús de l'aprenentatge profund. Si desitges informació específica sobre com entrenar aquests models, pots trobar-la [aquí](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) i [aquí](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectivament. El codi que hem utilitzat també es troba a Github [aquí](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
|
5 |
|
6 |
## Taula de continguts
|
7 |
<details>
|
|
|
22 |
|
23 |
La importància de les tecnologies de text-a-veu (TTS) de codi obert per a les llengües minoritàries mai és exagerada. Aquestes tecnologies democratitzen l'accés a les solucions de TTS, proporcionant un marc perquè les comunitats desenvolupin i adapten models segons les seves necessitats lingüístiques. Per això, utilitzant un conjunt de tecnologies, hem desenvolupat diferents solucions de TTS de codi obert i en català.
|
24 |
|
25 |
+
Us presentem 🍵 Matxa, el primer model TTS neuronal multiparlant i multidialectal. Es combina amb el model vocoder 🥑 alVoCat, per generar unes veus expressives i d'alta qualitat, a més que funciona de una manera eficient en quatre dialectes:
|
26 |
|
27 |
* Balear
|
28 |
+
* Central
|
29 |
+
* Nord-occidental
|
30 |
* Valencià
|
31 |
|
32 |
+
Tots dos models s'ha entrenat amb dades obertes;🍵 Els models Matxa són lliures per utilitzar-los amb finalitats no comercials, però per l'ús comercial necessita una llicència directament del locutor/de la locutora. Per obtenir més informació, consulteu la secció [Llicència](#informació-adicional) i la [pàgina del model](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent/).
|
33 |
|
34 |
## Usos previstos i limitacions
|
35 |
|
|
|
278 |
Copyright(c) 2023 by Language Technologies Unit, Barcelona Supercomputing Center.
|
279 |
|
280 |
### Llicència
|
281 |
+
Aquesta pàgina de demostració i els scripts d'inferència es troben sota [GNU General Public License v3.0](https://www.gnu.org/licenses/gpl-3.0.en.html)
|
282 |
+
|
283 |
+
Els pesos del model tenen la llicència [Creative Commons Attribution Non-comercial 4.0](https://www.creativecommons.org/licenses/by-nc/4.0/). Aquests models són lliures per l'ús no comercial i d'investigació. L'ús comercial és possible mitjançant una llicència directe amb el locutor/la locutora. Per a més informació, contacteu amb <[email protected]> i <[email protected]>. Per obtenir més informació, consulteu la [pàgina del model](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent/).
|
284 |
|
285 |
### Finançament
|
286 |
+
Aquest treball ha estat promogut i finançat per la Generalitat de Catalunya a través del [Projecte Aina](https://projecteaina.cat/).
|
287 |
+
|
288 |
+
Una part de l'entrenament dels models va ser possible gràcies al temps de comput proporcionat pel [Centro de Supercomputación de Galicia (CESGA)](https://www.cesga.es/) i també pel [Barcelona Supercomputing Center](https://www.bsc.es/) amb el seu MareNostrum 5.
|