ANYANTUDRE commited on
Commit
701a921
·
1 Parent(s): eaf8753

ameliorations code & texte

Browse files
Files changed (2) hide show
  1. app.py +11 -7
  2. goai_helpers/goai_ttt_tts_pipeline.py +1 -1
app.py CHANGED
@@ -81,7 +81,7 @@ goai_ttt_tts_pipeline_if = gr.Interface(
81
  fn=goai_ttt_tts_pipeline.goai_ttt_tts,
82
  inputs=[
83
  gr.Text(
84
- label="Texte à traduire",
85
  lines=3,
86
  value="Par cette ouverture, le centre se veut contribuer à la formation professionnelle des jeunes et des femmes, renforcer les capacités des acteurs du monde agricole, et contribuer à la lutte contre le chômage au Burkina Faso."
87
  ),
@@ -96,13 +96,13 @@ goai_ttt_tts_pipeline_if = gr.Interface(
96
  value="exple_voix_masculine.wav"
97
  ),
98
  gr.Audio(
99
- label="Cloner votre voix (optionel)",
100
  type="numpy",
101
  format="wav"
102
  ),
103
  ],
104
  outputs=[
105
- gr.Text(label="Texte traduit"),
106
  gr.Audio(label="Audio généré", format="wav"),
107
  ],
108
  examples=[["Ils vont bien, merci. Mon père travaille dur dans les champs et ma mère est toujours occupée à la maison.", "exple_voix_masculine.wav", "ArissBandoss/coqui-tts-moore-V1"],
@@ -119,7 +119,11 @@ goai_ttt_tts_pipeline_if = gr.Interface(
119
  goai_stt_ttt_pipeline_if = gr.Interface(
120
  fn=goai_stt_ttt_pipeline.goai_stt_ttt,
121
  inputs=[
122
- gr.Audio(sources=["microphone", "upload"], type="filepath"),
 
 
 
 
123
  gr.Dropdown(
124
  label="Modèles d'ASR",
125
  choices=MODELES_ASR,
@@ -128,7 +132,7 @@ goai_stt_ttt_pipeline_if = gr.Interface(
128
  gr.Dropdown(
129
  choices=LANGUAGES,
130
  value="Automatic Detection", # + sorted(get_language_names())
131
- label="Language",
132
  interactive = True,
133
  ),
134
  gr.Slider(label="Batch Size", minimum=1, maximum=32, value=8, step=1),
@@ -136,8 +140,8 @@ goai_stt_ttt_pipeline_if = gr.Interface(
136
  gr.Slider(label="Stride Length (s)", minimum=1, maximum=30, value=1, step=0.1),
137
  ],
138
  outputs=[
139
- gr.Textbox(label="Texte Mooré"),
140
- gr.Textbox(label="Texte Francais"),
141
  ],
142
  examples=[["./audios/example1.mp3", "ArissBandoss/whisper-small-mos"],
143
  ["./audios/example2.mp3", "ArissBandoss/whisper-small-mos"],
 
81
  fn=goai_ttt_tts_pipeline.goai_ttt_tts,
82
  inputs=[
83
  gr.Text(
84
+ label="Texte à traduire (en Francais)",
85
  lines=3,
86
  value="Par cette ouverture, le centre se veut contribuer à la formation professionnelle des jeunes et des femmes, renforcer les capacités des acteurs du monde agricole, et contribuer à la lutte contre le chômage au Burkina Faso."
87
  ),
 
96
  value="exple_voix_masculine.wav"
97
  ),
98
  gr.Audio(
99
+ label="Cloner votre voix (optionel et uniquement pour le 1er modèle proposé)",
100
  type="numpy",
101
  format="wav"
102
  ),
103
  ],
104
  outputs=[
105
+ gr.Text(label="Texte traduit (en Mooré)"),
106
  gr.Audio(label="Audio généré", format="wav"),
107
  ],
108
  examples=[["Ils vont bien, merci. Mon père travaille dur dans les champs et ma mère est toujours occupée à la maison.", "exple_voix_masculine.wav", "ArissBandoss/coqui-tts-moore-V1"],
 
119
  goai_stt_ttt_pipeline_if = gr.Interface(
120
  fn=goai_stt_ttt_pipeline.goai_stt_ttt,
121
  inputs=[
122
+ gr.Audio(
123
+ sources=["microphone", "upload"],
124
+ type="filepath",
125
+ label="Audio Mooré",
126
+ ),
127
  gr.Dropdown(
128
  label="Modèles d'ASR",
129
  choices=MODELES_ASR,
 
132
  gr.Dropdown(
133
  choices=LANGUAGES,
134
  value="Automatic Detection", # + sorted(get_language_names())
135
+ label="Langue (Mooré)",
136
  interactive = True,
137
  ),
138
  gr.Slider(label="Batch Size", minimum=1, maximum=32, value=8, step=1),
 
140
  gr.Slider(label="Stride Length (s)", minimum=1, maximum=30, value=1, step=0.1),
141
  ],
142
  outputs=[
143
+ gr.Textbox(label="Texte transcrit (en Mooré)"),
144
+ gr.Textbox(label="Texte traduit (Francais)"),
145
  ],
146
  examples=[["./audios/example1.mp3", "ArissBandoss/whisper-small-mos"],
147
  ["./audios/example2.mp3", "ArissBandoss/whisper-small-mos"],
goai_helpers/goai_ttt_tts_pipeline.py CHANGED
@@ -61,7 +61,7 @@ def goai_ttt_tts(
61
 
62
  # 2. TTS: Text to Speech
63
  sample_rate, audio_data = goai_many_tts(
64
- text,
65
  tts_model,
66
  reference_speaker,
67
  reference_audio=reference_audio,
 
61
 
62
  # 2. TTS: Text to Speech
63
  sample_rate, audio_data = goai_many_tts(
64
+ mos_text,
65
  tts_model,
66
  reference_speaker,
67
  reference_audio=reference_audio,