glaswegian-tts-demo

Runtime error

divakaivan commited on May 18, 2024

Commit

e153529

verified ·

1 Parent(s): 3e188e1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -137,10 +137,11 @@ def predict(text, speaker):
     ### ### ###
     example = dataset['test'][11]
-    speaker_embedding = torch.tensor(example["speaker_embeddings"]).unsqueeze(0)
-    speaker_embedding = torch.tensor(speaker_embedding).unsqueeze(0)
-    spectrogram = model.generate_speech(inputs["input_ids"], speaker_embedding)
     with torch.no_grad():
         speech = vocoder(spectrogram)
     # speech = model.generate_speech(input_ids, speaker_embedding, vocoder=vocoder)

     ### ### ###
     example = dataset['test'][11]
+    # speaker_embedding = torch.tensor(example["speaker_embeddings"]).unsqueeze(0)
+    speaker_embedding = speaker_embedding.expand(-1, inputs["input_ids"].size(1), -1)
+    spectrogram = model.generate_speech(inputs["input_ids"].to(device), speaker_embedding)
+    # speaker_embedding = torch.tensor(speaker_embedding).unsqueeze(0)
+    # spectrogram = model.generate_speech(inputs["input_ids"], speaker_embedding)
     with torch.no_grad():
         speech = vocoder(spectrogram)
     # speech = model.generate_speech(input_ids, speaker_embedding, vocoder=vocoder)