firstpixel/F5-TTS-pt-br · Audio coming out as Gibberish

Apr 28

Fala @firstpixel , muito obrigado por ter feito o treinamento e disponibilizado.
Cara, por favor me ajuda, estou tentando fazer troubleshoot há alguns dias, e embora o modelo funcione, o audio sai tipo "gibberish", ja tentei varios vocab.txt (russo, espanhol e o original Emilia_ZH_EN_pinyin), eles saem diferente, mas todos gibberish. Tentei o safetensors model e o model_last.pt

Ate fiz minha proprio script rodando com infer-cli, mas nada funciona, consegue me dar uma luz?

adrianobolder

May 5

When using the model, go to "custom" in the config and select the second option in dictionary form. Even if you set the correct path to the model and vocabulary, it won’t work if you try to use it directly with F5-TTS_V1. That model was trained on a version prior to V1 — at least that's what I noticed. If I’m wrong, feel free to correct me. But this method worked for me.

quando for usar o modelo vá em custom em config: in a dictionay form use a segunda opção. sabendo que colocou o caminho correto do modelo e vocabulário, não funciona se usar ele direto no F5-TTS_V1 esse modelo aqui foi treinado na versão anterior antes da v1, foi isso que percebi se eu estiver errado alguém me corrija. Para mim funcionou assim.

firstpixel

Owner 4 days ago

A versao que utilizei do F5-TTS pode ser encontrada aqui:
https://github.com/firstpixel/F5-TTS