ayuda urgente, a cualquiera de ustedes

#18
by carlosgfhg - opened

ayuda, actualmente no funciona el modelo F5-TTS en pinokio, ya que el modelo cambio con la última actualización paso del archivo "model_1200000.safetensors" al "model_1250000.safetensors" sabes que podemos hacer?

De forma sencilla puedes buscar el archivo en tu pc y cambiar el nombre del nuevo archivo por el viejo

@carlosgfhg Agradezco si has encontrado la solución, por mas que re nombro el archivo, y descargo el "model_1200000.safetensors" y cambio de rutas no es posible al ejecutar el modelo descarga el "model_1250000.safetensors" eh realizado varias modificaciones pero no logro entender la verdad, agradecería cualquier ayuda...
de antemano muchas gracias.

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Hola. ya lo descargue y probé, encontré que al usar model "F5TTSv1" en ""choose tts model" da el error en el audio, pero cambie a "Custom" y seleccione estos settings, volviendo a lograr generar en español.

Captura de pantalla 2025-03-26 a las 3.15.29 p.m..png

@jpgallegoar Agradezco mucho su ayuda, realice estas pruebas con anterioridad, con el archivo renombrado no descarga el modelo predeterminado, pero el audio generado no es correcto. revisare mi instalación del modelo de manera minuciosa para descartar errores de mi parte, aunque la versión predetermina en ingles cualquier generación de audio es correcta...

Adjunto audio generado con el modelo que usted, re nombro en sus archivos.

@Irvinrobledo Gracias, en efecto con lo que comentas funciona la generación de audio en español.

Hola no logro hacer funcionar este pack con la nueva version 1250000, cual seria la solucion al caso? renombrar la version anterior solo basta?

@Irvinrobledo Gracias, en efecto con lo que comentas funciona la generación de audio en español.

trsitemente solo me funciono unas veces con una voz de hombre, despues ya no.. y con otras voces (mujer) tampoco. Esperemos que @jpgallegoar pueda platicarnos como lograr usarlo correctamente con la actualizacion. Gracias!

Hola, lamentablemente yo no mantengo el pinokio ni el F5 original. Mi espacio sigue estando abierto y se puede clonar a local. No sé por qué no funciona, yo no hice nada.

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Hola. ya lo descargue y probé, encontré que al usar model "F5TTSv1" en ""choose tts model" da el error en el audio, pero cambie a "Custom" y seleccione estos settings, volviendo a lograr generar en español.

Captura de pantalla 2025-03-26 a las 3.15.29 p.m..png

esa es la solución al error en pinokio, debes de descargar el archivo "model_1250000.safetensors" lo sustituyes y en custom cambias lo que señalan y con eso funciona

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Hola. ya lo descargue y probé, encontré que al usar model "F5TTSv1" en ""choose tts model" da el error en el audio, pero cambie a "Custom" y seleccione estos settings, volviendo a lograr generar en español.

Captura de pantalla 2025-03-26 a las 3.15.29 p.m..png

gracias amigo esto sigue funcionando

HOLA YO ESTOY AMARGADO LLEVO DESDE LAS DOS DELA TARDE SON LAS DOCE DE LA NOCHE INTENTANDO QUE CHAGPT ME AYUDARA.. PERO NADA.. HICE LO QUE DECIAN.. IR A LA CARPETA PONER EL ARCHIVO DE 125000 Y RENOMBRAR EL OTRO CON TERMINACION .BAK PERO NAADA.. NO TENGO NARICES CUANDO PONGO EL CUSTOM... NO ME SALE COMO EN EL VIDEO TTS_SPANISH O COMO SE LLAME... NADA SE QUEDA EN EL QUE ESTGABA PUSE LA OTRA MODIFICACION DE LAS FOTOS PERO NADA... QUE FRUSTRACION MAS GRANDE PQ EN LA WEB DE HUGGENFICE SI FUNCIONA PERO CLARO.. LIMITE Y A PAGAR ¿PQ LA VIDA ES ASI DE CRUEL?

SEÑORES SI NO LES RULA BIEN PONGAN LA CONFIGURACION DE LA FOTO Y DESCARGUEN Y COPIEN EL ARCHIVO BOCA.TXT. AHORA SI ME ESTA FUNCIONANDO ESPERO LES SRIVA.
UN ABRAZO Y GRACIAS POR TODO, DIOS OS BENDIGA OS QUIERO A TODOS.

Hola Juan Pablo, me gustaria saber que puedo hacer para poder utilizar tu modelo en espanol para poder crear un audiolibro, gracias por tus aportes a la comunidad, saludos.

Hola Juan Pablo, me gustaria saber que puedo hacer para poder utilizar tu modelo en espanol para poder crear un audiolibro, gracias por tus aportes a la comunidad, saludos.

Hola, que yo sepa nadie ha implementado una herramienta para hacer eso. Habria que hacer una app custom por python que lea el pdf, se lo pase a una llm (gemini 2.5 flash por ejemplo) por trozos, la llm lo convierta a texto locutable, y pasarle eso al f5. A ver si alguien se anima a hacerla, se puede usar ChatGPT / Cursor para facilitar el trabajo, pero es sencilla de implementar.

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3.

Hola Juan Pablo, me gustaria saber que puedo hacer para poder utilizar tu modelo en espanol para poder crear un audiolibro, gracias por tus aportes a la comunidad, saludos.

Hola, que yo sepa nadie ha implementado una herramienta para hacer eso. Habria que hacer una app custom por python que lea el pdf, se lo pase a una llm (gemini 2.5 flash por ejemplo) por trozos, la llm lo convierta a texto locutable, y pasarle eso al f5. A ver si alguien se anima a hacerla, se puede usar ChatGPT / Cursor para facilitar el trabajo, pero es sencilla de implementar.

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3, btw, disculpa por el mensaje doble.

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3.

Si por mi genial, el problema es que hay datasets que tienen esa licencia y por ley cualquier modelo que salga de ellos debe tambien tenerla. Ahora de ahi a que alguien te persiga lo dudo mucho ;)

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3.

Si por mi genial, el problema es que hay datasets que tienen esa licencia y por ley cualquier modelo que salga de ellos debe tambien tenerla. Ahora de ahi a que alguien te persiga lo dudo mucho ;)

Hey, gracias! muy amable de tu parte, crees que sea mucha molestia me puedas enviar un correo con un poco de información para tener mas claridad ?

Hey, gracias! muy amable de tu parte, crees que sea mucha molestia me puedas enviar un correo con un poco de información para tener mas claridad ?

Escribeme [email protected]

Hola! Alguna forma de discriminar entre acentos? Quiero que hable mas argentino pero siempre termina teniendo un acento colombiano. Gracias!

Hola, lo que me funciono fue lo siguiente (uso Pinokio)

la segunda opcion

image.png

direcciones tanto para modelo y vocap

Modelo hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

Vocap hf://jpgallegoar/F5-Spanish/vocab.txt

la direccion que tengo pinokio y donde estan los modelos es: D:\pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\

en donde tengo la de espanol

image.png

por defecto me viene la de ingles cond el 1250000 asi:

hf://SWivid/F5-TTS/F5TTS_v1_Base/model_1250000.safetensors
hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

el nombre de la carpeta aparece como debes guiarte, ambos se agregan en estas 2 partes

image.png

modelo cargando

image.png

cheers

Hola, lo que me funciono fue lo siguiente (uso Pinokio)

la segunda opcion

image.png

direcciones tanto para modelo y vocap

Modelo hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

Vocap hf://jpgallegoar/F5-Spanish/vocab.txt

la direccion que tengo pinokio y donde estan los modelos es: D:\pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\

en donde tengo la de espanol

image.png

por defecto me viene la de ingles cond el 1250000 asi:

hf://SWivid/F5-TTS/F5TTS_v1_Base/model_1250000.safetensors
hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

el nombre de la carpeta aparece como debes guiarte, ambos se agregan en estas 2 partes

image.png

modelo cargando

image.png

cheers

Esta es la buena. funciono perfecto. Gracias.
Tomen en cuenta que es necesario reiniciar el modelo a cargar. A mi me funciono, reiniciar Pinokio, el e5, cambiarle al modelo E2, correr el modelo con una sintetizada, y luego volver a custom, de ahi funciona como la seda.

@regulus2000 @dom35 Sigue funcionando para ustedes con ese método? Hice las carpetas para el modelo en español, pero no sé cómo selecionarlas cuando debo cambiarlas en el modelo Custom. De antemano, agradezco su atención y ayuda!

image.png

D:\Pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\models--jpgallegoar--F5-Spanish\snapshots\84e5a410d9cead4de2f847e7c9369a6440bdfaca

Ahí guarde:

image.png

... esa carpeta 84e5a410d9cead4de2f847e7c9369a6440bdfaca la saqué de la que viene por default:

D:\Pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\models--SWivid--F5-TTS\snapshots\84e5a410d9cead4de2f847e7c9369a6440bdfaca\F5TTS_v1_Base

image.png

Qué paso omití para que pueda selecionar el modelo en español?
image.png

Hola @josafat si sigue funcionando, en la lista del drop down no te va a aparecer, debes Tu colocar la direccion, guiate como la tengo yo

avisa si te funciona

Sign up or log in to comment