jpgallegoar/F5-Spanish · ayuda urgente, a cualquiera de ustedes

Mar 21

ayuda, actualmente no funciona el modelo F5-TTS en pinokio, ya que el modelo cambio con la última actualización paso del archivo "model_1200000.safetensors" al "model_1250000.safetensors" sabes que podemos hacer?

GSaucedo

Mar 21

De forma sencilla puedes buscar el archivo en tu pc y cambiar el nombre del nuevo archivo por el viejo

maomotta

Mar 26

@carlosgfhg Agradezco si has encontrado la solución, por mas que re nombro el archivo, y descargo el "model_1200000.safetensors" y cambio de rutas no es posible al ejecutar el modelo descarga el "model_1250000.safetensors" eh realizado varias modificaciones pero no logro entender la verdad, agradecería cualquier ayuda...
de antemano muchas gracias.

jpgallegoar

Owner Mar 26

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Irvinrobledo

Mar 26

•

edited Mar 26

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Hola. ya lo descargue y probé, encontré que al usar model "F5TTSv1" en ""choose tts model" da el error en el audio, pero cambie a "Custom" y seleccione estos settings, volviendo a lograr generar en español.

maomotta

Mar 26

@jpgallegoar Agradezco mucho su ayuda, realice estas pruebas con anterioridad, con el archivo renombrado no descarga el modelo predeterminado, pero el audio generado no es correcto. revisare mi instalación del modelo de manera minuciosa para descartar errores de mi parte, aunque la versión predetermina en ingles cualquier generación de audio es correcta...

Adjunto audio generado con el modelo que usted, re nombro en sus archivos.

maomotta

Mar 26

@Irvinrobledo Gracias, en efecto con lo que comentas funciona la generación de audio en español.

Oscarcete2025

Apr 1

Hola no logro hacer funcionar este pack con la nueva version 1250000, cual seria la solucion al caso? renombrar la version anterior solo basta?

Irvinrobledo

Apr 1

@Irvinrobledo Gracias, en efecto con lo que comentas funciona la generación de audio en español.

trsitemente solo me funciono unas veces con una voz de hombre, despues ya no.. y con otras voces (mujer) tampoco. Esperemos que @jpgallegoar pueda platicarnos como lograr usarlo correctamente con la actualizacion. Gracias!

jpgallegoar

Owner Apr 9

Hola, lamentablemente yo no mantengo el pinokio ni el F5 original. Mi espacio sigue estando abierto y se puede clonar a local. No sé por qué no funciona, yo no hice nada.

franksone

about 1 month ago

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Hola. ya lo descargue y probé, encontré que al usar model "F5TTSv1" en ""choose tts model" da el error en el audio, pero cambie a "Custom" y seleccione estos settings, volviendo a lograr generar en español.

esa es la solución al error en pinokio, debes de descargar el archivo "model_1250000.safetensors" lo sustituyes y en custom cambias lo que señalan y con eso funciona

adriey

26 days ago

Puedes volver a probar? he duplicado el archivo y llamado model_1250000.safetensors a ver si se te arregla

Hola. ya lo descargue y probé, encontré que al usar model "F5TTSv1" en ""choose tts model" da el error en el audio, pero cambie a "Custom" y seleccione estos settings, volviendo a lograr generar en español.

gracias amigo esto sigue funcionando

sloukenflouek

25 days ago

•

edited 25 days ago

HOLA YO ESTOY AMARGADO LLEVO DESDE LAS DOS DELA TARDE SON LAS DOCE DE LA NOCHE INTENTANDO QUE CHAGPT ME AYUDARA.. PERO NADA.. HICE LO QUE DECIAN.. IR A LA CARPETA PONER EL ARCHIVO DE 125000 Y RENOMBRAR EL OTRO CON TERMINACION .BAK PERO NAADA.. NO TENGO NARICES CUANDO PONGO EL CUSTOM... NO ME SALE COMO EN EL VIDEO TTS_SPANISH O COMO SE LLAME... NADA SE QUEDA EN EL QUE ESTGABA PUSE LA OTRA MODIFICACION DE LAS FOTOS PERO NADA... QUE FRUSTRACION MAS GRANDE PQ EN LA WEB DE HUGGENFICE SI FUNCIONA PERO CLARO.. LIMITE Y A PAGAR ¿PQ LA VIDA ES ASI DE CRUEL?

sloukenflouek

25 days ago

SEÑORES SI NO LES RULA BIEN PONGAN LA CONFIGURACION DE LA FOTO Y DESCARGUEN Y COPIEN EL ARCHIVO BOCA.TXT. AHORA SI ME ESTA FUNCIONANDO ESPERO LES SRIVA.
UN ABRAZO Y GRACIAS POR TODO, DIOS OS BENDIGA OS QUIERO A TODOS.

da1dotsh

25 days ago

Hola Juan Pablo, me gustaria saber que puedo hacer para poder utilizar tu modelo en espanol para poder crear un audiolibro, gracias por tus aportes a la comunidad, saludos.

jpgallegoar

Owner 25 days ago

Hola Juan Pablo, me gustaria saber que puedo hacer para poder utilizar tu modelo en espanol para poder crear un audiolibro, gracias por tus aportes a la comunidad, saludos.

Hola, que yo sepa nadie ha implementado una herramienta para hacer eso. Habria que hacer una app custom por python que lea el pdf, se lo pase a una llm (gemini 2.5 flash por ejemplo) por trozos, la llm lo convierta a texto locutable, y pasarle eso al f5. A ver si alguien se anima a hacerla, se puede usar ChatGPT / Cursor para facilitar el trabajo, pero es sencilla de implementar.

da1dotsh

25 days ago

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3.

da1dotsh

25 days ago

•

edited 25 days ago

Hola Juan Pablo, me gustaria saber que puedo hacer para poder utilizar tu modelo en espanol para poder crear un audiolibro, gracias por tus aportes a la comunidad, saludos.

Hola, que yo sepa nadie ha implementado una herramienta para hacer eso. Habria que hacer una app custom por python que lea el pdf, se lo pase a una llm (gemini 2.5 flash por ejemplo) por trozos, la llm lo convierta a texto locutable, y pasarle eso al f5. A ver si alguien se anima a hacerla, se puede usar ChatGPT / Cursor para facilitar el trabajo, pero es sencilla de implementar.

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3, btw, disculpa por el mensaje doble.

jpgallegoar

Owner 25 days ago

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3.

Si por mi genial, el problema es que hay datasets que tienen esa licencia y por ley cualquier modelo que salga de ellos debe tambien tenerla. Ahora de ahi a que alguien te persiga lo dudo mucho ;)

da1dotsh

25 days ago

Como tal, pensaba arreglarmelas como pudiera de forma manual, pero tengo entendido que tu modelo es para uso no comercial, por ello mismo, quisiera saber si podria tener tu permiso para utilizarlo para hacer un audiolibro que pueda vender, si en el camino debo desarrollar alguna herramienta en python o algun workflow que permita la normalizacion del texto, puedo hacerlo con mucho gusto MIT o GPLv3.

Si por mi genial, el problema es que hay datasets que tienen esa licencia y por ley cualquier modelo que salga de ellos debe tambien tenerla. Ahora de ahi a que alguien te persiga lo dudo mucho ;)

Hey, gracias! muy amable de tu parte, crees que sea mucha molestia me puedas enviar un correo con un poco de información para tener mas claridad ?

jpgallegoar

Owner 25 days ago

Hey, gracias! muy amable de tu parte, crees que sea mucha molestia me puedas enviar un correo con un poco de información para tener mas claridad ?

Escribeme [email protected]

Saruman

18 days ago

Hola! Alguna forma de discriminar entre acentos? Quiero que hable mas argentino pero siempre termina teniendo un acento colombiano. Gracias!

dom35

8 days ago

Hola, lo que me funciono fue lo siguiente (uso Pinokio)

la segunda opcion

direcciones tanto para modelo y vocap

Modelo hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

Vocap hf://jpgallegoar/F5-Spanish/vocab.txt

la direccion que tengo pinokio y donde estan los modelos es: D:\pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\

en donde tengo la de espanol

por defecto me viene la de ingles cond el 1250000 asi:

hf://SWivid/F5-TTS/F5TTS_v1_Base/model_1250000.safetensors
hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

el nombre de la carpeta aparece como debes guiarte, ambos se agregan en estas 2 partes

modelo cargando

cheers

regulus2000

5 days ago

Hola, lo que me funciono fue lo siguiente (uso Pinokio)

la segunda opcion

direcciones tanto para modelo y vocap

Modelo hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

Vocap hf://jpgallegoar/F5-Spanish/vocab.txt

la direccion que tengo pinokio y donde estan los modelos es: D:\pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\

en donde tengo la de espanol

por defecto me viene la de ingles cond el 1250000 asi:

hf://SWivid/F5-TTS/F5TTS_v1_Base/model_1250000.safetensors
hf://jpgallegoar/F5-Spanish/model_1200000.safetensors

el nombre de la carpeta aparece como debes guiarte, ambos se agregan en estas 2 partes

modelo cargando

cheers

Esta es la buena. funciono perfecto. Gracias.
Tomen en cuenta que es necesario reiniciar el modelo a cargar. A mi me funciono, reiniciar Pinokio, el e5, cambiarle al modelo E2, correr el modelo con una sintetizada, y luego volver a custom, de ahi funciona como la seda.

josafat

4 days ago

@regulus2000 @dom35 Sigue funcionando para ustedes con ese método? Hice las carpetas para el modelo en español, pero no sé cómo selecionarlas cuando debo cambiarlas en el modelo Custom. De antemano, agradezco su atención y ayuda!

D:\Pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\models--jpgallegoar--F5-Spanish\snapshots\84e5a410d9cead4de2f847e7c9369a6440bdfaca

Ahí guarde:

... esa carpeta 84e5a410d9cead4de2f847e7c9369a6440bdfaca la saqué de la que viene por default:

D:\Pinokio\api\e2-f5-tts.git\cache\HF_HOME\hub\models--SWivid--F5-TTS\snapshots\84e5a410d9cead4de2f847e7c9369a6440bdfaca\F5TTS_v1_Base

Qué paso omití para que pueda selecionar el modelo en español?

dom35

1 day ago

Hola @josafat si sigue funcionando, en la lista del drop down no te va a aparecer, debes Tu colocar la direccion, guiate como la tengo yo

avisa si te funciona