Spaces:

sob111
/

xtts-castellano

Runtime error

App Files Files Community

sob111 commited on Sep 5

Commit

c746161

verified ·

1 Parent(s): 92a548d

Update finetune_xtts_hf.py

Browse files

Files changed (1) hide show

finetune_xtts_hf.py +26 -42

finetune_xtts_hf.py CHANGED Viewed

@@ -1,58 +1,41 @@
 import os
-import subprocess
-import json
 from huggingface_hub import HfApi, HfFolder
-from datasets import load_dataset
 # === Configuración ===
-HF_TOKEN = os.environ.get("HF_TOKEN")  # define en los Secrets del Space
 HF_REPO_ID = "sob111/xttsv2-es-finetuned"  # tu repo de destino
 OUTPUT_PATH = "/tmp/output_model"
-CONFIG_PATH = "./config.json"
-# === Guardar token de Hugging Face ===
-print("=== Guardando token de Hugging Face ===")
-HfFolder.save_token(HF_TOKEN)
-# === Descargar dataset desde Hugging Face ===
-# print("=== Descargando dataset sob111/voxpopuli_es_500 ===")
-# ds = load_dataset("sob111/voxpopuli_es_500", split="train", token=HF_TOKEN)
-# Guardar metadata.json en el formato esperado por Coqui TTS
-# os.makedirs("/tmp/voxpopuli_es_500/wav_data", exist_ok=True)
-# meta_file = "/tmp/voxpopuli_es_500/metadata.json"
-# with open(meta_file, "w", encoding="utf-8") as f:
-#     for i, sample in enumerate(ds):
-        # Guardar cada audio en wav_data
-#        audio_path = f"/tmp/voxpopuli_es_500/wav_data/sample_{i}.wav"
-#        array = sample["audio"]["array"]
-#        import soundfile as sf
-#        sf.write(audio_path, array, sample["audio"]["sampling_rate"])
-#        entry = {
-#            "audio_file": audio_path,
-#            "text": sample.get("text") or sample.get("sentence", ""),
-#            "speaker_name": str(sample.get("speaker_id", "speaker"))
-#        }
-#        f.write(json.dumps(entry, ensure_ascii=False) + "\n")
-# print("✅ Metadata guardada en {meta_file}")
 # === Entrenamiento XTTSv2 ===
 print("=== Iniciando entrenamiento XTTSv2 ===")
-# Importante: usa el binario oficial de train del paquete TTS
-# y pasa sólo el config. No uses rutas a 'recipes/...'
 try:
-    subprocess.run(
-    [
-        "python",
-        "/home/user/TTS/bin/train.py",
-        "--config_path", CONFIG_PATH
-    ],
-    check=True
-)
-except subprocess.CalledProcessError as e:
     raise RuntimeError("❌ El entrenamiento XTTSv2 falló. Revisa los logs anteriores.") from e
 print("=== Entrenamiento finalizado ===")
@@ -68,6 +51,7 @@ api.upload_folder(
     token=HF_TOKEN
 )
-print("✅ Fine-tuning completado y subido a {HF_REPO_ID}")

 import os
 from huggingface_hub import HfApi, HfFolder
+from TTS.train import train  # API oficial de entrenamiento en v0.22+
+import json
 # === Configuración ===
+HF_TOKEN = os.environ.get("HF_TOKEN")  # definir en los Secrets del Space
+if not HF_TOKEN:
+    raise RuntimeError("Falta HF_TOKEN en los Secrets del Space.")
 HF_REPO_ID = "sob111/xttsv2-es-finetuned"  # tu repo de destino
+CONFIG_PATH = os.path.join(os.getcwd(), "config.json")
 OUTPUT_PATH = "/tmp/output_model"
+# Dataset local
+DATA_DIR = "/tmp/voxpopuli_es_500"
+META_TRAIN = os.path.join(DATA_DIR, "metadata.json")
+AUDIO_DIR = os.path.join(DATA_DIR, "wav_data")
+# === Validar dataset ===
+print("=== Comprobando dataset local ===")
+#if not os.path.isfile(META_TRAIN):
+#    raise FileNotFoundError(f"No se encontró {META_TRAIN}.")
+#if not os.path.isdir(AUDIO_DIR):
+#    raise FileNotFoundError(f"No se encontró el directorio {AUDIO_DIR}.")
+num_lines = sum(1 for _ in open(META_TRAIN, "r", encoding="utf-8"))
+print(f"metadata.json: {num_lines} líneas")
+# === Guardar token de Hugging Face ===
+print("=== Guardando token de Hugging Face ===")
+HfFolder.save_token(HF_TOKEN)
 # === Entrenamiento XTTSv2 ===
 print("=== Iniciando entrenamiento XTTSv2 ===")
 try:
+    train(config_path=CONFIG_PATH)
+except Exception as e:
     raise RuntimeError("❌ El entrenamiento XTTSv2 falló. Revisa los logs anteriores.") from e
 print("=== Entrenamiento finalizado ===")
     token=HF_TOKEN
 )
+print(f"✅ Fine-tuning completado y subido a {HF_REPO_ID}")