sob111 commited on
Commit
1e008e4
·
verified ·
1 Parent(s): eba6956

Create finetune_xtts_hf.py_old

Browse files
Files changed (1) hide show
  1. finetune_xtts_hf.py_old +54 -0
finetune_xtts_hf.py_old ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import os
2
+ from huggingface_hub import HfApi, HfFolder
3
+ from TTS.train import train # API oficial de entrenamiento en v0.22+
4
+ import json
5
+
6
+ # === Configuración ===
7
+ HF_TOKEN = os.environ.get("HF_TOKEN") # definir en los Secrets del Space
8
+ if not HF_TOKEN:
9
+ raise RuntimeError("Falta HF_TOKEN en los Secrets del Space.")
10
+
11
+ HF_REPO_ID = "sob111/xttsv2-es-finetuned" # tu repo de destino
12
+ CONFIG_PATH = os.path.join(os.getcwd(), "config.json")
13
+ OUTPUT_PATH = "/tmp/output_model"
14
+
15
+ # Dataset local
16
+ DATA_DIR = "/tmp/voxpopuli_es_500"
17
+ META_TRAIN = os.path.join(DATA_DIR, "metadata.json")
18
+ AUDIO_DIR = os.path.join(DATA_DIR, "wav_data")
19
+
20
+ # === Validar dataset ===
21
+ print("=== Comprobando dataset local ===")
22
+ #if not os.path.isfile(META_TRAIN):
23
+ # raise FileNotFoundError(f"No se encontró {META_TRAIN}.")
24
+ #if not os.path.isdir(AUDIO_DIR):
25
+ # raise FileNotFoundError(f"No se encontró el directorio {AUDIO_DIR}.")
26
+
27
+ num_lines = sum(1 for _ in open(META_TRAIN, "r", encoding="utf-8"))
28
+ print(f"metadata.json: {num_lines} líneas")
29
+
30
+ # === Guardar token de Hugging Face ===
31
+ print("=== Guardando token de Hugging Face ===")
32
+ HfFolder.save_token(HF_TOKEN)
33
+
34
+ # === Entrenamiento XTTSv2 ===
35
+ print("=== Iniciando entrenamiento XTTSv2 ===")
36
+ try:
37
+ train(config_path=CONFIG_PATH)
38
+ except Exception as e:
39
+ raise RuntimeError("❌ El entrenamiento XTTSv2 falló. Revisa los logs anteriores.") from e
40
+
41
+ print("=== Entrenamiento finalizado ===")
42
+
43
+ # === Subir modelo fine-tune a Hugging Face ===
44
+ print("=== Subiendo modelo fine-tune a Hugging Face ===")
45
+ api = HfApi()
46
+ api.create_repo(repo_id=HF_REPO_ID, exist_ok=True, token=HF_TOKEN)
47
+ api.upload_folder(
48
+ folder_path=OUTPUT_PATH,
49
+ repo_id=HF_REPO_ID,
50
+ repo_type="model",
51
+ token=HF_TOKEN
52
+ )
53
+
54
+ print(f"✅ Fine-tuning completado y subido a {HF_REPO_ID}")