Spaces:

XA-vito
/

IAColmenas

Sleeping

XA-vito commited on Feb 10

Commit

2dcb03b

verified ·

1 Parent(s): caa40b5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,3 @@
 import accelerate
 import gradio as gr
 import joblib
@@ -33,10 +29,6 @@ model = AutoModelForCausalLM.from_pretrained(
     token=HF_TOKEN
 )
 # Memoria conversacional
 memory = ConversationBufferMemory()
@@ -100,27 +92,26 @@ def conversar_con_colmena(mensaje):
     print(f"🔄 Enviando entrada al modelo: {contexto}")  # 👈 Agrega este print para ver el contexto en consola
     with torch.no_grad():
-        output = model.generate(  # ✅ Correctamente indentado
             **inputs,
             max_length=150,  # Reduce el tamaño máximo para evitar que se quede colgado
             do_sample=True,   # Sampling activado para más variabilidad
             top_k=50,         # Controla la aleatoriedad para evitar salidas vacías
             temperature=0.7,  # Ajusta la creatividad de la respuesta
             pad_token_id=tokenizer.eos_token_id  # Evita errores de padding
-        )  # ✅ Paréntesis correctamente cerrado
-# Decodificar la salida del modelo
-respuesta = tokenizer.decode(output[0], skip_special_tokens=True).strip()
-# Imprimir la respuesta generada para depuración
-print(f"✅ Respuesta generada por la IA: '{respuesta}'")  # 👈 Para ver si está vacío
-# Manejo de respuestas vacías
-if not respuesta:
-    return "🤖 No pude generar una respuesta. Inténtalo de nuevo con otra pregunta."
 iface = gr.Interface(
     fn=conversar_con_colmena,
@@ -133,3 +124,8 @@ iface = gr.Interface(
 iface.launch()

 import accelerate
 import gradio as gr
 import joblib
     token=HF_TOKEN
 )
 # Memoria conversacional
 memory = ConversationBufferMemory()
     print(f"🔄 Enviando entrada al modelo: {contexto}")  # 👈 Agrega este print para ver el contexto en consola
     with torch.no_grad():
+        output = model.generate(
             **inputs,
             max_length=150,  # Reduce el tamaño máximo para evitar que se quede colgado
             do_sample=True,   # Sampling activado para más variabilidad
             top_k=50,         # Controla la aleatoriedad para evitar salidas vacías
             temperature=0.7,  # Ajusta la creatividad de la respuesta
             pad_token_id=tokenizer.eos_token_id  # Evita errores de padding
+        )
+    # Decodificar la salida del modelo
+    respuesta = tokenizer.decode(output[0], skip_special_tokens=True).strip()
+    # Imprimir la respuesta generada para depuración
+    print(f"✅ Respuesta generada por la IA: '{respuesta}'")  # 👈 Para ver si está vacío
+    # Manejo de respuestas vacías
+    if not respuesta:
+        return "🤖 No pude generar una respuesta. Inténtalo de nuevo con otra pregunta."
+    return respuesta  # ✅ SOLUCIÓN 1 IMPLEMENTADA (Se retorna la respuesta)
 iface = gr.Interface(
     fn=conversar_con_colmena,
 iface.launch()