proyectofinal / estructura.txt
longobardomartin's picture
revision
d669120
Primera parte (Generar la base de conocimiento):
-Partimos de una lista urls de videos de youtube.
-Descargamos los videos (tmp).
-Extraer el texto de cada video (txt).
-Romper los textos, vectorizar y almacenar en la bbdd vectorial (Metadata: Texto, url, tema...).
Segunda parte (Generar el Router):
-Router que:
-Si la pregunta est谩 relacionada:
-Entra en acci贸n nuestro Agente*.
-Si no tiene nada que ver con la tem谩tica:
-Inicialmente cierra la conversaci贸n pero idealmente deber铆a de hacer una b煤squeda en Google.
Tercera parte (Generar el Agente)*:
-Localizar los fragmentos de transcripciones m谩s relevantes.
-(Extra) Resume todos los fragmentos de texto relevantes.
-Realizar la consulta con el contexto.
-Devolver la respuesta.
Cuarta parte (Llevar un hilo de la conversaci贸n persistencia con el usuario):
-? IDs de usuario.
Quinta parte (Despliegue de la Interfaz):
-Definir lo que queremos que el usuario vea (estilo conversaci贸n).
-Implementarlo en Gradio.
-Alojar el servicio.
Sexta parte (Readme y presentaci贸n).
TODO:
webapp.py
-Hacer que el texto del input box se elimine tras pulsar enter.
rotuer_chain.py
-A帽adir al menos una cadena adicional al router
*PDFs, Libros...