File size: 1,272 Bytes
d669120
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Primera parte (Generar la base de conocimiento):
-Partimos de una lista urls de videos de youtube.
-Descargamos los videos (tmp).
-Extraer el texto de cada video (txt).
-Romper los textos, vectorizar y almacenar en la bbdd vectorial (Metadata: Texto, url, tema...).

Segunda parte (Generar el Router):
-Router que:
    -Si la pregunta est谩 relacionada:
        -Entra en acci贸n nuestro Agente*.
    -Si no tiene nada que ver con la tem谩tica:
        -Inicialmente cierra la conversaci贸n pero idealmente deber铆a de hacer una b煤squeda en Google.

Tercera parte (Generar el Agente)*:
    -Localizar los fragmentos de transcripciones m谩s relevantes.
    -(Extra) Resume todos los fragmentos de texto relevantes.
    -Realizar la consulta con el contexto.
    -Devolver la respuesta.

Cuarta parte (Llevar un hilo de la conversaci贸n persistencia con el usuario):
    -? IDs de usuario.

Quinta parte (Despliegue de la Interfaz):
    -Definir lo que queremos que el usuario vea (estilo conversaci贸n).
    -Implementarlo en Gradio.
    -Alojar el servicio.

Sexta parte (Readme y presentaci贸n).


TODO:
webapp.py
    -Hacer que el texto del input box se elimine tras pulsar enter.

rotuer_chain.py
    -A帽adir al menos una cadena adicional al router


*PDFs, Libros...