OpenData-Bordeaux-IA-RSE

Sleeping

OpenData-Bordeaux-IA-RSE / chat_with_pps.py

Ilyas KHIAT

test

5f3c554 3 months ago

18.7 kB

	import streamlit as st
	from langchain_core.messages import AIMessage, HumanMessage
	from langchain_community.chat_models import ChatOpenAI
	from dotenv import load_dotenv
	from langchain_core.output_parsers import StrOutputParser
	from langchain_core.prompts import ChatPromptTemplate
	from langchain_mistralai.chat_models import ChatMistralAI
	from download_chart import construct_plot
	from prompt import get_prompts_list
	from high_chart import test_chart
	from export_doc import export_conversation,convert_pp_to_csv,get_conversation
	import random
	import pandas as pd
	from codecarbon import EmissionsTracker

	from ecologits.tracers.utils import compute_llm_impacts
	import time
	import itertools



	load_dotenv()
	def generate_random_color():
	# Generate random RGB values
	r = random.randint(0, 255)
	g = random.randint(0, 255)
	b = random.randint(0, 255)

	# Convert RGB to hexadecimal
	color_hex = '#{:02x}{:02x}{:02x}'.format(r, g, b)

	return color_hex

	def format_pp_add_viz(pp):
	y = 50
	x = 50
	for i in range(len(st.session_state['pp_grouped'])):
	if st.session_state['pp_grouped'][i]['y'] == y and st.session_state['pp_grouped'][i]['x'] == x:
	y += 5
	if y > 95:
	y = 50
	x += 5
	if st.session_state['pp_grouped'][i]['name'] == pp:
	return None
	else:
	st.session_state['pp_grouped'].append({'name':pp, 'x':x,'y':y, 'color':generate_random_color()})


	def format_context(partie_prenante_grouped,marque):
	context = "la marque est " + marque + ".\n"
	context += f"Le nombre de parties prenantes est {len(partie_prenante_grouped)} et ils sont les suivantes:\n"
	for i,partie_prenante in enumerate(partie_prenante_grouped):
	context += f"{i}.{partie_prenante['name']} est une partie prenante de {marque} et a un pouvoir de {partie_prenante['y']}% et une influence de {partie_prenante['x']}%.\n"

	segmentation = '''
	Les parties prenantes sont segmentées en 4 catégories:
	- Rendre satisfait: le pouvoir est entre 50 et 100 et l'influence est entre 0 et 50
	- Gérer étroitement: le pouvoir est entre 50 et 100 et l'influence est entre 50 et 100
	- Suivre de près: le pouvoir est entre 0 et 50 et l'influence est entre 0 et 50
	- Tenir informé: le pouvoir est entre 0 et 50 et l'influence est entre 50 et 100
	'''

	context += segmentation
	return context


	def get_response(user_query, chat_history, context,llm=None,history_limit=5,stream=True):

	template = """
	Fournir des réponses, en francais, précises et contextuelles en agissant comme un expert en affaires, en utilisant le contexte des parties prenantes et leur pouvoir en pourcentage et leur influence en pourcentage pour expliquer les implications pour la marque. Le modèle doit connecter les informations du contexte et de l'historique de la conversation pour donner une réponse éclairée à la dernière question posée.

	Contexte: {context}

	Chat history: {chat_history}

	User question: {user_question}
	"""

	prompt = ChatPromptTemplate.from_template(template)

	#llm = ChatOpenAI(model="gpt-4o")
	if not llm:
	llm = ChatOpenAI(model="gpt-4o")
	elif llm == "GPT-4o":
	llm = ChatOpenAI(model="gpt-4o")
	elif llm == "Mistral (FR)":
	llm = ChatMistralAI(model_name="mistral-large-latest")

	chain = prompt \| llm

	if not stream:
	return chain.invoke({
	"context": context,
	"chat_history": chat_history[-history_limit:],
	"user_question": user_query,
	})

	chain = chain \| StrOutputParser()

	if history_limit:
	return chain.stream({
	"context": context,
	"chat_history": chat_history[-history_limit:],
	"user_question": user_query,
	})

	return chain.stream({
	"context": context,
	"chat_history": chat_history,
	"user_question": user_query,
	})


	def get_response_with_impact(user_query, chat_history, context,llm=None,history_limit=5,stream=True):
	model_vs_provider = {
	"Mistral (FR)": ["mistral-large-latest","mistralai"],
	"GPT-4o": ["gpt-4o","openai"]
	}

	if not stream:

	start = time.perf_counter()
	response = get_response(user_query, chat_history, context,llm,history_limit,stream)
	request_latency = time.perf_counter() - start
	token_count = response.response_metadata["token_usage"]["completion_tokens"]

	nbre_out_tokens = token_count
	model_name = model_vs_provider[st.session_state.model][0]
	model_provider = model_vs_provider[st.session_state.model][1]

	impact = compute_llm_impacts(
	provider=model_provider,
	model_name=model_name,
	output_token_count=nbre_out_tokens,
	request_latency=request_latency,
	)

	print(f"Request latency: {request_latency:.3f} s")
	print(f"Output token count: {nbre_out_tokens}")
	print(f"Impact: {impact.gwp.value} {impact.gwp.unit}")

	st.session_state["partial_emissions"]["chatbot"]["el"] += impact.gwp.value

	return response.content

	else:
	start = time.perf_counter()
	response_generator = get_response(user_query, chat_history, context,llm,history_limit,stream)
	wrapped_response_generator, token_count_generator = itertools.tee(response_generator)
	token_count = 0

	final_response = st.write_stream(wrapped_response_generator)

	request_latency = time.perf_counter() - start

	for _ in token_count_generator:
	token_count += 1

	nbre_out_tokens = token_count
	model_name = model_vs_provider[st.session_state.model][0]
	model_provider = model_vs_provider[st.session_state.model][1]


	impact = compute_llm_impacts(
	provider=model_provider,
	model_name=model_name,
	output_token_count=nbre_out_tokens,
	request_latency=request_latency,
	)

	print(f"Request latency: {request_latency:.3f} s")
	print(f"Output token count: {nbre_out_tokens}")
	print(f"Impact: {impact.gwp.value} {impact.gwp.unit}")

	st.session_state["partial_emissions"]["chatbot"]["el"] += impact.gwp.value

	return final_response


	def display_chart():
	if "pp_grouped" not in st.session_state or st.session_state['pp_grouped'] is None or len(st.session_state['pp_grouped']) == 0:
	st.warning("Aucune partie prenante n'a été définie")
	return None
	plot = construct_plot()
	st.plotly_chart(plot)

	@st.dialog("Choisissez un prompt",width="large")
	def show_prompts():
	get_prompts_list()
	if st.button("Fermer"):
	st.rerun()

	@st.dialog("Choisissez votre IA",width="small")
	def choose_model(index):

	model = st.radio("Choisissez votre IA", ["(US) ChatGpt 4.o","(FR) Mistral AI - Large (open source)"],index=index)
	if model == "(FR) Mistral AI - Large (open source)":
	st.session_state.model = "Mistral (FR)"
	if model == "(US) ChatGpt 4.o":
	st.session_state.model = "GPT-4o"
	if st.button("Valider"):
	st.rerun()

	@st.dialog("Ma cartographie",width="large")
	def disp_carto_in_chat():
	if test_chart() == "saved":
	st.rerun()

	@st.dialog("Télécharger",width="small")
	def dowmload_history(used_models=None):
	brand_name = st.session_state['Nom de la marque']

	format = st.radio("Choisissez le document à télécharger",[f"Rapport des parties prenantes (PDF)",f"Tableau des parties prenantes (CSV)",f"Historique de conversation (Fichier Texte)"],index=None)
	if format == f"Rapport des parties prenantes (PDF)":
	with st.spinner("Generation en cours..."):
	summary = get_response("Donne moi un RESUME de la Conversation", st.session_state.chat_history,format_context(st.session_state['pp_grouped'],st.session_state['Nom de la marque']),st.session_state.model)
	summary = ''.join(summary)
	pdf = export_conversation(AIMessage(content=summary).content,used_models=used_models)

	st.session_state["partial_emissions"]["download_rapport"]["cc"] = st.session_state["emission"].stop()

	if pdf:
	st.download_button("Télécharger le PDF", data=pdf, file_name=f"Cartographie {brand_name}.pdf", mime="application/pdf")

	if format == f"Tableau des parties prenantes (CSV)":
	csv = convert_pp_to_csv(st.session_state['pp_grouped'])
	if csv:
	st.download_button("Télécharger le CSV", data=csv, file_name=f"parties_prenantes -{brand_name}-.csv", mime="application/vnd.ms-excel")

	if format == f"Historique de conversation (Fichier Texte)":
	conv = get_conversation()
	if not conv:
	st.error("Une erreur s'est produite lors de la récupération de l'historique de conversation")
	return None
	else:
	conversation = "\n".join([f"{entry['speaker']}:\n{entry['text']}\n" for entry in conv])
	st.download_button("Télécharger l'historique de conversation", data=conversation, file_name=f"conversation {brand_name}.txt", mime="text/plain")

	if st.button("Fermer"):
	st.rerun()

	def add_existing_pps(pp,pouvoir,influence):
	for i in range(len(st.session_state['pp_grouped'])):
	if st.session_state['pp_grouped'][i]['name'] == pp:
	st.session_state['pp_grouped'][i]['x'] = influence
	st.session_state['pp_grouped'][i]['y'] = pouvoir
	return None
	st.session_state['pp_grouped'].append({'name':pp, 'x':influence,'y':pouvoir, 'color':generate_random_color()})


	def load_csv(file):
	df = pd.read_csv(file)
	for index, row in df.iterrows():
	add_existing_pps(row['parties prenantes'],row['pouvoir'],row['influence'])


	@st.dialog("Importer",width="small")
	def import_conversation():
	uploaded_file = st.file_uploader("Télécharger le fichier CSV", type="csv")
	if uploaded_file is not None:
	file_name = uploaded_file.name
	try:
	load_csv(file_name)
	brand_name_from_csv = file_name.split("-")[1]
	st.session_state["Nom de la marque"] = brand_name_from_csv
	st.rerun()
	except Exception as e:
	st.error("Erreur lors de la lecture du fichier")

	def extract_format_prompts_from_response(response):
	st.markdown("---")
	st.markdown("En découvrir plus avec l'IA RSE bziiit")
	prompts = response.split("\n")
	prompts = [prompt.strip() for prompt in prompts if prompt.strip() != ""]
	prompts_container = st.container()
	with prompts_container:
	for i,prompt in enumerate(prompts):

	temp_p = f"{prompt} ➡️"
	st.button(temp_p,key=f"exec_{i}",on_click=lambda i=i: st.session_state.chat_history.append(HumanMessage(content=prompts[i])))



	def extract_pp_from_query(query):
	return " ".join(query.split(" ")[1:])

	def display_prompts(prompts):
	for i,prompt in enumerate(prompts):
	col1,col2 = st.columns([9,1])
	col1.markdown(f"{prompt}")
	col2.button("➡️",key=f"execf_{i}",on_click=lambda i=i: st.session_state.chat_history.append(HumanMessage(content=prompts[i])))


	def display_chat():

	if "emission" not in st.session_state:
	tracker = EmissionsTracker()
	tracker.start()
	st.session_state["emission"] = tracker
	# app config
	st.title("CHATBOT")
	models_name = {
	"Mistral (FR)":1,
	"GPT-4o":0
	}



	generated_prompt_question = '''En fonction de l'historique, proposez trois prompts pour continuer la conversation. Utilisez les informations fournies et les implications discutées:

	- Prompt 1 : [Premier prompt suggéré]
	- Prompt 2 : [Deuxième prompt suggéré]
	- Prompt 3 : [Troisième prompt suggéré]

	LA LISTE DOIT ETRE EN FRANCAIS CHAQUE LIGNE SANS LE NUMERO DE PROMPT SEULEMENT LE TEXTE DE LA QUESTION
	'''

	# session state
	if "chat_history" not in st.session_state:
	st.session_state.chat_history = [
	AIMessage(content="Salut, voici votre cartographie des parties prenantes. Que puis-je faire pour vous ?"),
	]

	if "model" not in st.session_state:
	st.session_state.model = "GPT-4o"

	if "used_models" not in st.session_state:
	st.session_state.used_models = []

	#sticky bar at the top
	header = st.container()
	col1,col2,col3, col4,col5,col6 = header.columns([2,3,2,3,2,1])

	if col1.button("Prompts"):
	show_prompts()
	if col2.button(f"Modèle: {st.session_state.model}"):
	index = models_name[st.session_state.model]
	choose_model(index)
	if col3.button("Ma Carto"):
	disp_carto_in_chat()
	if col4.button("Télécharger"):
	dowmload_history(st.session_state.used_models)
	header.write("""<div class='fixed-header'/>""", unsafe_allow_html=True)

	# Custom CSS for the sticky header
	st.markdown(
	"""
	<style>
	div[data-testid="stVerticalBlock"] div:has(div.fixed-header) {
	position: sticky;
	top: 2.875rem;
	background-color: white;
	z-index: 999;
	}
	.fixed-header {
	border-bottom: 0px solid black;
	}
	</style>
	""",
	unsafe_allow_html=True
	)

	# conversation
	for message in st.session_state.chat_history:
	if isinstance(message, AIMessage):
	with st.chat_message("AI"):
	st.write(message.content)
	if "cartographie" in message.content:
	st.markdown("\n")
	display_chart()
	if message.content == st.session_state.chat_history[0].content:
	st.markdown("---")
	st.markdown("En découvrir plus avec l'IA RSE bziiit")
	first_prompts = ["En plus des parties prenantes déjà identifiées que tu peux consulter, quels groupes ou individus, impactés par les activités de mon organisation, devrais-je ajouter dans notre cartographie des parties prenantes ?",
	"Quels sont les principaux acteurs internes et externes qui influencent ou sont influencés par mon organisation, et comment leurs intérêts ou préoccupations peuvent varier selon les différents domaines d'activité ?",
	"En tenant compte de ma chaîne de valeur complète, quels sont les différentes parties prenantes stratégiques, incluant les partenaires commerciaux, les régulateurs, les groupes de pression, et la communauté, et comment leurs rôles et influences interagissent pour affecter les objectifs à court et long terme de mon organisation ?"]
	display_prompts(first_prompts)
	elif isinstance(message, HumanMessage):
	with st.chat_message("Moi"):
	st.write(message.content)

	#check if the last message is from the user , that means execute button has been clicked in the prompts
	last_message = st.session_state.chat_history[-1]
	if isinstance(last_message, HumanMessage):
	with st.chat_message("AI"):
	if last_message.content.startswith("/rajoute"):
	response = "Partie prenante ajoutée"
	st.write(response)
	st.session_state.chat_history.append(AIMessage(content=response))
	else:
	st.markdown(f"{st.session_state.model}")
	if st.session_state.model not in st.session_state.used_models:
	st.session_state.used_models.append(st.session_state.model)
	response = get_response_with_impact(last_message.content, st.session_state.chat_history,format_context(st.session_state['pp_grouped'],st.session_state['Nom de la marque']),st.session_state.model)
	st.session_state.chat_history.append(AIMessage(content=response))
	with st.spinner("Proposition de prompts..."):
	propositions_prompts = get_response_with_impact(generated_prompt_question, st.session_state.chat_history,format_context(st.session_state['pp_grouped'],st.session_state['Nom de la marque']),st.session_state.model,history_limit=1,stream=False)
	extract_format_prompts_from_response(propositions_prompts)
	st.session_state["partial_emissions"]["chatbot"]["cc"] = st.session_state["emission"].stop()



	if "pp_grouped" not in st.session_state or st.session_state['pp_grouped'] is None or len(st.session_state['pp_grouped']) == 0:
	st.session_state['pp_grouped'] = []
	if "Nom de la marque" not in st.session_state:
	st.session_state["Nom de la marque"] = ""

	# user input
	user_query = st.chat_input("Par ici...")
	if user_query is not None and user_query != "":
	st.session_state.chat_history.append(HumanMessage(content=user_query))

	with st.chat_message("Moi"):
	st.markdown(user_query)
	with st.chat_message("AI"):
	st.markdown(f"{st.session_state.model}")
	if st.session_state.model not in st.session_state.used_models:
	st.session_state.used_models.append(st.session_state.model)
	if user_query.startswith("/rajoute"):
	partie_prenante = extract_pp_from_query(user_query)
	format_pp_add_viz(partie_prenante)
	disp_carto_in_chat()
	else:
	#response = st.write_stream(get_response(user_query, st.session_state.chat_history,format_context(st.session_state['pp_grouped'],st.session_state['Nom de la marque']),st.session_state.model))
	response = get_response_with_impact(user_query, st.session_state.chat_history,format_context(st.session_state['pp_grouped'],st.session_state['Nom de la marque']),st.session_state.model)

	st.session_state.chat_history.append(AIMessage(content=response))

	with st.spinner("Proposition de prompts..."):
	propositions_prompts = get_response_with_impact(generated_prompt_question, st.session_state.chat_history,format_context(st.session_state['pp_grouped'],st.session_state['Nom de la marque']),st.session_state.model,history_limit=1,stream=False)
	extract_format_prompts_from_response(propositions_prompts)
	st.session_state["partial_emissions"]["chatbot"]["cc"] = st.session_state["emission"].stop()