dsfgdfgdf
/

123

Model card Files Files and versions Community

123 / download_data.py

dsfgdfgdf's picture

Upload 5 files

800258b over 1 year ago

history blame contribute delete

2.57 kB

	import boto3
	from decouple import config
	import os

	# To obtain access to the S3 bucket where the files are stored, please contact me at the following address : [email protected]

	# Répertoire de destination des datasets
	data_dir = 'data/'

	# Liste des fichiers à télécharger
	datasets_to_download = [
	'Seasons_Stats.csv',
	'player_data.csv',
	'NBA Shot Locations 1997 - 2020.csv',
	'ranking.csv',
	'teams.csv'
	]

	# Préparation de la connexion au Bucket S3 d'Amazon AWS
	s3_client = boto3.client('s3', region_name=config('AWS_S3_REGION'), aws_access_key_id=config('AWS_USER_KEY_ID'), aws_secret_access_key=config('AWS_USER_KEY'))

	# Télécharger les fichiers uniquement s'ils ne sont pas déjà présents dans le répertoire "data"
	for file_name in datasets_to_download:
	local_path = os.path.join(data_dir, file_name)

	# Vérifier si le fichier existe déjà
	if not os.path.exists(local_path):
	print(f"Téléchargement de {file_name}...")
	s3_client.download_file(Bucket=config('AWS_S3_BUCKET_NAME'), Key=file_name, Filename=local_path)
	print(f"{file_name} téléchargé avec succès.")
	else:
	print(f"{file_name} est déjà présent dans le répertoire.")

	print("Le téléchargement des datasets est terminé.")

	print("Téléchargement des modèles pour streamlit...")

	# Répertoire de destination des datasets
	streamlit_dir = 'streamlit_app/'

	streamlit_files_to_download = [
	'XGBoost_James.joblib',
	'XGBoost_Curry.joblib',
	'XGBoost.joblib',
	'scaler_lebron.pkl',
	'scaler_curry.pkl',
	'random_forest_model.joblib',
	'light_gbm.joblib',
	'curry_model.sav',
	'lebron_model.sav',
	'gridcv_lr.joblib',
	'gradient_boosting_classifier.joblib',
	'df.csv',
	'df1.csv',
	'working_dataframe.csv',
	'Seasons_Stats.csv',
	'player_data.csv',
	'NBA Shot Locations 1997 - 2020.csv',
	'ranking.csv',
	'teams.csv'
	]

	# Télécharger les fichiers uniquement s'ils ne sont pas déjà présents dans le répertoire "data"
	for file_name in streamlit_files_to_download :
	local_path = os.path.join(models_dir, file_name)

	# Vérifier si le fichier existe déjà
	if not os.path.exists(local_path):
	print(f"Téléchargement de {file_name}...")
	s3_client.download_file(Bucket=config('AWS_S3_BUCKET_NAME'), Key=file_name, Filename=local_path)
	print(f"{file_name} téléchargé avec succès.")
	else:
	print(f"{file_name} est déjà présent dans le répertoire.")

	print("Le téléchargement des datasets est terminé.")