Contexte

L'entreprise "Prêt à dépenser" souhaite mettre en œuvre un outil de “scoring crédit” pour calculer la probabilité qu’un client rembourse son crédit, puis classifie la demande en crédit accordé ou refusé. Elle souhaite donc développer un algorithme de classification en s’appuyant sur des sources de données variées (données comportementales, données provenant d'autres institutions financières, etc.).

Missions

Automatiser la prise de décision d’accord de prêt grâce à un algorithme de classification

1/ Construire le modèle de scoring

2/ Analyser les features ayant le plus d’impact sur le scoring de manière générale et au niveau d’un client

3/ Mettre en production le modèle de scoring dans une API

4/ Mettre en œuvre une approche globale MLOps de bout en bout (tracking expérimentation => data drift)

Dataset

Home Credit est une institution financière internationale de prêts à la consommation. Elle nous fournit un jeu de données comportant des informations sur les clients, les crédits qu'ils ont contractés, leur revenus, etc. Ces données sont utilisées pour construire un modèle de scoring de crédit pour prédire la probabilité de capacité de remboursement d'un client, et donc de déterminer si un crédit doit lui être accordé ou non.

Source : Home Credit Default Risk sur Kaggle.com

10 fichiers CSV :

application_train.csv
application_test.csv
bureau.csv
bureau_balance.csv
credit_card_balance.csv
HomeCredit_columns_description.csv
installments_payments.csv
POS_CASH_balance.csv
previous_application.csv
sample_submission.csv

Voici le diagramme entité-association des données (diagramme ERD) :

Fichiers du dépôt

Dossier .github/workflows : fichier YAML pour le déploiement de l'API sur Heroku
Dossier Data drift : Notebook, script python et rapport HTML pour le suivi du drift de données
Dossier data_heroku : Dataset pour le déploiement de l'API sur Heroku
Dossier Berthe_Pierrick_4_dossier_code_022024 : dossier comportant les fichiers suivants :
- data : dossier contenant les datasets
- mlflow_model : dossier contenant les modèles MLFlow
- notebooks : dossier contenant les notebooks de nettoyage et de modélisation
- tests_unitaires : dossier contenant les tests unitaires
- Fichier explicatif dossier Github : PDF expliquant le contenu du dossier
Procfile : fichier pour le déploiement de l'API sur Heroku
runtime.txt : fichier pour le déploiement de l'API sur Heroku
api.py : Script python pour le déploiement de l'API sur Heroku
dashboard.py : Script python pour le test d'un dashboard Streamlit simpliste
Berthe_Pierrick_7_presentation_02024.pdf : Présentation des résultats

Auteur

Pierrick BERTHE
Février 2024

Name		Name	Last commit message	Last commit date
Latest commit History 201 Commits
.devcontainer		.devcontainer
.github/workflows		.github/workflows
.streamlit		.streamlit
Berthe_Pierrick_4_dossier_code_022024		Berthe_Pierrick_4_dossier_code_022024
data_drift		data_drift
data_heroku		data_heroku
mlflow_model		mlflow_model
mlflow_model_RF		mlflow_model_RF
script		script
.gitignore		.gitignore
Berthe_Pierrick_7_presentation_022024.pdf		Berthe_Pierrick_7_presentation_022024.pdf
Procfile		Procfile
README.md		README.md
api.py		api.py
dashboard.py		dashboard.py
requirements.txt		requirements.txt
runtime.txt		runtime.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Contexte

Missions

Dataset

Fichiers du dépôt

Auteur

About

Releases

Packages

Languages

pierrickBERTHE/PB7_Scoring_client_de_banque

Folders and files

Latest commit

History

Repository files navigation

Contexte

Missions

Dataset

Fichiers du dépôt

Auteur

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages