SlideShare uma empresa Scribd logo
1 de 13
Baixar para ler offline
Développer
un modèle de
Machine
Learning
Hebert Brian Whannou
05/01/2021
Sommaire
Mon Parcours Prêts bancaires Data science Machine Learning
Valeur ajoutée du
Data scientist
Développement de
modèle
Points à retenir Incitation à l’action A vos agendas!
Brian
° Je suis statisticien spécialisé
en risques financiers
° Je développe des modèles de
machine learning pour des
institutions financières
° J’élabore des
recommendations sur des
modèles déjà développés
Enseignement
secondaire
• Bac C au collège catholique Notre Dame
de Lourdes
• Bourse scolaire de la Fondation Vallet
Enseignement
supérieur
• Classes préparatoires en Mathématiques,
Physique
• ENSAE: école d’ingénieurs spécialisée en
statistiques, économie, programmation
• Université Paris VII: ingénierie financière,
diffusion probabiliste
• Institut des Actuaires
Monparcours
“千里之行、始
于足下”.
“Un voyage de
milliers de
kilomètres
commence par un
seul pas”
- 老子
Prêts bancaires
Les prêts sont caractérisés par un
montant financé, une maturité, un
échéancier de remboursement
La banque est ici l’intermédiaire entre
les emprunteurs et les prêteurs
Quels sont les emprunteurs risqués?
Quelles variables il faut contrôler chez
l’emprunteur avant de lui prêter?
Quelles sont les catégories de
prêts/d’emprunteurs/de prêteurs?
Data Science
La data science est la science de traitement
des données pour en retirer une
information, une structure ou un plan
d’action
Il existe deux types de données: soit elles sont
structurelles soit elles sont non-structurelles
L’objectif est d’extraire les relations entre les
différentes variables (cf. prêts bancaires)
Quelle sont les compétences/connaissances
nécessaires ?
Les composantes
de la Data Science
Programmation –
gestion de base de
données
Statistique -
Mathématiques
Machine Learning Connaissance du
domaine
Communication –
data visualisation
L'apprentissage automatique (Machine Learning)
estunedisciplinedelaDataSciencequipermet
aux systèmes conçus pour réaliser une tâche,
d'apprendreetdes'améliorerautomatiquement
à partir de l'expérience sans être explicitement
programmés
Machine Learning
Apprentissage
Supervisé
Régression
Classification
Apprentissage
Non-Supervisé
Clustering
Réduction de
dimension
Apprentissage
renforcé
La valeur ajoutée du data scientist
° Analyse descriptive
• Quel est l’état des lieux actuels?
• Le statisticien apporte une compréhension quantitative de la base de données avec des techniques simples (moyenne,
quantile, distribution empirique)
° Automatisation des reporting
• Comment réduire les erreurs dans les rapports reproductibles?
° Analyse predictive
• Quel sera la situation dans un horizon de temps donnés?
° Analyse prescriptive
• Quel est le meilleur plan d’action à mener?
Processus de
développement de modèle
Collecte des
données
Calibration du
modèle (ou des
modèles)
EvaluationInterprétation
Déploiement
1. Collecte des données:
• Identification des sources
• Collecte des variables d’intérêt en cohérence avec la problématique
• Exploration et nettoyage de la base
2. Calibration du modèle (ou des modèles)
• Construction de la base d’apprentissage
• Création de nouvelles variables
• Sélection des variables
• Calcul des paramètres
• Sélection du modèle
• Définition des indicateurs de performance
3. Evaluation
• Construction de la base de test
• Estimation de l’erreur de généralisation
4. Interprétation
• Compréhension du modèle et des interactions des variables
5. Déploiement
• Pour une nouvelle observation, quelle est la prédiction du modèle?
• Création d’outils pour permettre utilisation du modèle
• Monitoring des performances du modèles en continu
Points à retenir
UN:
Garbage in, Garbage out
DEUX:
La maîtrise d’un langage de
programmation est
primordiale
TROIS:
il faut maîtriser les
hypothèses sous-jacentes
des modèles
QUATRE:
Contrôler le sur-
apprentissage
CINQ:
Garder un œil sur
l’interprétation du modèle
et la cohérence avec le
domaine d’activité
Incitation à
l’action
Restez curieux et continuez à
lire…
•
Boot Camp organisé par Bénin
Excellence pour l’été 2021
Thank You
LinkedIn
linkedin.com/in/bwhannou/
Email
ml.benin.excellence@outlook.fr
Facebook
facebook.com/BeninExcellence

Mais conteúdo relacionado

Mais procurados

E logistics-Vehicle Routing Problem
E logistics-Vehicle Routing ProblemE logistics-Vehicle Routing Problem
E logistics-Vehicle Routing ProblemENSAM Casablanca
 
Approche et définition du système d'informations
Approche et définition du système d'informationsApproche et définition du système d'informations
Approche et définition du système d'informationsSVrignaud
 
3.1 -systme_respiratoire
3.1  -systme_respiratoire3.1  -systme_respiratoire
3.1 -systme_respiratoireMehdi Razzok
 
Introduction à la qualité
Introduction à la qualitéIntroduction à la qualité
Introduction à la qualitéCharles Duchêne
 
Les principes de la norme iso 14001 - Ecoute et Qualité
Les principes de la norme iso 14001 - Ecoute et QualitéLes principes de la norme iso 14001 - Ecoute et Qualité
Les principes de la norme iso 14001 - Ecoute et QualitéEcoute & Qualité
 
+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdf
+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdf+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdf
+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdfHani sami joga
 
Frise des 4 révolutions industrielles
Frise des 4 révolutions industriellesFrise des 4 révolutions industrielles
Frise des 4 révolutions industriellesAlain KHEMILI
 
Hygiène des mains personnel de nettoyage en MRS
Hygiène des mains personnel de nettoyage en MRSHygiène des mains personnel de nettoyage en MRS
Hygiène des mains personnel de nettoyage en MRSBernard Legros
 
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURICours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURIMansouri Khalifa
 
PréSentation Des Outils De La Qualité
PréSentation Des Outils De La QualitéPréSentation Des Outils De La Qualité
PréSentation Des Outils De La Qualitéudotsi33
 
Maîtrise des flux de production
Maîtrise des flux de productionMaîtrise des flux de production
Maîtrise des flux de productionElyes ELEBRI
 
Exemple de tableau de bord de gestion de projet
Exemple de tableau de bord de gestion de projetExemple de tableau de bord de gestion de projet
Exemple de tableau de bord de gestion de projetChef De Projet Détendu
 
La grh par l infirmier chef
La grh par l infirmier chefLa grh par l infirmier chef
La grh par l infirmier chefIbnelafif Samir
 
Plal (leishmaniose)
Plal (leishmaniose)Plal (leishmaniose)
Plal (leishmaniose)Mehdi Razzok
 

Mais procurados (20)

Cours tqm 2006
Cours tqm 2006Cours tqm 2006
Cours tqm 2006
 
E logistics-Vehicle Routing Problem
E logistics-Vehicle Routing ProblemE logistics-Vehicle Routing Problem
E logistics-Vehicle Routing Problem
 
Approche et définition du système d'informations
Approche et définition du système d'informationsApproche et définition du système d'informations
Approche et définition du système d'informations
 
3.1 -systme_respiratoire
3.1  -systme_respiratoire3.1  -systme_respiratoire
3.1 -systme_respiratoire
 
Qualite ishikawa
Qualite ishikawaQualite ishikawa
Qualite ishikawa
 
Introduction à la qualité
Introduction à la qualitéIntroduction à la qualité
Introduction à la qualité
 
Les principes de la norme iso 14001 - Ecoute et Qualité
Les principes de la norme iso 14001 - Ecoute et QualitéLes principes de la norme iso 14001 - Ecoute et Qualité
Les principes de la norme iso 14001 - Ecoute et Qualité
 
+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdf
+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdf+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdf
+50 les plus belles dédicaces de mémoire de fin d'étude - pdf.pdf
 
Frise des 4 révolutions industrielles
Frise des 4 révolutions industriellesFrise des 4 révolutions industrielles
Frise des 4 révolutions industrielles
 
Presentation securite sanitaire et certification 26 sept 2017
Presentation securite sanitaire et certification 26 sept 2017Presentation securite sanitaire et certification 26 sept 2017
Presentation securite sanitaire et certification 26 sept 2017
 
Hygiène des mains personnel de nettoyage en MRS
Hygiène des mains personnel de nettoyage en MRSHygiène des mains personnel de nettoyage en MRS
Hygiène des mains personnel de nettoyage en MRS
 
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURICours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
Cours guvernance des systèmes d'information partie 3 prof. Khalifa MANSOURI
 
PréSentation Des Outils De La Qualité
PréSentation Des Outils De La QualitéPréSentation Des Outils De La Qualité
PréSentation Des Outils De La Qualité
 
L’informatique
L’informatiqueL’informatique
L’informatique
 
Le système HACCP
Le système HACCPLe système HACCP
Le système HACCP
 
Guide cspro tapé
Guide cspro tapéGuide cspro tapé
Guide cspro tapé
 
Maîtrise des flux de production
Maîtrise des flux de productionMaîtrise des flux de production
Maîtrise des flux de production
 
Exemple de tableau de bord de gestion de projet
Exemple de tableau de bord de gestion de projetExemple de tableau de bord de gestion de projet
Exemple de tableau de bord de gestion de projet
 
La grh par l infirmier chef
La grh par l infirmier chefLa grh par l infirmier chef
La grh par l infirmier chef
 
Plal (leishmaniose)
Plal (leishmaniose)Plal (leishmaniose)
Plal (leishmaniose)
 

Semelhante a développer un modèle de Machine learning

Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Morgan Magnin
 
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3
 
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Morgan Magnin
 
Herve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerveBalloux
 
Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management
 
Forêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSForêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSKezhan SHI
 
EIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEtalab
 
La puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersLa puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersMinitab, LLC
 
Benoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDBenoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDAFEIT
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...AQT-presentations
 
Herve balloux applied data science
Herve balloux  applied data scienceHerve balloux  applied data science
Herve balloux applied data scienceHerveBalloux
 
Presentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantPresentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantEquipeDCG
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])elmahoti
 
Vers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesVers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesSarra BOUHENNI
 
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)clac.cab
 
La méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsLa méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsXL Groupe
 
Management des risques
Management des risquesManagement des risques
Management des risquesyounes elhaiba
 
Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Aref Jdey
 

Semelhante a développer un modèle de Machine learning (20)

Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...
 
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
Parkour3- L’importance de la collecte et de l’analyse de données pour votre e...
 
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...
 
Herve balloux analyses risk and investment
Herve balloux analyses risk and investmentHerve balloux analyses risk and investment
Herve balloux analyses risk and investment
 
Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...Socio Data Management présente son outil de simulation prédictive au Printemp...
Socio Data Management présente son outil de simulation prédictive au Printemp...
 
Forêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISSForêts uniformément aléatoires - Saïp CISS
Forêts uniformément aléatoires - Saïp CISS
 
A11-Comment manager ma destination numérique
A11-Comment manager ma destination numériqueA11-Comment manager ma destination numérique
A11-Comment manager ma destination numérique
 
EIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux FaiblesEIG Promo 2 - Présentation du défi Signaux Faibles
EIG Promo 2 - Présentation du défi Signaux Faibles
 
La puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiersLa puissance du machine learning et des algorithmes cart au service des métiers
La puissance du machine learning et des algorithmes cart au service des métiers
 
Benoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DDBenoit Varin TicEthic Brest TIC et DD
Benoit Varin TicEthic Brest TIC et DD
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
 
Herve balloux applied data science
Herve balloux  applied data scienceHerve balloux  applied data science
Herve balloux applied data science
 
Presentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiantPresentation du-dcg salon-etudiant
Presentation du-dcg salon-etudiant
 
(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])(6 cycle amélqté [récupéré])
(6 cycle amélqté [récupéré])
 
Vers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétalesVers une plateforme intelligente pour la prévision des maladies végétales
Vers une plateforme intelligente pour la prévision des maladies végétales
 
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)20140508 cartographie des_modalités_de_mise_en_œuv re (1)
20140508 cartographie des_modalités_de_mise_en_œuv re (1)
 
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
Webinaire du CCNMO: Méthodes et outils axés sur la prévention des blessures p...
 
La méthode DMAIC et ses secrets
La méthode DMAIC et ses secretsLa méthode DMAIC et ses secrets
La méthode DMAIC et ses secrets
 
Management des risques
Management des risquesManagement des risques
Management des risques
 
Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0Image et détection des avis exprimés dans le web 2.0
Image et détection des avis exprimés dans le web 2.0
 

Último

webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdfwebinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdfInstitut de l'Elevage - Idele
 
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptxBassamRhouma
 
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdfwebinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdfInstitut de l'Elevage - Idele
 
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...NiHad27
 
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...Institut de l'Elevage - Idele
 
QCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdfQCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdfAyoub893663
 
2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULT2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULTBassamRhouma
 

Último (7)

webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdfwebinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
webinaire eBIS n°9 La génétique du Méthane_02_20240321_SFresco_Methabreed.pdf
 
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
2022-PRESENTATION DE PROJET FIN D'ETUDE-REHOUMA BASSEM.pptx
 
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdfwebinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
webinaire eBIS n°9 La génétique du Méthane_01_20240321_DBoichard_contexte.pdf
 
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...rapport stage OCP : Elaboration plan des machines :  La machine stockeuse et ...
rapport stage OCP : Elaboration plan des machines : La machine stockeuse et ...
 
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
webinaire eBIS n°9 La génétique du Méthane_03_20240321_JPromp_presentation_Mé...
 
QCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdfQCM Réseaux informatique V19.02.2017.pdf
QCM Réseaux informatique V19.02.2017.pdf
 
2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULT2021 - Rapport STAGE BASSAM 4eme GEII ULT
2021 - Rapport STAGE BASSAM 4eme GEII ULT
 

développer un modèle de Machine learning

  • 2. Sommaire Mon Parcours Prêts bancaires Data science Machine Learning Valeur ajoutée du Data scientist Développement de modèle Points à retenir Incitation à l’action A vos agendas!
  • 3. Brian ° Je suis statisticien spécialisé en risques financiers ° Je développe des modèles de machine learning pour des institutions financières ° J’élabore des recommendations sur des modèles déjà développés Enseignement secondaire • Bac C au collège catholique Notre Dame de Lourdes • Bourse scolaire de la Fondation Vallet Enseignement supérieur • Classes préparatoires en Mathématiques, Physique • ENSAE: école d’ingénieurs spécialisée en statistiques, économie, programmation • Université Paris VII: ingénierie financière, diffusion probabiliste • Institut des Actuaires Monparcours
  • 4. “千里之行、始 于足下”. “Un voyage de milliers de kilomètres commence par un seul pas” - 老子
  • 5. Prêts bancaires Les prêts sont caractérisés par un montant financé, une maturité, un échéancier de remboursement La banque est ici l’intermédiaire entre les emprunteurs et les prêteurs Quels sont les emprunteurs risqués? Quelles variables il faut contrôler chez l’emprunteur avant de lui prêter? Quelles sont les catégories de prêts/d’emprunteurs/de prêteurs?
  • 6. Data Science La data science est la science de traitement des données pour en retirer une information, une structure ou un plan d’action Il existe deux types de données: soit elles sont structurelles soit elles sont non-structurelles L’objectif est d’extraire les relations entre les différentes variables (cf. prêts bancaires) Quelle sont les compétences/connaissances nécessaires ?
  • 7. Les composantes de la Data Science Programmation – gestion de base de données Statistique - Mathématiques Machine Learning Connaissance du domaine Communication – data visualisation
  • 8. L'apprentissage automatique (Machine Learning) estunedisciplinedelaDataSciencequipermet aux systèmes conçus pour réaliser une tâche, d'apprendreetdes'améliorerautomatiquement à partir de l'expérience sans être explicitement programmés Machine Learning Apprentissage Supervisé Régression Classification Apprentissage Non-Supervisé Clustering Réduction de dimension Apprentissage renforcé
  • 9. La valeur ajoutée du data scientist ° Analyse descriptive • Quel est l’état des lieux actuels? • Le statisticien apporte une compréhension quantitative de la base de données avec des techniques simples (moyenne, quantile, distribution empirique) ° Automatisation des reporting • Comment réduire les erreurs dans les rapports reproductibles? ° Analyse predictive • Quel sera la situation dans un horizon de temps donnés? ° Analyse prescriptive • Quel est le meilleur plan d’action à mener?
  • 10. Processus de développement de modèle Collecte des données Calibration du modèle (ou des modèles) EvaluationInterprétation Déploiement 1. Collecte des données: • Identification des sources • Collecte des variables d’intérêt en cohérence avec la problématique • Exploration et nettoyage de la base 2. Calibration du modèle (ou des modèles) • Construction de la base d’apprentissage • Création de nouvelles variables • Sélection des variables • Calcul des paramètres • Sélection du modèle • Définition des indicateurs de performance 3. Evaluation • Construction de la base de test • Estimation de l’erreur de généralisation 4. Interprétation • Compréhension du modèle et des interactions des variables 5. Déploiement • Pour une nouvelle observation, quelle est la prédiction du modèle? • Création d’outils pour permettre utilisation du modèle • Monitoring des performances du modèles en continu
  • 11. Points à retenir UN: Garbage in, Garbage out DEUX: La maîtrise d’un langage de programmation est primordiale TROIS: il faut maîtriser les hypothèses sous-jacentes des modèles QUATRE: Contrôler le sur- apprentissage CINQ: Garder un œil sur l’interprétation du modèle et la cohérence avec le domaine d’activité
  • 12. Incitation à l’action Restez curieux et continuez à lire… • Boot Camp organisé par Bénin Excellence pour l’été 2021