SlideShare uma empresa Scribd logo
1 de 39
Baixar para ler offline
A L G O R I T H M E S M L / D L
Réalisé par
Bassem Brayek
Aicha Racil
Ahmed Fathallah
PLAN: 
INTRODUCTION 
PROCESSUS MACHINE LEARNING
APPROCHES ET ALGORITHME
RÉSEAU DE NEURONE/
DEEP LEARNING 
CONCLUSION
M L / D L
- D A N S Q U E L L E P H A S E I N T E R V I E N T L E
M A C H I N E L E A R N I N G ?  
- Q U E L S   A L G O R I T H M E S U T L I S E R ?  
- M A C H I N E L E A R N I N G E T D E E P
L E A R N I N G  
INTRODUCTION
PROCESSUS MACHINE LEARNING
LES ALGORITHMES DE MACHINE LEARNING:
https://www.slideshare.net/awahid/big-data-and-machine-learning-for-businesses
Les classes sont connues. 
Prédire les classes à partir d'une
base d'apprentissage.
La sortie est une  catégorie. 
CLASSIFICATION
Principe: calcule la distance entre deux
observations, il rend une décision en
minimisant la distance entre les membres des
différentes classes. 
Avantage: - robuste au sur-apprentissage       
                - Modélisation non linéaire 
Problèmes: - Consommation de mémoire         
                 -  Non adéquat pour les                 
                   traitements parallèles et             
                   incrémentaux.               
1-SVM
Prédiction linéaire. 
La sortie peut prendre deux
valeurs.
Basée sur la fonction logistique.
Sur-apprentissage: faible
probabilité 
Non adéquat pour les relations
complexes: non linéaire. 
2-RÉGRESSION   
LOGISTIQUE
Le nombre K est pré-fixé. 
Calcule de la distance:                 
 * Distance euclidienne                 
 * Distance de Minkowski               
 * Distance de Manhattan... 
Le choix est basé sur un calcule de
probabilité. 
Dédié au nombre limité d'entrées.
3- KNN
La construction de l'arbre avec CART ou
bien ID3 .
Avantages: Simplicité de compréhension   
                  Robustesse                             
                  Fonctionnel pour les problème 
                  non linéaires. 
Inconvénients: le sur-apprentissage. 
4-ARBRE DE   
DÉCISION
La Régression:
Les algorithmes de régression permettent de prédire des valeurs
continues à partir des variables prédictives.
                      
 Un algorithme de régression permet de trouver un modèle en
fonction  des données d’entrainement.
Le modèle calculé permettra de donner une estimation sur une
nouvelle donnée non encore vue par l’algorithme.
Principe: trouver une droite qui se
rapproche le plus d'un ensemble de points.
Avantages: performant pour les données   
                  linéaires                                  
Inconvénients: - limité aux relations           
                          linéaires.                         
                      - Les données doivent être   
                        indépendantes
1-RÉGRESSION
LINÉAIRE
Une arborescence de régression peut être
considérée comme une variante des arbres
de décision, conçue pour approximer des
fonctions à valeur réelle, au lieu d'être
utilisée pour des méthodes de classification.
2- ARBRE DE
RÉGRESSION
3- RANDOM FOREST
Une forêt de regression est une collection d'arbres de regression formés au hasard.
Avantage :  Interprétabilité.
Inconvénient :  Lent pour créer des prédictions après la phase d'entrainement .
Clustering
Données non étiquetées.
Le nombre de cluster est inconnu au départ. 
Regroupement de données selon leurs ressemblances
K est le nombre de clusters à
obtenir.
Traitement itératif.
Avantages: -Simplicité                   
                   -Adéquat pour les
                   grandes masses de
                   données.                
Inconvénients: -le nombre k est
                       prédéfini                
                      - le résultat dépend 
                       du choix des
                       centres initiaux.      
                                          
1-KMEANS 
Association
Type de données: Données non étiquetées.
Principe: Permet de déterminer les relations
entre les différents attributs.  
Détermine les règles d'association
dans un jeu de données.
Traitement itératif.
Avantage: Simple à utiliser             
                                    
Inconvénient: Un nombre
considérable d'accès à la base de
données.
1-APRIORI
RÉSEAU DE NEURONE/DEEP LEARNIG
RÉSEAU DE NEURONE
Une collection de neurones
Il apprend en utilisant des algorithmes d'apprentissage
qui modifient légèrement les poids
ALGORITHME D'APPRENTISSAGE
LES DIFFÉRENTES CLASSIFICATION DES RÉSEAUX :
feedforward feedback
1- Types de connections
LES DIFFÉRENTES CLASSIFICATION DES RÉSEAUX :
2- Types d'apprentissage
LES DIFFÉRENTES CLASSIFICATION DES RÉSEAUX :
3- Topologies
APPRENTISSAGE PROFOND: DEEP LEARNING
Le deep learning est une méthode d'apprentissage qui utilise des réseaux de
neurones à plusieurs couches.
Les réseaux à couches multiples existaient depuis des années, ce qui est
nouveau, c'est les algorithmes d'apprentissage
Un réseau de neurones profond consiste en une hiérarchie de couches, chacune
transforme les données d'entrée en une représentation plus abstraite.
APPRENTISSAGE PROFOND: DEEP LEARNING
PROBLÈMES DES ALGORITHMES ML:
Sur-apprentissage: quand le modèle devient trop lié à la base
d'apprentissage et se généralise mal.
Sous-apprentissage: Le modèle est incapable de fournir des prédictions
précises.
RÉDUCTION DE L'OVERFITTING :
Réduire la taille du réseau.
Validation croisée (séparation du données en partie d'apprentissage et partie
de validation).
Régularisation (weight decay : pénaliser les grand poids).
G R A N D S N O M B R E S D ' A L G O R I T H M E S
B E S O I N D E S É T A P E S D E P R É P A R A T I O N
E T D E S T R U C T U R A T I O N .
CONCLUSION ET
PERSPECTIVES
Quels outils permettant de faciliter et d'automatiser ces tâches ? 
NOS SOURCES
Master Machine Learning Algorithms. Jason Brownlee.
https://machinelearningmastery.com/overfitting-and-underfitting-with-machine-
learning-algorithms/
http://neuralnetworksanddeeplearning.com
https://mrmint.fr/overfitting-et-underfitting-quand-vos-algorithmes-de-machine-
learning-derapent
https://docs.microsoft.com/en-us/azure/machine-learning/studio/algorithm-choice
MERCI DE VOTRE
ATTENTION
ANNEXE
A B P E N S
ID3
Initialisation par un arbre vide
Calcule de l'entropie totale .
On prend attribut par attribut.
Pour chaque valeur d'attribut on calcule sa
probabilité et son entropie.
On calcule le gain en information de chaque
attribut.
L'attribut qui a le gain le plus important sera
sélectionné.
Traitement itératif.
A B P E N S
CART
Répartition des données sur des groupes.
Poser toutes les questions possibles.
Evaluation de l'arbre obtenu
A B P E N S
GRADIANT DESCENT
Choisir une fonction coût
Fixer les paramètre initiaux (nombre aléatoire de
gauss avec un petit écart type)
Calculer le gradiant de cette fonction dans cette
position
Mise à jour de la position en fonction du gradiant
Arbre de décision :
1
Algorithme Exactitude temps
d'exécution
Linéarité remarques
Logistic
regression
SVM Recommandé pour
grandes masses de
données
kmeans
Random forest
Naive bayise

Mais conteúdo relacionado

Mais procurados

Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningHakim Nasaoui
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMJaouad Dabounou
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels Oussama Werfelli
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning Niji
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentationDonia Hammami
 
Les applications du Deep Learning
Les applications du Deep LearningLes applications du Deep Learning
Les applications du Deep LearningJedha Bootcamp
 
classification des images couleurs par un réseau de neurone quaternionique ré...
classification des images couleurs par un réseau de neurone quaternionique ré...classification des images couleurs par un réseau de neurone quaternionique ré...
classification des images couleurs par un réseau de neurone quaternionique ré...Amal Targhi
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdfOuailChoukhairi
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdfhanamettali
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage AutomatiqueNizar Bechir
 
Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...
Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...
Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...Juba Ait idir
 
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfChapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfZizoAziz
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'imagesAbdelouahed Abdou
 
Les réseaux de neurones
Les réseaux de neuronesLes réseaux de neurones
Les réseaux de neuronesMariam Amchayd
 
Rapport projet Master 2 - Intelligence Artificielle
Rapport projet Master 2 - Intelligence ArtificielleRapport projet Master 2 - Intelligence Artificielle
Rapport projet Master 2 - Intelligence ArtificielleYanis Marchand
 

Mais procurados (20)

Les 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learningLes 10 plus populaires algorithmes du machine learning
Les 10 plus populaires algorithmes du machine learning
 
Réseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTMRéseaux de neurones récurrents et LSTM
Réseaux de neurones récurrents et LSTM
 
réseaux de neurones artificiels
réseaux de neurones artificiels réseaux de neurones artificiels
réseaux de neurones artificiels
 
Introduction au Deep Learning
Introduction au Deep Learning Introduction au Deep Learning
Introduction au Deep Learning
 
Knn
KnnKnn
Knn
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
 
Exposé segmentation
Exposé segmentationExposé segmentation
Exposé segmentation
 
Algorithme knn
Algorithme knnAlgorithme knn
Algorithme knn
 
Les applications du Deep Learning
Les applications du Deep LearningLes applications du Deep Learning
Les applications du Deep Learning
 
classification des images couleurs par un réseau de neurone quaternionique ré...
classification des images couleurs par un réseau de neurone quaternionique ré...classification des images couleurs par un réseau de neurone quaternionique ré...
classification des images couleurs par un réseau de neurone quaternionique ré...
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
5.5 Clustering
5.5 Clustering5.5 Clustering
5.5 Clustering
 
Apprentissage supervisé.pdf
Apprentissage supervisé.pdfApprentissage supervisé.pdf
Apprentissage supervisé.pdf
 
Deep learning
Deep learningDeep learning
Deep learning
 
Ia project Apprentissage Automatique
Ia project Apprentissage AutomatiqueIa project Apprentissage Automatique
Ia project Apprentissage Automatique
 
Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...
Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...
Les réseaux de neurones convolutifs pour la classification des tumeurs cérébr...
 
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdfChapitre 4-Apprentissage non supervisé (1) (1).pdf
Chapitre 4-Apprentissage non supervisé (1) (1).pdf
 
Introduction au traitement d'images
Introduction au traitement d'imagesIntroduction au traitement d'images
Introduction au traitement d'images
 
Les réseaux de neurones
Les réseaux de neuronesLes réseaux de neurones
Les réseaux de neurones
 
Rapport projet Master 2 - Intelligence Artificielle
Rapport projet Master 2 - Intelligence ArtificielleRapport projet Master 2 - Intelligence Artificielle
Rapport projet Master 2 - Intelligence Artificielle
 

Semelhante a Algorithmes machine learning/ neural network / deep learning

Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)Soumia Elyakote HERMA
 
Quel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_problemeQuel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_problemePaul Blondel
 
Quel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_problemeQuel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_problemePaul Blondel
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data MiningTakfarinas KENOUCHE
 
Recursive Neural Network summary
Recursive Neural Network summaryRecursive Neural Network summary
Recursive Neural Network summaryStephen Larroque
 
Fondements du machine learning
Fondements du machine learningFondements du machine learning
Fondements du machine learningFrederic Simard
 
Apprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de rechercheApprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de recherchePhilippe YONNET
 
Présentation_IA.pptx
Présentation_IA.pptxPrésentation_IA.pptx
Présentation_IA.pptxmelissa943854
 
TP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdfTP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdfSafaeElOmari
 
FLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caretFLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caretjfeudeline
 
Reconnaissance de panneaux de signalisation routière en utilisant la détectio...
Reconnaissance de panneaux de signalisation routière en utilisant la détectio...Reconnaissance de panneaux de signalisation routière en utilisant la détectio...
Reconnaissance de panneaux de signalisation routière en utilisant la détectio...Loghin Dumitru
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdfimane26
 
Séminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave EiffelSéminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave EiffelMahdi Zarg Ayouna
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docxkhalil Ismail
 

Semelhante a Algorithmes machine learning/ neural network / deep learning (20)

Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)Exposé réseaux des neurones (NN) - (RN)
Exposé réseaux des neurones (NN) - (RN)
 
test
testtest
test
 
Quel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_problemeQuel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_probleme
 
Quel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_problemeQuel algo ml_pour_mon_probleme
Quel algo ml_pour_mon_probleme
 
Présentation sur le Data Mining
Présentation sur le Data MiningPrésentation sur le Data Mining
Présentation sur le Data Mining
 
Présentation pfe
Présentation pfePrésentation pfe
Présentation pfe
 
Recursive Neural Network summary
Recursive Neural Network summaryRecursive Neural Network summary
Recursive Neural Network summary
 
Fondements du machine learning
Fondements du machine learningFondements du machine learning
Fondements du machine learning
 
Le Machine Learning... tous aux fourneaux !
Le Machine Learning... tous aux fourneaux !Le Machine Learning... tous aux fourneaux !
Le Machine Learning... tous aux fourneaux !
 
Apprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de rechercheApprentissage Automatique et moteurs de recherche
Apprentissage Automatique et moteurs de recherche
 
Présentation_IA.pptx
Présentation_IA.pptxPrésentation_IA.pptx
Présentation_IA.pptx
 
TP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdfTP_Réseaux_de_neurones_Safae_ElOmari.pdf
TP_Réseaux_de_neurones_Safae_ElOmari.pdf
 
FLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caretFLTauR - Construction de modèles de prévision sous r avec le package caret
FLTauR - Construction de modèles de prévision sous r avec le package caret
 
Reconnaissance de panneaux de signalisation routière en utilisant la détectio...
Reconnaissance de panneaux de signalisation routière en utilisant la détectio...Reconnaissance de panneaux de signalisation routière en utilisant la détectio...
Reconnaissance de panneaux de signalisation routière en utilisant la détectio...
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
 
Rc ia-benmammar
Rc ia-benmammarRc ia-benmammar
Rc ia-benmammar
 
Séminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave EiffelSéminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
Séminaire IA & VA- Dominique Gruyer, Univ Gustave Eiffel
 
Réseaux neurons
Réseaux neuronsRéseaux neurons
Réseaux neurons
 
Rapport-du-projet CNN.docx
Rapport-du-projet CNN.docxRapport-du-projet CNN.docx
Rapport-du-projet CNN.docx
 
Cours rn 2006
Cours rn 2006Cours rn 2006
Cours rn 2006
 

Algorithmes machine learning/ neural network / deep learning

  • 1. A L G O R I T H M E S M L / D L Réalisé par Bassem Brayek Aicha Racil Ahmed Fathallah
  • 2. PLAN:  INTRODUCTION  PROCESSUS MACHINE LEARNING APPROCHES ET ALGORITHME RÉSEAU DE NEURONE/ DEEP LEARNING  CONCLUSION
  • 3. M L / D L - D A N S Q U E L L E P H A S E I N T E R V I E N T L E M A C H I N E L E A R N I N G ?   - Q U E L S   A L G O R I T H M E S U T L I S E R ?   - M A C H I N E L E A R N I N G E T D E E P L E A R N I N G   INTRODUCTION
  • 5. LES ALGORITHMES DE MACHINE LEARNING: https://www.slideshare.net/awahid/big-data-and-machine-learning-for-businesses
  • 6. Les classes sont connues.  Prédire les classes à partir d'une base d'apprentissage. La sortie est une  catégorie.  CLASSIFICATION
  • 7. Principe: calcule la distance entre deux observations, il rend une décision en minimisant la distance entre les membres des différentes classes.  Avantage: - robuste au sur-apprentissage                        - Modélisation non linéaire  Problèmes: - Consommation de mémoire                           -  Non adéquat pour les                                     traitements parallèles et                                 incrémentaux.                1-SVM
  • 8. Prédiction linéaire.  La sortie peut prendre deux valeurs. Basée sur la fonction logistique. Sur-apprentissage: faible probabilité  Non adéquat pour les relations complexes: non linéaire.  2-RÉGRESSION    LOGISTIQUE
  • 9. Le nombre K est pré-fixé.  Calcule de la distance:                   * Distance euclidienne                   * Distance de Minkowski                 * Distance de Manhattan...  Le choix est basé sur un calcule de probabilité.  Dédié au nombre limité d'entrées. 3- KNN
  • 10. La construction de l'arbre avec CART ou bien ID3 . Avantages: Simplicité de compréhension                      Robustesse                                                Fonctionnel pour les problème                    non linéaires.  Inconvénients: le sur-apprentissage.  4-ARBRE DE    DÉCISION
  • 11. La Régression: Les algorithmes de régression permettent de prédire des valeurs continues à partir des variables prédictives.                         Un algorithme de régression permet de trouver un modèle en fonction  des données d’entrainement. Le modèle calculé permettra de donner une estimation sur une nouvelle donnée non encore vue par l’algorithme.
  • 12. Principe: trouver une droite qui se rapproche le plus d'un ensemble de points. Avantages: performant pour les données                      linéaires                                   Inconvénients: - limité aux relations                                      linéaires.                                                - Les données doivent être                            indépendantes 1-RÉGRESSION LINÉAIRE
  • 13. Une arborescence de régression peut être considérée comme une variante des arbres de décision, conçue pour approximer des fonctions à valeur réelle, au lieu d'être utilisée pour des méthodes de classification. 2- ARBRE DE RÉGRESSION
  • 14. 3- RANDOM FOREST Une forêt de regression est une collection d'arbres de regression formés au hasard. Avantage :  Interprétabilité. Inconvénient :  Lent pour créer des prédictions après la phase d'entrainement .
  • 15. Clustering Données non étiquetées. Le nombre de cluster est inconnu au départ.  Regroupement de données selon leurs ressemblances
  • 16. K est le nombre de clusters à obtenir. Traitement itératif. Avantages: -Simplicité                                       -Adéquat pour les                    grandes masses de                    données.                 Inconvénients: -le nombre k est                        prédéfini                                       - le résultat dépend                         du choix des                        centres initiaux.                                                  1-KMEANS 
  • 17. Association Type de données: Données non étiquetées. Principe: Permet de déterminer les relations entre les différents attributs.  
  • 18. Détermine les règles d'association dans un jeu de données. Traitement itératif. Avantage: Simple à utiliser                                                   Inconvénient: Un nombre considérable d'accès à la base de données. 1-APRIORI
  • 20. RÉSEAU DE NEURONE Une collection de neurones Il apprend en utilisant des algorithmes d'apprentissage qui modifient légèrement les poids
  • 22. LES DIFFÉRENTES CLASSIFICATION DES RÉSEAUX : feedforward feedback 1- Types de connections
  • 23. LES DIFFÉRENTES CLASSIFICATION DES RÉSEAUX : 2- Types d'apprentissage
  • 24. LES DIFFÉRENTES CLASSIFICATION DES RÉSEAUX : 3- Topologies
  • 25. APPRENTISSAGE PROFOND: DEEP LEARNING Le deep learning est une méthode d'apprentissage qui utilise des réseaux de neurones à plusieurs couches. Les réseaux à couches multiples existaient depuis des années, ce qui est nouveau, c'est les algorithmes d'apprentissage Un réseau de neurones profond consiste en une hiérarchie de couches, chacune transforme les données d'entrée en une représentation plus abstraite.
  • 27. PROBLÈMES DES ALGORITHMES ML: Sur-apprentissage: quand le modèle devient trop lié à la base d'apprentissage et se généralise mal. Sous-apprentissage: Le modèle est incapable de fournir des prédictions précises.
  • 28. RÉDUCTION DE L'OVERFITTING : Réduire la taille du réseau. Validation croisée (séparation du données en partie d'apprentissage et partie de validation). Régularisation (weight decay : pénaliser les grand poids).
  • 29. G R A N D S N O M B R E S D ' A L G O R I T H M E S B E S O I N D E S É T A P E S D E P R É P A R A T I O N E T D E S T R U C T U R A T I O N . CONCLUSION ET PERSPECTIVES Quels outils permettant de faciliter et d'automatiser ces tâches ? 
  • 30. NOS SOURCES Master Machine Learning Algorithms. Jason Brownlee. https://machinelearningmastery.com/overfitting-and-underfitting-with-machine- learning-algorithms/ http://neuralnetworksanddeeplearning.com https://mrmint.fr/overfitting-et-underfitting-quand-vos-algorithmes-de-machine- learning-derapent https://docs.microsoft.com/en-us/azure/machine-learning/studio/algorithm-choice
  • 33. A B P E N S ID3 Initialisation par un arbre vide Calcule de l'entropie totale . On prend attribut par attribut. Pour chaque valeur d'attribut on calcule sa probabilité et son entropie. On calcule le gain en information de chaque attribut. L'attribut qui a le gain le plus important sera sélectionné. Traitement itératif.
  • 34. A B P E N S CART Répartition des données sur des groupes. Poser toutes les questions possibles. Evaluation de l'arbre obtenu
  • 35. A B P E N S GRADIANT DESCENT Choisir une fonction coût Fixer les paramètre initiaux (nombre aléatoire de gauss avec un petit écart type) Calculer le gradiant de cette fonction dans cette position Mise à jour de la position en fonction du gradiant
  • 36.
  • 38.
  • 39. 1 Algorithme Exactitude temps d'exécution Linéarité remarques Logistic regression SVM Recommandé pour grandes masses de données kmeans Random forest Naive bayise