2. Plan
Introduction
Apprentissage automatique
Apprentissage supervisé
Apprentissage non supervisé
Apprentissage par renforcement
Conclusion
2
3. Apprentissage automatique
L'apprentissage automatique fait reference au developpement,
l'analyse et l'implementation des methodes qui permettent a une
machine (au sens large) d'evoluer et ainsi de remplir des taches
qu'il est difficile ou impossible de remplir par des moyens
algorithmiques plus classiques
3
4. Herbert Simon :
<<
L'apprentissage dénote des changements dans un systeme
qui ... lui permet de faire la mème tache plus efficacement
la prochaine fois.
>>
4
7. Exemple de systemes apprenant
Un robot ayant la capacite de bouger ses
membres mais ne sachant initialement rien de
la coordination des mouvements permettant la
marche,peut apprendre a marcher.
Le robot commencera par effectuer des
mouvements aleatoires, puis, en
selectionnant et privilegiant les mouvements lui
permettant d'avancer, mettra
peu a peu en place une marche de plus en plus
efficace. video
7
8. 2 grands types d'apprentissage :
Apprentissage supervisé
Apprentissage non supervisé
Apprentissage par renforcement
8
9. ◦ Apprentissage supèrvisé
Le but est de generaliser à des entrées inconnues ce qui a
pu etre appris grace aux donnees deja traitees par des
experts
donc, géneralement l’Objectif est de déterminer une
fonction de prediction f selon les données d'apprentissage
9
10. Selon ces données d'apprentissage qui sont N couples
entrée-sortie (xn ; yn ) le système va chercher la fonction
adéquate
A quelle fonction correspond cet ensemble de points ?
10
11. Le principe de ce système est que
11
« les hypothèses suffisantes les plus
simples sont les plus vraisemblables »
12. Quelques exemples classiques de techniques de
classification supervisée :
Les réseaux de neurones, très utilisés dans les années
80-90, sont inspirés à l’origine du fonctionnement du
cerveau humain.
Les arbres de décision modélisent la fonction à
apprendre par une succession de critères organisés
suivant une structure arborescente.
Les « SVM » ou « machines à vecteurs supports » sont
les techniques les plus efficaces pour résoudre ce
problème à l’heure actuelle.
12
13. Apprentissage par renforcement
Le système apprenant est agent en interaction
avec un environnement
Le problème est découpé en pas de temps
A chaque pas, l'agent
-perçoit l‘état de l'environnement,
-puis, exécute une action dans l'environnement
13
14. Le but de l'agent est de trouver un
comportement qui maximise le
renforcement (récompense)
14
15. ./Principe de fonctionnement
1.L’agent décide d’effectuer une action en fonction de
son état pour interagir avec son environnement.
2.L'environnement renvoie un renforcement sous la
forme d’une récompense positive ou négative.
3.L’agent observe les effets de ses actions.
4.L’agent déduit de ses observations la qualité de ses
actions.
5.L’agent améliore ses actions futures.
15
16. Dans un problème d'apprentissage par
renforcement, un agent évoluant dans un
environnement aléatoire doit cumuler un
maximum de récompenses en choisissant
au fil du temps la meilleure politique,
c'est-à-dire la meilleure réaction possible
à ses observations. Une telle situation est
modélisée par un processus de décision
markovien
16
un économiste et sociologue américain ayant reçu le « prix Nobel » d'économie
On dira qu'une machine apprend des lors qu'elle change sa structure, son
programme ou ses donnees en fonction de donnees en entree de sorte a ce que ses performance futures deviennent
meilleures
L'objectif de l'apprentissage automatique est de concevoir des programmes
pouvant s'ameliorer automatiquement avec l'experience
Statique///////par observationpar renforcement
Par exemple le robot , quand il s’agit d’une x et y spécifique déjà tester et ne donne pas un resultat, c’est a eliminer
Pour le nettoyage d’une salté
Endommager les meubleterroriser un chat