2. AI / IA
Artificial Intelligence
Machine Learning
Réseaux de neurones
Mathématiques appliquées
Deep Learning
Recherche ou Optimisation Opérationnelle
9. Data Science ⇆ IA
Jeux de données importants pour apprentissage
DeepLearning focus sur des données non structurées, difficiles
à modéliser ou tout simplement trop massives
Data Science ≠ IA
Math, Stats
Informatique Appliquées,
Backend, BDD
Math, Probabilites,
Algorithmie
Modélisation, test
10. “La vie d’un data scientist c’est avant tout de la
recherche, du nettoyage et de la structuration de
données, des interconnections informatiques, et
surtout de rattacher le métier à de la data en entrée et
en sortie”
12. IA
=
1- Perception :
Computer vision, Computer listening
Natural Language Processing (NLgeneration NLrecognition)
2 - Pattern recognition
Marketing predictif (ad tech), Détection de fraude, Maintenance Predictive
3 - That’s it !
13. IA Exemple
=
SIRI = NLP -> Patterns Recognition (machine learning puis deeplearning) -> NLP
Robotique humanoïde = (Computer Vision + NLP) -> Patterns (règles) -> NLP
Criteo = Patterns Recognition (deeplearning) -> Régles (métiers et machine learning)
14. a- Identification d’un jeu de données pertinent
b- Préparation du jeu de données (base d’apprentissage qualifiée)
c- Algorithmie et exploitation des données
Similarity
(“corrélation dans des espaces vectoriels compliqués”)
Clustering
Dimension reduction
Structured prediction
Anomaly detection
Neural nets (apprentissage récurrent)
d-Apprentissage
e-Exploitation = Analytics ou opérationnels (asservissements)
“La plupart des projets data et IA sont finalement assez
proches quand on en vient au coeur des algos”
15. Machine Learning
VS
Deeplearning
=
apprentissage supervisé VS non supervisé
deeplearning plus puissant mais on perd immédiatement le lien
aux règles métiers car la logique devient complètement
abstraite, informatique et probabiliste
Non supervisé = encore très loin (un peu de clustering)
16. Problématique liés aux projets IA
Quelle base d’apprentissage ?
Quantité de données
Qualité des données
(et surtout qualité de la qualification des datasets de référence)
Datasets classique
(une base d’apprentissage puis prod)
ou Datasets dynamique (apprentissage permanents)
Coût des ressources surtout si grosses base, apprentissage dynamique
et sujets complexes
17. Problématique liés aux projets IA
Quelle base d’apprentissage ?
La pertinence d’un projet IA (ROI, performance) est fortement liée
à la qualité de la base d’apprentissage
à la qualité des procédures de test/validation
à une approche très silotée/métier/verticale
Siri ne marche pas car le périmètre est trop large
vs
voiture autonome Google = 1,3 Millions de miles
18. Problématique liés aux projets IA
Pattern recognition et AI
= approche probabiliste et pas déterministe
→ attention aux business cases un peu critique
on ne peut pas “compter” sur une IA autonome pour des process critiques
(même 99% de perf ca fait quand même 1% de n’importe quoi)
par exemple prédire la bonne pub = ok
faire un diagnostic de cancer = ok
Donner l’horaire d’un train = pas ok (1% de fail)
cf image recognition de google ou l’IA de cortana devenue nazie en 24h
19. Business cases réussi via IA
Détection fraude
AdTech = apprentissage dynamique et patterns → oui top mais ne pas oublier les effets de bords et erreur pas grave sur ces business case (mauvaise
recommandation)
Computer vision = Gafa
NLP = cortana, google , watson
Medtech = énorme bases et jeux de données impossible de raisonner avec une logique donc deeplearning plus efficace (génomique, épidémiologie, diagnostics) →
utilisés comme des assistants et scoring avec une validation finale par des spécialistes. Beaucoup de contre exemple en ce moment
CRM = banque avec Watson → est ce que l’intéret de l’IA est de sortir des bus cases de gros jeux de données pour créer des regles “bêtes” ou faut il vraiment
déléguer à une machine la relation
Par exemple Google Now ou Google Travel ou Citymapper = pas de vraiment de l’IA poussée plus des règles avancées, ils n’ouvrent que des villes qu’ils maitrisent = lien
métier et terrain très fort pour une expérience utilisateur au top
Pitch SF Einstein Découvrez de nouvelles informations - Prévoyez les résultats - Recommandez les meilleures prochaines étapes - Automatisez les tâches
Business cases CRM Einstein = Scoring prédictif, Prédiction, Recommandations
20. Business cases conversationnels / bots
c’est quoi un bot ?
NLP in et out
Perception (robotique)
Moteur de Règles “simple” algorithmique
Moteur de Similarité/IA (projection de vecteurs sur des espaces vectoriels)
Beaucoup d’UX/UI