SlideShare une entreprise Scribd logo
1  sur  52
Télécharger pour lire hors ligne
1
CEDAR : Un système de raisonnement à grande
échelle
14/03/2016
Samir Amir
2
 2005 : Ingénieur, Université de Blida
 2006 : Master, Université de Rennes 1
 2007 : Ingénieur R&D, Thomson Corporate Research
 2008-2011 : Doctorat, Université de Lille 1
 2011-2012 : ATER, Université de Lille 1
 2013-2015 : Post-doc, Université de Lyon 1
 10/2015 - … : Responsable Pôle R&D, Press'Innov
A propos de moi
2
3
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualisation.
- ...
Le Web d'aujourd'hui
4
Le Web d'aujourd'hui
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualisation.
- ...
Pas de raisonnement
5
Le Web d'aujourd'hui
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualisation.
- ...
Pas de raisonnement
Q1 : Trouver les personnalités africaines ayant visité
la France
La visite de Jacob Zuma à la COP21
6
Le Web d'aujourd'hui
Données structurées (html)
- Requête sur des données structurées.
- Moteur de recherche.
- Visualisation.
- ...
Pas de raisonnement
Q1 : Trouver les personnalités africaines ayant visité
la France
La visite de Jacob Zuma à la COP21
NULL
7
The Semantic Web is an extension of the current web in which information
is given well defined meaning, better enabling computers and people to
work in co-operation [Tim Berners-Lee]
Le Web Sémantique
8
The Semantic Web is an extension of the current web in which information
is given well defined meaning, better enabling computers and people to
work in co-operation [Tim Berners-Lee]
Le Web Sémantique
Comment ?
- Sémantique + contraintes + méthode de raisonement
Comment exprimer les conaissances ?
- Langage de decription (basé sur une logique)
Exemple ?
9
personne
personnalité
politique
musicien…..
ministre
président
…..
localisation
capitale
musicienpays…..
Président de
capitale de
événement
musicienécologique…..
lieu
TBox (Ontology)
Exemple (déduction)
politique
Disjoints
10
personne
personnalité
politique
musicien…..
ministre
président
…..
localisation
capitale
musicienpays…..
Président de
capitale de
événement
musicienécologique…..
lieu
TBox (Ontology)
ABox (Instances) - Jacob Zuma est un président
- Jacob Zuma a participé à la COP21
- COP21 est un évenement
- ….........
Exemple (déduction)
politique
TBox + Abox = base de connaissances
Disjoint
11
Le Web Sémantique
personne
personnalité
politique
musicien…..
ministre
président
…..
localisation
capitale
musicienpays…..
Président de
capitale de
événement
musicienécologique…..
lieu
TBox (Ontology)
ABox (Instances)
Exemple (déduction)
politique
TBox + ABox = Base de connaissances
Q1 : Trouver les personnalités africaines ayant visité la France Jacob Zuma
Disjoint
- Jacob Zuma est un président
- Jacob Zuma a participé à la COP21
- COP21 est un évenement
- ….........
12
Comment exprimer les conaissances ?
- KL-ONE
- Order-Sorted Feature (OSF)
- Logique de Description (DL)
- …..
Web Ontology Language (OWL)
W3C
Le Web Sémantique
13
Comment exprimer les conaissances ?
Le Web Sémantique
ABox : RDF (Ressource Desciption Framawork)
Jacob Zuma président
Type
AssistéA
COP21
Type
événement
- KL-ONE
- Order-Sorted Feature (OSF)
- Logique de Description (DL)
- …..
W3C
Web Ontology Language (OWL)
<rdf:Description rdf:about="#JacobZuma">
<rdf:type><foaf:Président></rdf:type>
<ex:AssistéA>COP21</AssistéA>
</rdf:Description>
………………...
14
La sémantique de OWL-DL
- Logique décidable
15
Exemple (OWL-DL)
16
Raisonneurs (DL)
- Pellet 1
- FaCT++ 2
- Racer 3
- HermiT 4
- RacerPro 3
1 : https://www.w3.org/2001/sw/wiki/Pellet
2 : http://owl.man.ac.uk/factplusplus/
3 : http://franz.com/agraph/racer/
4 : http://www.hermit-reasoner.com/
Approches DL (bottom-up)
17
Raisonnement à très grande échelle
Linked-Data : Objets connectés sous forme de graphes
Le Web de données (Linked Data)
18
Le Web de données (Linked Data)
Peut on passer à l'échelle ?
19
Algorithme de Tableau (Réponse Théorique)
- Construction explicite du modèle
- Décidable (modèle fini).
- Test de satisfaction.
Règles :
20
Algorithme de Tableau (Réponse Théorique)
21
Algorithme de Tableau (Réponse Théorique)
22
Contraintes et Évènements Dirigeant
l'Automatisation du Raisonnement
Coordinateur du projet : Hassan AIT-KACI
Objectif :
- Montrer les limites des systèmes de raisonnement existants
- Montrer qu'il y a un autre formalise capable de passer à l'échelle
Projet CEDAR (Chaire d'excellence ANR)
23
Projet CEDAR (Chaire d'excellence ANR)
Contraintes et Évènements Dirigeant
l'Automatisation du Raisonnement
Coordinateur du projet : Hassan AIT-KACI
Order-Sorted Feature (OSF)
Objectif :
- Montrer les limites des systèmes de raisonnement existants
- Montrer qu'il y a un autre formalise capable de passer à l'échelle
24
1) Order-Sorted Feature (OSF)
- Pouvoir expressif important.
- Compatible avec RDF (Web sémantique)
- Méthode de raisonnement paresseuse et incrémentale
2) Optimisation
- Encodage binaire des contraintes
3) Distribution
- Calcul parallèle.
- Passage à l'échelle.
CEDAR
25
Order-Sorted Feature (OSF)
26
OSF (sémantique)
27
OSF (Exemples)
28
Mapping OSF - RDF
29
OSF (Sémantique)
- Conjonction
- Disjonction
- Négation
- Agrégats
- Expressions régulières
- Cardinalité
- ...
30
Dissolution des termes OSF
31
Exemple :
Dissolution des termes OSF
32
Dissolution des termes OSF
33
Règles de normalisation (raisonnement)
34
Règles de normalisation (raisonnement)
35
Méthodes de Tableaux
OSF VS Tableaux (DL)
Règles OSF
- Construction explicite du modèle
- Décidable (modèle fini).
- Paresseux.
- Élimination.
- Incrémental.
36
Encodage binaire des contraintes
- Chaque concept sera représenté par un code binaire.
- Les opérations logiques sont applicables sur les codes.
- Navigation facile entre concepts.
- Optimisation.
37
Encodage binaire des contraintes
- teacher est un teacher (sorte 6 )⇒
- professor est un teacher (sorte 4)⇒ teacher (00101000)
38
- teacher est un teacher (sorte 6 )⇒
- professor est un teacher (sorte 4)⇒ teacher (00101000)
- teacher and researcher = 00101000 and 00011000 = 00001000 ⇒ professor
Encodage binaire des contraintes
39
person (teachesAt => institution, doesResearch => laboratory)
professor (teachesAt => university, doesResearch => laboratory)
40
X : person (teachesAt => institution, doesResearch => laboratory)
X : professor (teachesAt => university, doesResearch => laboratory)
Marie
type
medecin
teachesAt
Lyon 1
Dupont
type
professor
teachesAt
Lyon 1
RDF
doesReaseach
LIRIS
type
university
type
laboratory
Select ?x where {
?x type professor.
?x teachesAt ?y.
?y type university.
?x doesResearch ?z.
?z type laboratry }
OSF2SPARQL
41
Architecture de CEDAR
42
Expérimentations
Ontologies
- NCBI, MESH, CPO jusqu'à 1 million de concepts⇒
Triplets RDF
- 1 milliard
Requêtes
- 1 à 100 concepts
Comparaison
- Hermit, TrOWL, RacerPro, Pellet, ………...
43
Expérimentations (classification)
44
Expérimentations (requêtes déductives)
45
Critiques
Décidabilité
- A quel prix ?
- Implémentation de la partie décidable.
Monde ouvert VS monde fermé
- On raisonne par ce qu'on connaît.
- La plupart des cas sont concernés par la SMF.
Même avec une SMF, les résultats restent les
mêmes
46
Distribution
47
Distribution (Architecture)
SPARQL
- Passage à l'échelle
- Efficacité : pas toujours le cas !
48
Distribution (MapReduce)
49
- Partitionnement intelligent de données
- Réduire la corrélation entre les données.
- Indexation multidimensionnelle.
- Projection sur type, propriété, etc.
Distribution
50
CEDAR (utilisation)
- Grand Lyon (prototype)
Monitoring, gestion de données.
- Press'Innov (en cours)
Enrichissement des ontologies depuis un texte brut.
Site :
http://cedar.liris.cnrs.fr/
51
Questions
52

Contenu connexe

Similaire à Seminaire

Priows présentation des résultats
Priows présentation des résultats Priows présentation des résultats
Priows présentation des résultats Gilbert Paquette
 
Intelligence artificielle une_introduction
Intelligence artificielle une_introductionIntelligence artificielle une_introduction
Intelligence artificielle une_introductionAlain Mille
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueGautier Poupeau
 
Jabes 2009 - Session : projets innovants "L'indexation des ressources numéri...
Jabes 2009  - Session : projets innovants "L'indexation des ressources numéri...Jabes 2009  - Session : projets innovants "L'indexation des ressources numéri...
Jabes 2009 - Session : projets innovants "L'indexation des ressources numéri...ABES
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Lilia Sfaxi
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueAntidot
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersEmmanuelle Morlock
 
Les technologies TAL et le futur du SEO
Les technologies TAL et le futur du SEOLes technologies TAL et le futur du SEO
Les technologies TAL et le futur du SEOSEO Camp Association
 
Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...AbdeslamAMRANE3
 
Normes standards (numériques)
Normes standards (numériques)Normes standards (numériques)
Normes standards (numériques)Clément Dussarps
 
Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...
Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...
Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...ABES
 
Search, nosql et bigdata avec les moteurs de recherche
Search, nosql et bigdata avec les moteurs de rechercheSearch, nosql et bigdata avec les moteurs de recherche
Search, nosql et bigdata avec les moteurs de rechercheLucian Precup
 
Introduction à l'objet - Deuxième année ISIMA
Introduction à l'objet - Deuxième année ISIMAIntroduction à l'objet - Deuxième année ISIMA
Introduction à l'objet - Deuxième année ISIMALoic Yon
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Fabien Gandon
 
Implantation d’un nouveau système de gestion de bibliothèque à l’ULg
Implantation d’un nouveau système de gestion de bibliothèque à l’ULg Implantation d’un nouveau système de gestion de bibliothèque à l’ULg
Implantation d’un nouveau système de gestion de bibliothèque à l’ULg François Renaville
 
Une plateforme moderne pour le groupe SIPA/Ouest-France 
Une plateforme moderne pour le groupe SIPA/Ouest-France Une plateforme moderne pour le groupe SIPA/Ouest-France 
Une plateforme moderne pour le groupe SIPA/Ouest-France François-Guillaume Ribreau
 
Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Aline Deschamps
 

Similaire à Seminaire (20)

Priows présentation des résultats
Priows présentation des résultats Priows présentation des résultats
Priows présentation des résultats
 
Intelligence artificielle une_introduction
Intelligence artificielle une_introductionIntelligence artificielle une_introduction
Intelligence artificielle une_introduction
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Jabes 2009 - Session : projets innovants "L'indexation des ressources numéri...
Jabes 2009  - Session : projets innovants "L'indexation des ressources numéri...Jabes 2009  - Session : projets innovants "L'indexation des ressources numéri...
Jabes 2009 - Session : projets innovants "L'indexation des ressources numéri...
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
Les technologies TAL et le futur du SEO
Les technologies TAL et le futur du SEOLes technologies TAL et le futur du SEO
Les technologies TAL et le futur du SEO
 
Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...
 
Expose.ppt
Expose.pptExpose.ppt
Expose.ppt
 
Normes standards (numériques)
Normes standards (numériques)Normes standards (numériques)
Normes standards (numériques)
 
Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...
Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...
Journées ABES 2014 - Pourquoi fouiller les publications scientifiques ? Retou...
 
Search, nosql et bigdata avec les moteurs de recherche
Search, nosql et bigdata avec les moteurs de rechercheSearch, nosql et bigdata avec les moteurs de recherche
Search, nosql et bigdata avec les moteurs de recherche
 
C2i d4 scd-amu 2016
C2i d4 scd-amu 2016C2i d4 scd-amu 2016
C2i d4 scd-amu 2016
 
Introduction à l'objet - Deuxième année ISIMA
Introduction à l'objet - Deuxième année ISIMAIntroduction à l'objet - Deuxième année ISIMA
Introduction à l'objet - Deuxième année ISIMA
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
Implantation d’un nouveau système de gestion de bibliothèque à l’ULg
Implantation d’un nouveau système de gestion de bibliothèque à l’ULg Implantation d’un nouveau système de gestion de bibliothèque à l’ULg
Implantation d’un nouveau système de gestion de bibliothèque à l’ULg
 
Une plateforme moderne pour le groupe SIPA/Ouest-France 
Une plateforme moderne pour le groupe SIPA/Ouest-France Une plateforme moderne pour le groupe SIPA/Ouest-France 
Une plateforme moderne pour le groupe SIPA/Ouest-France 
 
Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"Matinale "Data Science et Machine Learning"
Matinale "Data Science et Machine Learning"
 

Dernier

Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxbahija babzine
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 

Dernier (6)

Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
Recurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptxRecurrent neural network_PresentationRNN.pptx
Recurrent neural network_PresentationRNN.pptx
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 

Seminaire