La modélisation des systèmes d’informations et l’interrogation de leurs données présentent de plus en plus un défi primordial qui ne cesse de s’imposer. Les solutions proposées dans la littérature étaient principalement organisées autour des bases de données (BD), des entrepôts de données et plus récemment, des ontologies. Cette multitude de formalismes a entraîné la nécessité d’étudier le couplage entre les différents supports de stockage et d’interrogation de l’information. Ce travail s’intéresse à étudier le couplage entre BD et ontologie recouvrant le même domaine d’étude, pour la satisfaction des requêtes utilisateurs. L'approche proposée se base sur un ensemble de règles définies et dédiées pour la recherche de l'information pertinente permettant de satisfaire les requêtes SQL et SPARQL. Un outil de couplage est également développé pour implémenter et valider nos propositions.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Approche de couplage de BD et d’ontologie pour l’aide à la décision sémantique : contribution pour les requêtes SQL et SPARQL
1. Approche de couplage de BD et d’ontologie pour
l’aide à la décision sémantique : contribution pour les
requêtes SQL et SPARQL.
Mariem Mahfoudh & Wassim Jaziri
{mariem.mahfoudh, wassim.jaziri}@gmail.com
ISIMS-MIRACL, Université de Sfax, Tunisie
Journal Technique et Science Informatiques
TSI 2013, volume 32
4èmes Journées Francophones sur les Ontologies
JFO 2011, 22-23 Juin 2011 – Montréal, Canada
1
2. Contexte
Besoin de modélisation des systèmes d’information.
Besoin d’interrogation de leurs données.
BDs
Entrepôt de données
Ontologies
Satisfaction des requêtes utilisateurs
En présence d’une multitude de cadres et formalismes
JFO 2011, TSI 2013
2
3. Contexte
Besoin de modélisation des systèmes d’information.
Besoin d’interrogation de leurs données.
BDs
Ontologies
Satisfaction des requêtes utilisateurs
En présence d’une multitude de cadres et formalismes
JFO 2011, TSI 2013
3
4. Plan
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion et perspectives
4
5. Travaux liés
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Formes de couplage entre BD et ontologie:
Suivre une approche BD puis dériver vers des spécifications
sémantiques conduisant à la construction d’une ontologie,
Entamer une approche ontologique aboutissant
construction de l’ontologie qui servira à concevoir la BD.
JFO 2011, TSI 2013
à
la
5
6. Travaux liés
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Construction des ontologies à partir des BDs.
Approches variées à des niveaux différentes.
Règles utilisées basées sur une extraction «plate» :
Structure de l’ontologie très proche du schéma de la BD.
La plupart des outils développés : une aide à la construction
d’ontologies .
Les ontologies résultantes contiennent certaines incohérences
et souffrent du manque de sémantique.
JFO 2011, TSI 2013
6
7. Travaux liés
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Construction des BDs à partir des ontologies.
Problèmes de redondance et d’incohérence de la BD résultante.
Perte de structure : la transformation n'est pas sans perte.
JFO 2011, TSI 2013
7
8. Travaux liés
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Limites des approches existantes :
Problèmes liés à la négligence des spécificités des ontologies
et des BDs.
La BD et l’ontologie n’ont ni la même
structure ni les mêmes composants
BD : évolutivité, efficacité de stockage, structuration idéale
permettant un temps optimal d’exécution des requêtes.
Ontologie : consensuelle, référençable, expressive, formelle,
fournit une contribution essentielle au défi de l'intégration des
données hétérogènes.
JFO 2011, TSI 2013
8
9. Travaux liés
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
L’utilisation simultanée de l’ontologie et de la BD apporte :
une structuration forte des données et une capacité de stockage
importante : la BD ;
une sémantique explicite : l’ontologie.
Etudier le mapping entre une ontologie et une BD
Orientation peu adoptée [Barrasa et al., 2004] [Hu et al., 2007].
JFO 2011, TSI 2013
9
10. Plan
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion et perspectives
10
11. Approche proposée
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Hypothèses :
La BD et l’ontologie existent déjà et sont cohérentes l’une vis-à-vis
de l’autre et qu’elles modélisent le même domaine d’étude.
La BD contient toutes les instances.
L’ontologie présente la sémantique du domaine d’étude et ne
contient aucun individu.
Nous nous plaçons dans le cadre d’un système visant à satisfaire
les requêtes classiques et sémantiques de l’utilisateur.
JFO 2011, TSI 2013
11
12. Approche proposée
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Nous distinguons trois catégories de requêtes :
Requête simple : comporte
explicitées dans la BD.
des
informations
directement
Requête sémantique : comporte des interrogations nécessitant
de déduire des connaissances.
Requête mixte : demande à la fois l’accès à la BD et à
l’ontologie.
JFO 2011, TSI 2013
12
13. Approche proposée
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Select … from
Analyse de la BD
et de l’ontologie
Création de fichier de
correspondance entre
BD et ontologie
Analyse des requêtes
utilisateurs
Déterminer type et réponse de la
requête utilisateur
Traitement des
requêtes utilisateurs
JFO 2011, TSI 2013
13
14. Approche proposée
Travaux liés
Analyse de la BD et
de l’ontologie
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Extraire les différents éléments de l’ontologie
( les concepts, les propriétés…) et de la BD
(les tables, les colonnes…)
Création de fichier de
correspondance
Analyse des requêtes
utilisateurs
Traitement des
requêtes utilisateurs
JFO 2011, TSI 2013
14
15. Approche proposée
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Analyse de la BD et
de l’ontologie
Création de fichier de
correspondance
Chercher les correspondances entre la BD et
l’ontologie :
synonymies, méronymies et
subsomptions.
Analyse des requêtes
utilisateurs
Traitement des
requêtes utilisateurs
JFO 2011, TSI 2013
15
16. Approche proposée
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Analyse de la BD et
de l’ontologie
Création de fichier de
correspondance
Analyse des requêtes
utilisateurs
Traitement des
requêtes utilisateurs
- Distinguer les mots réservés des langages
d‘interrogation de ceux introduits par l’utilisateur
- Déterminer la source de ces termes
- Déterminer leurs rôles.
JFO 2011, TSI 2013
16
17. Approche proposée
Travaux liés
Approche proposée
Traitement des requêtes
utilisateurs
Règles & Exemples
Implémentation
Conclusion
Lancer
Requête
Tous les termes BD
Tous les termes onto
termes {BD +ontologie}
terme {BD +ontologie}
Le langage de la requête est
capable d’interroger la BD ?
Transformer le langage
La requête est valide ?
Reformulation de la requête
Requête Simple
Requête erronée
JFO 2011, TSI 2013
17
18. Approche proposée
Travaux liés
Approche proposée
Traitement des requêtes
utilisateurs
Règles & Exemples
Implémentation
Conclusion
Lancer
Requête
Tous les termes BD
Tous les termes onto
termes {BD +ontologie}
terme {BD +ontologie}
Le langage est capable d’interroger
la BD et les termes ont des
correspondance dans la BD ?
La requête est valide ?
Transformer les termes en se basant
sur le fichier de correspondance
Extraction des connaissances
Requête Mixte
JFO 2011, TSI 2013
Requête
Sémantique
Requête
Erronée
18
19. Approche proposée
Travaux liés
Approche proposée
Traitement des requêtes
utilisateurs
Règles & Exemples
Implémentation
Conclusion
Lancer
Requête
Tous les termes BD
Tous les termes onto
termes {BD +ontologie}
terme {BD +ontologie}
Reformuler Req en se basant
sur le fichier de correspondance
JFO 2011, TSI 2013
19
20. Approche proposée
Travaux liés
Approche proposée
Traitement des requêtes
utilisateurs
Règles & Exemples
Implémentation
Conclusion
Lancer
Requête
Tous les termes BD
Tous les termes onto
termes {BD +ontologie}
terme {BD +ontologie}
Demander l’assistance
d’un expert
JFO 2011, TSI 2013
20
21. Approche proposée
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Approche appliquée dans le cadre de deux langages standards :
Le langage SQL (Structured Query Language) : le standard
utilisé par les principaux SGBD.
Une requête SQL peut être soit simple soit mixte.
Le langage SPARQL (Protocol And RDF Query Language) :
langage recommandé par le W3C et capable d’exploiter et
d’interroger les différents formalismes du Web sémantique.
Une requête SPARQL peut être soit simple, sémantique
ou bien mixte.
JFO 2011, TSI 2013
21
22. Plan
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion et perspectives
22
23. Règles & Exemples
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Règles :
Si une requête est inadaptée
Alors le système doit faire appel au fichier de correspondance et
remplacer les termes inadaptés par leurs synonymes s’ils existent
Sinon il va chercher dans les sous concepts en admettant
une reformulation par spécialisation
Sinon il faut suivre une reformulation par méronymie
JFO 2011, TSI 2013
23
24. Règles & Exemples
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Règles :
Si après reformulation par spécialisation, la requête demeure inadaptée :
Etendre la reformulation par spécialisation aux synonymes des concepts
fils.
Parcourir des niveaux plus profonds de la hiérarchie : chercher dans les
descendants des concepts fils et ne pas se limiter aux descendants
directs.
Exemple :
Select * from person
BD & Onto
Select Item
From Item
JFO 2011, TSI 2013
24
25. Règles & Exemples
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Règle :
Si une requête SPARQL a le prédicat « rdf:type » et demande l’affichage
d’un sujet
Alors, son but est d’afficher des instances ce qui nécessite de la traduire en
SQL et de l’orienter vers la BD où elles sont stockées toutes les instances.
Prefix rdf: http://www.w3.org/1999/02/22-rdf-syntax-ns#
Prefix onto: http://www.semanticweb.org/ontologies/2010/6/Ontology12.owl#
Select ?individu
Where { ?individu rdf:type onto:teacher }
sujet
predicat
objet
JFO 2011, TSI 2013
25
26. Plan
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion et perspectives
26
28. Implémentation
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
L’outil CoDBOnto :
Jena : plateforme Java pour la manipulation
des ontologies.
ZQL : API Java pour l’analyse syntaxique des
requêtes SQL.
ARQ : Analyse syntaxique des requêtes
SPARQL.
RitaWN : API java permettant un accès simple
à l'ontologie WordNet.
JDOM : API Java pour la manipulation de doc
XML.
Démonstration
JFO 2011, TSI 2013
28
29. Plan
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion et perspectives
29
30. Conclusion & Perspectives
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Etude des approches réalisant le couplage de BD et
d’ontologie.
Elaboration d’une démarche permettant de cohabiter
des BDs et des ontologies de domaine via un couplage
assurant la satisfaction des requêtes utilisateur.
Définition des règles permettant la reformulation des
requêtes SQL et SPARQL.
Implémentation de l’outil CoDBOnto.
JFO 2011, TSI 2013
30
31. Conclusion & Perspectives
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Perspectives :
Travailler
sur
l’amélioration
des
règles
l’enrichissement des services offerts par notre outil.
et
Mener des expérimentations poussées pour analyser
l’impact de nos différentes propositions.
Etudier la transformation des requêtes SPARQL en SQL
et inversement afin d'intégrer des fonctionnalités de
couplage plus avancées.
JFO 2011, TSI 2013
31
33. BD & Ontologie
Travaux liés
Select * from person
Approche proposée
Règles & Exemples
Implémentation
Conclusion
BD:
teacher (cin, name, category)
paper (cod_pap, title, date)
writes (cod_pap, cin)
Ontologie:
JFO 2011, TSI 2013
33
34. BD & Ontologie
Travaux liés
Approche proposée
Règles & Exemples
Implémentation
Conclusion
Select * from person
Ontologie:
Extrait XML de fichier de correspondance
JFO 2011, TSI 2013
34
34