SlideShare uma empresa Scribd logo
1 de 89
Baixar para ler offline
Portail d’ontologies et 
annotation sémantique de texte
Application en biomédecine et agronomie
Clement Jonquet
Maître de conférences en Informatique, Université de Montpellier (LIRMM)
Chercheur invité à  l’Université de Stanford (boursier Marie‐Curie H2020)
jonquet@lirmm.fr
Conférences INIST 
« Ingénierie des 
connaissances 2022 »
5 décembre 2017
Nancy, France
• LIRMM
• Clement Jonquet
• Vincent Emonet
• Anne Toulet
• Andon Tchechmedjiev
• Amine Abdaoui
• Zohra Bellahsene
• Amina Annane (ESI Algeria)
• Mathieu Roche (CIRAD)
• Sandra Bringay
• Juan Antonio LossioVentura
• Few MSc students / year
• Collaborators
• Pierre Larmande (IRD / IBC)
• Mark Musen (BMIR)
• John Graybeal (NCBO)
• Stefan Darmoni (CISMEF)
• Adrien Coulet (LORIA)
• Elizabeth Arnaud (CGIAR)
• Sophie Aubin (INRA)
• Esther Dzalé‐Yeumo (INRA)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
2
De quoi allons 
nous parler 
aujourd’hui ?
De données et de Web sémantique
D’ontologies et de librairies/portails 
d’ontologies
De 2 projets collaboratifs sur les services à 
base d’ontologies pour la santé et l’agronomie
 Challenges dans ces domaines
 Conclusion
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
3
Quelques éléments sur 
le Web sémantique & 
les ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
4
Big
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
5
Open
Linked
6
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
Evolution of the Linked Open Data 
Cloud over the last 10 years
http://lod‐cloud.net/
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
7
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
8
Explosion des 
données aussi dans 
l’agriculture
Le Web 
sémantique 
offre les 
technologies 
pour 
standardiser les 
ressources et 
les rendre 
interopérables
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
9
Tous les 
éléments du 
Web 
sémantique 
reposent sur 
RDF
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
10
Ontologies 
(petite)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
11
Ontologies 
(grosse)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
12
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
13
Contexte scientifique et 
objectifs du projet SIFR
Indexation Sémantique de Ressources biomédicales 
Francophones (www.lirmm.fr/sifr)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
14
Explosion des 
données en 
biomédecine
 La communauté biomédicale s’est tournée vers les ontologies et les 
terminologies pour structurer ses données et les rendre 
interopérables
 Limite de l’indexation par mots clés
 Créer des annotations sémantiques
 Besoin vital d’outils pour la gestions des ontologies et l’annotation de 
ressources en français
 Challenge de l’intégration de données
 Découvertes scientifiques cachées dans les données
 Big / Open / Linked data
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
15
Les ontologies 
et terminologies 
(bio) médicales 
ont adopté le 
Web 
sémantique
 SNOMED‐CT est une ontologie qui est maintenant développée (quasi 
nativement) en OWL
 ICD11 est développée grâce a l’outil iCat (Stanford)  qui repose sur 
Protégé l’éditeur de référence international pour les ontologies et 
terminologies en santé
 Le LIMICS (UMRS 1142) développe des ontologies dans chacun (ou 
presque) de ses projets de recherche
 Le NIH investi des millions de dollars sur l’interopérabilité des données 
(BD2K program) et des ontologies (NCBO BioPortal)
 FMA (Anatomie), HPO (Phénotypes), DO (Maladies), GO (Gene) sont des 
ontologies OWL de références pour la gestion et l’annotation des 
données
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
16
Indexer, fouiller, 
chercher des 
ressources de 
données en 
français… à 
l’aide des 
ontologies
 Développer un workflow d’annotation sémantique de 
données textuelles francophones et l’offrir sous forme 
de service ouvert et public à la communauté 
biomédicale française
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
17
Permettre la 
création 
d’applications 
qui utilisent la 
sémantique des 
ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
18
 Sur qu’elle plateforme déposer et identifier facilement une terminologie 
ou une ontologie dans le domaine de la santé en France ?
 Pas nécessairement des terminologies standards
 Les petits vocabulaires fait dans le cadre d’un projet
 Les alignements
 Les projets, la communauté, etc.
 Se rapprocher du web sémantique
 Quels outils sont disponibles facilement pour annoter sémantiquement du 
texte avec des concepts d’ontologies ?
 Je donne mon texte
 Je ne me soucie pas des aspects sémantiques ou linguistique
 Importance des aspects pratiques (en plus de la qualité): disponibilité, 
service, abstraction, URI, paramétrables, etc.
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
19
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
20
 Des projets  (santé)
 UMLF / VUMeF
 InterSTIS (2007‐2010)
 Des recensements
 Neveol et al.,LREC 2014
 Rapport ASIP Santé 2015: 71 terminologies recensées
 Des ontologies/vocabulaires publiés sur des thématiques particulières
 e.g., LIMICS, Bordeaux, Rouen, etc.
 Des plateformes / outils pour la gestion de ressources sémantiques
 ITM de Mondeca (et CAM)
 HeTOP et F‐MTi/ECMT (CISMEF)
 Des travaux sur la de fouille de texte et de données …
 Des choses non limitées à la santé
 TermSciences (INIST) … bientôt LOTERRE
A propos de librairies et 
portails d’ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
21
Un portail 
d’ontologies 
pourquoi faire ?
 Si j’ai développé une ontologie, comment je la met à disposition des 
autres à moindre coût ?
 Si j’ai besoin d’une ontologie, où est‐ce que je la récupère dans le 
format de mon choix ou l’utilise en ligne ? 
 S’il existe plusieurs possibilités, comment savoir qu’elle ontologie 
utiliser, laquelle est la plus appropriée pour ma tâche ?
 Comment est‐ce que je peux utiliser les ontologies pour lier/annoter
mes données ?
 Comment utiliser les ontologies sans avoir à les gérer ?
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
22
Ontology 
libraries & 
repositories
 Ontology libraries defined as 
 “a library system that offers various functions for managing, 
adapting and standardizing groups of ontologies. It should fulfill 
the needs for re‐use of ontologies. In this sense, an ontology 
library system should be easily accessible and offer efficient 
support for re‐using existing relevant ontologies and 
standardizing them based on upper‐level ontologies and ontology 
representation languages.” [Ding & Fensel, 2001]
 Ontology repositories defined as 
 “a structured collection of ontologies (…) by using an Ontology 
Metadata Vocabulary. References and relations between 
ontologies and their modules build the semantic model of an 
ontology repository. Access to resources is realized through 
semantically‐enabled interfaces applicable for humans and 
machines. Therefore a repository provides a formal query 
language” [Hartmann, Palma, Gomez‐Perez, 2009]
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
23
Qu’est ce qui 
existe comme 
librairie et portail 
d’ontologies ?
 Ontology repositories / portal
 NCBO BioPortal
 Ontobee
 AberOWL
 EBI Ontology Lookup Service
 OKFN Linked Open Vocabularies
 ONKI Ontology Library Service
 MMI Ontology Registry and 
Repository 
 ESIPportal
 AgroPortal
 SIFR BioPortal
 CISMEF HeTOP
 OntoHub
 Bartoc
 TermSciences
 Web indexes 
 Watson, Swoogle, 
Sindice, Falcons
 Ontology libraries / listings (more or 
less updated)
 OBO Foundry 
 WebProtégé
 Romulus
 DAML ontology library
 Colore
 FAO VEST Registry
 Orhtolang
 BioSharing
 DERI Vocabularies , 
OntologyDesignPatterns, 
Semanticweb.org, W3C Good 
ontologies
 Platform technology
 Mondeca ITM, LexEVS, SKOSMOS
 Abandoned projects
 Cubboard, Knoodl, Schemapedia, 
SchemaWeb, OntoSelect, 
OntoSearch, TONES
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
24
Portail et service 
d’annotation/inde
xation vont 
ensemble
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
25
BioPortal
Annotator
UMLS
MetaMap
OBO 
Foundry
Ontology
Lookup
Service
Whatizit
Focus sur le NCBO 
BioPortal : 
“one stop shop” 
pour les ontologies 
biomedicales
 Web repository for biomedical ontologies
 Make ontologies accessible and usable –
abstraction on format, locations, structure, etc.
 Users can publish, download, browse, search, 
comment, align ontologies  and use them for 
annotations both online and via a web services 
API.
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
26
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
27
• Online support for ontology
• Peer review & notes
• Versioning
• Mapping
• Search
• Resources
• Annotation
• Open source technology
• Packaged in a “virtual 
appliance”
• Set up your own 
“bioportal” in a few 
hours
http://bioportal.bioontology.org
Ontology 
Services
• Search
• Traverse
• Comment
• Download
Widgets
• Tree‐view
• Auto‐complete
• Graph‐view
Annotation
Data Access
Mapping 
Services
• Create
• Upload
• Download
Term recognition
Search “data”
annotated with a  
given term
http://data.bioontology.org
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
28
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
29
NCBO BioPortal 
data as of 2013
2 projets collaboratifs qui 
réutilisent la technologie 
du NCBO
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
30
C. Jonquet, A. Annane, K. Bouarech, V. Emonet & S. Melzi. 
SIFR BioPortal: French biomedical ontologies and 
terminologies available for semantic annotation, In 16th 
Journées Francophones d'Informatique Médicale
JFIM'16. Genève, Suisse, July 2016.
SIFR BioPortal
Une plateforme ouverte et 
générique pour les ontologies 
françaises
http://bioportal.lirmm.fr
25 ontologies/terminologies
• Importées d’UMLS et d’HeTOP
• Connectées au NCBO BioPortal
• Déposées par les utilisateurs
31
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
Elément 
complémentaire 
dans le paysage 
français
 Ouverte
 N’importe qui peut soumettre du contenu
 Générique
 N’importe quel type de contenu et de format
 Version spécifique du portail d’ontologie développé par le NCBO
 Plateforme de rattachement pour le service d’annotation
 25 (+4 privées) ontologies/terminologies médicales en français 
 Extraites de l’UMLS
 Fournies par CISMeF (via export OWL)
 Chargées directement par des utilisateurs
 Construites à partir de format ad‐hoc
 Connectées au NCBO BioPortal
 255K classes
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
32
http://bioportal.lirmm.fr 
Ontologies et 
terminologies 
disponibles
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
33
Recherche dans 
les ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
34
Alignements 
entre 
ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
35
Alignements 
multilingues
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
36
Recom‐
mandation
d’ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
37
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
38
Communauté
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
39
Projets qui 
utilisent des 
ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
40
French/SIFR 
Annotator
http://bioportal.lirmm.fr/annotator
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
41
Un nouvel outil
 Détecter et localiser des concepts d’ontologies dans des données 
textuelles
 Utiliser la sémantique des ontologies pour étendre et exploiter ces 
annotations
 Service web 
 d’accès libre et public 
 facilement interconnectable
 annotations aux formats standards comme JSON‐LD ou RDF
 paramétrable
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
42
Pour du texte 
donné
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
43
On obtient les 
annotations
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
44
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
45
Des 
fonctionnalités 
pour le texte 
clinique
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
46
Le patient ne montre aucun signe de fièvre. Son père a déjà eu 
de l’arthrose. Il a des antécédents de dépression.
AgroPortal: 
ontology 
repository for 
the agronomic 
domain
http://agroportal.lirmm.fr
 Develop and support a reference ontology repository
 Primary focus on the agronomy & close related domains (food, plant 
sciences, and biodiversity)
 Reusing the NCBO BioPortal technology
 Avoid to re‐implement what has been done, facilitate interoperability
 Reusing the scientific outcomes, experience & methods of the 
biomedical domain 
 Enable straightforward use of agronomic related ontologies
 Respect the requirements & specificities of the agronomic community 
 Fully semantic web compliant infrastructure
 Enable new science
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
47
C. Jonquet, A. Toulet, E. Arnaud, S. Aubin, E. Dzalé‐Yeumo, V. Emonet, J. Graybeal, M‐A. Laporte, M. A. 
Musen, V. Pesce & P. Larmande. AgroPortal: an ontology repository for agronomy, Computers and 
Electronics in Agriculture. IN PRESS, 2017. pp. 30. Elsevier.
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
48
5 Driving
AgronomicUse 
Cases
 IBC Rice Genomics & AgroLD project
 Data integration and knowledge management related to rice (P.
Larmande)
 RDA Wheat Data Interoperability working group
 Common framework for publishing wheat data (E. Dzalé-Yeumo)
 LovInra : INRA Linked Open Vocabularies
Vocabularies produced by INRA scientists (S. Aubin)
 Crop Ontology project
 Ontologies for describing crop germplasm & traits (E. Arnaud)
 GODAN global map of agri-food data standards
 VEST/AgroPortal MAP of standards (V. Pesce)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
49
Plus recement: 
GDR SemanDiv
Exemples
d’ontologies ou
vocabulaires
importées dans
AgroPortal
Title Forma
t
Groups Size
IBP RiceTrait Ontology (CO_320) OWL CROP, RICE ~2K
IBPWheatTrait Ontology (CO_321) OWL CROP, WHEAT ~1K
IBPWheat Anatomy Ontology (CO_121) OBO CROP, WHEAT ~80
IBP Crop Research (CO_715) OBO CROP ~250
Multi‐Crop Passport Ontology (CO_020) OBO CROP ~90
Biorefinery (BIOREFINERY) OWL LOVINRA ~300
MatterTransfer (TRANSMAT) OWL LOVINRA ~1.1K
Plant Ontology (PO) OWL WHEAT, RICE,
OBOF
~2K
PlantTrait Ontology (TO) OWL WHEAT, RICE,
OBOF
~4.4K
DurumWheat (DURUM_WHEAT) OWL LOVINRA ~130
Agricultural Experiments (AEO) OWL LOVINRA ~60
Environment Ontology (ENVO) OWL WHEAT, OBOF ~6.3K
NCBI Organismal Classification (NCBITAXON)  RRF WHEAT ~900K
AnaEEThesaurus (ANAEE) SKOS LOVINRA ~3.3K
French Crop Usage (CROPUSAGE) SKOS none ~300
Agrovoc (AGROVOC) SKOS none ~32K
Food Ontology (FOODON) OWL OBOF ~10K
National Agriculture Library Thesaurus
(NALT)
SKOS none ~67K
Global Agricultural Concept Scheme (GACS) SKOS none ~585K
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
D’intérêt pour 
la biodiversité
ENVO
PATO
ANAEE
TO
PO
BCO
TAXREF
TOP
…
50
Ontology groups 
and categories
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
Category Number
Plant Phenotypes andTraits 21
Plant Anatomy and Development 3
Natural Resources, Earth and Environment 9
Animal Science and Animal Products 6
Agricultural Research,Technology and Engineering 10
Breeding and Genetic Improvement 1
Plant Science and Plant Products 5
Plant Genetic Resources 2
Food and Human Nutrition 6
Taxonomic Classifications of Organisms 2
Farms and Farming Systems 3
Specific slices display to use only the
ontologies of a group
http://inra.agroportal.lirmm.fr/
51
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
52
REST Service API:
http://data.agroportal.lirmm.fr/documentation
SPARQL endpoint:
http://sparql.agroportal.lirmm.fr
Challenges pour les 
portails d’ontologies et  
propositions/resultats
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
53
Better ontology identification & selection 
(via  ontology metadata)
Multilingualism
Ontology alignment (creation & use)
Catching up with relevant data:
annotations and linked data
Generalized ontology‐based services 
(keep quality while enabling horizontal studies)
Scale 
to multiple domain and to the number/variety of ontologies
Challenges for 
ontology 
repositories
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
54
Better ontology identification & selection 
(via  ontology metadata)
Multilingualism
Ontology alignment (creation & use)
Catching up with relevant data:
annotations and linked data
Generalized ontology‐based services 
(keep quality while enabling horizontal studies)
Scale 
to multiple domain and to the number/variety of ontologies
Challenges for 
ontology 
repositories
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
55
Better ontology 
identification & 
selection
 First role of an ontology repository is to handle ontology 
metadata (model, extract, edit, valorize)
 Everything about an ontology
 Intrinsic properties e.g., name, URI, creation date
 Relation to other ontologies e.g., imports, is mapped to, disagrees 
with
 Community contributions e.g. notes, project using, endorsements
 Content‐based services e.g., SPARQL endpoint, bulk RDF 
download, search
 omv:usedOntologyEngineeringTool example
 What does it say about your community?
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
56
Building a list 
of properties to 
describe 
ontologies
 Pickup properties 
and relations from 23 
existing vocabularies
 Existing properties 
in ontology 
repositories 
(especially BioPortal)
 Non specific 
properties that may 
“return to the 
ontology” 346 relevant properties that could be 
used to described ontologies
127 used to build a new metadata model
inside AgroPortal
Ontology 
repositories 
metadata
Other Interesting 
vocabularies 
(e.g., IDOT, PAV, 
SD, DOAP, …)
Standards & 
Relevant (e.g., 
DC, DCAT, SKOS, 
OWL, PROV, 
OMV, VOID, 
VOAF, MOD …)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
57
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
58
Describe ontologies with semantic 
metadata
• Display “per ontology”
• Ontology specific properties => viewable and editable 
within the ontology specific page
• Everything you need to know about an ontology
• URIs used in the backend to store the information
• e.g., CC‐BY => 
https://creativecommons.org/licenses/by‐nd/4.0/
• “Get my metadata back” buttons
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
59
Browse and select ontologies
 Allows to search, order and select ontologies using a facetted 
search approach, based on the metadata
 4 additional ways to filter ontologies in the list
 2 new options to sort this list (name, released date).
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
60
AgroPortal landscape page
Display “per property”
 Global presentation of the properties
 Synthesis diagrams & listing
 Allows to explore the agronomical ontology landscape by 
automatically aggregating the metadata fields of each 
ontologies in explicit visualizations (charts, term cloud and 
graphs).
C. Jonquet, A. Toulet, V. Emonet. Two years after: a review of vocabularies and 
ontologies in AgroPortal, In International Workshop on sources and data integration in 
agriculture, food and environment using ontologies, IN‐OVIVE'17. Montpellier, France, July 
2017. pp. 13. EFITA.
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
61
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
62
Information about the community
Information 
about the 
ontology 
network
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
63
Next steps
 Develop a new standard ontology metadata model
 Harmonize ontology repositories
 MOD project: Metadata for Ontology Description and 
Publication Ontology
 https://github.com/sifrproject/MOD‐Ontology
 Add features within ontology editors
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
64
Better ontology identification & selection 
(via  ontology metadata)
Multilingualism
Ontology alignment (creation & use)
Catching up with relevant data:
annotations and linked data
Generalized ontology‐based services 
(keep quality while enabling horizontal studies)
Scale 
to multiple domain and to the number/variety of ontologies
Challenges for 
ontology 
repositories
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
65
Catching up 
with relevant 
data: 
annotations 
and linked data
 Data deluge
 Not necessarily 
connected to 
relevant ontologies
 Annotate data with 
ontology concepts
 Horizontal approach
ONTOLOGIES
RESOURCES
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
66
C. Jonquet, P. LePendu, S. Falconer, A. Coulet, N. F. Noy, M. A. Musen & N. H. Shah. NCBO 
Resource Index: Ontology‐Based Search and Mining of Biomedical Resources, Web 
Semantics. September 2011. Vol. 9 (3), pp. 316‐324. Elsevier.
Ontology – data 
cycle  Ontologies and data change everyday
 Need to be able to handle the “deltas” only
 Work on terminology and knowledge extraction from text
 BioTex (http://tubo.lirmm.fr/biotex) 
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
67
J.A. Lossio-Ventura, C. Jonquet, M. Roche & M. Teisseire. Biomedical
term extraction: overview and a new methodology, Information
Retrieval, Special issue on Medical Information Retrieval. August 2015.
Vol. 19 (1), pp. 59-99. Springer.
The role of the 
ontology 
repository is 
not clear here
 We built the NCBO Resource Index as a 
searchable  database of around 50 biomedical 
resources semantically indexed, with 
annotations
 Since then, linked open data has become the 
approach in the semantic web
 In agronomy: build a database of resources 
described in RDF, and annotated with 
ontologies: the AgroLD project 
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
68
AgroLD
semantic web oriented 
data integration 
platform for plant 
biology
www.agrold.org
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
69
Ontologies
Knowledge in AgroLD
multiple data sources annotated with 
reference ontologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
70
Multiple APIs 
(REST, SPARQL)
Multiple querying 
interfaces (e.g., 
relations network)
Galaxy wrapper 
available
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
71
Ontologies used
in AgroLD
8 databases
37M triples
9 ontologies
Better ontology identification & selection 
(via  ontology metadata)
Multilingualism
Ontology alignment (creation & use)
Catching up with relevant data:
annotations and linked data
Generalized ontology‐based services 
(keep quality while enabling horizontal studies)
Scale 
to multiple domain and to the number/variety of ontologies
Challenges for 
ontology 
repositories
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
72
Scoring of 
annotations
 Improve the NCBO Annotator results by ranking the 
annotations according to their relevance 
 While not changing the service implementation
 Take into account their frequencies (as originally proposed in 2009 and 
removed)
 Add a term extraction measure, called C‐Value, used to positively 
discriminate annotations generated from matches with multi‐word 
terms.
 Mostly improves annotations done with multiword terms
 2 new scoring methods allowing to score and rank annotations 
by their importance in the given input data
 Interesting results validated against PubMed manual annotations
S. Melzi & C. Jonquet. Scoring semantic annotations returned by the NCBO Annotator, In 7th International Semantic
Web Applications and Tools for Life Sciences, SWAT4LS'14. Berlin, Germany, Dec. 2014.
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
73
Improve the 
workflow to 
handle clinical 
text narrative
 Detecting Negation, 
Temporality and Experiencer
 Implementation using NegEx/ConText
 Inclusion in the French/SIFR Annotator
 Proxy architecture to plug this the NCBO 
Annotator
 Very good performance results
 e.g., negation F1 between  0.8 and 0.9
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
74
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
75
SIFR Annotator – semantic annotation of French biomedical text 
with ontologies
Better ontology identification & selection 
(via  ontology metadata)
Multilingualism
Ontology alignment (creation & use)
Catching up with relevant data:
annotations and linked data
Generalized ontology‐based services 
(keep quality while enabling horizontal studies)
Scale 
to multiple domain and to the number/variety of ontologies
Challenges for 
ontology 
repositories
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
76
Scale to 
multiple 
domain and to 
the 
number/variety 
of ontologies
There are 596 ontologies and +110 
ontology views in
BioPortal right now
 Mostly biology and medicine
 Overlaps with other domains
 Lots of upper level ontologies
 Lots of vocabularies 
AgroPortal, MMI Portal, 
ESIP Portal, EcoPortal ? 
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
77
Mutualize 
efforts
 No repository (except the Web itself) 
will handle them all, while keeping
the level of features (and curation?)
 Will each domain build they own technology?
 Sharing the technology is the best way to guaranty long term 
support and future development
 Developers all around the world
 Different funders & support
 Sharing the technology is the best way to make ontology 
repositories interoperable
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
78
Network of 
interconnected 
BioPortalS – a 
few thoughts
 UI does not really matter
 We should be able to make a new
portal for another community in minutes
 Avoid duplicating ontologies
 Connect portals one another
 Through mappings as we did with translation mappings
 The annotator proxy feature
 Implement and discuss standards
 SKOS handling in BioPortal
 Ontology metadata description
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
79
Proxy service 
architecture
 Most of our new features are 
developed within a proxy
 E.g., we can call either the 
AgroPortal, SIFR BioPortal 
or even the NCBO 
BioPortal Annotator and 
use the same code to score 
annotations
 Used this to set up an 
enhanced version of the 
NCBO Annotator
80
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
NCBO 
Annotator +
 A remote BioPortal UI 
which actually talks to 
the main BioPortal 
REST API
 Interesting for future 
interoperable 
BioPortal instances
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
81
Conclusion
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
82
Résumé
 Importance des ontologies et des technologies 
du Web sémantique pour les données FAIR
 L’utilisation des ontologies pour l’annotation de 
données restent la killer‐app
 Etendre a d’autres type de donnés (multimédia) ? 
 D’autres processus d’annotation ou de liftage de 
données ouvertes et liées
 Des vrais challenges pour les portails d’ontologies
 Besoin de fournir des outils/plateformes adaptées 
à chaque communautés tout en gardant de la 
généricité
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
83
Convergence 
avec les travaux
de l’INIST
 Projet VisaTM: Offre de fouille de texte via OpenMinted
 Vous emmenez les corpus (ISTEX) nous emmenons les ontologies 
(AgroPortal)
 Si on fait le boulot pour connecter la technologie NCBO a OpenMinted, 
autant le réutiliser
 Projet LOTERRE et ORHTOLANG 
 Ressources en OWL, SKOS… pourquoi pas essayer une instance de la 
technologie NCBO ?
 Harmoniser nos métadonnées
 Partager nos efforts, passer à d’autres domaines, d’autres échelles.
 GDR SemanDiv
 AgroPortal, alignements entre thesaurus et ontologies
 FAIR Data Management Plan 
 Aider a identification des ontologies adequate pour les données
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
84
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
85
http://bioportal.lirmm.fr/ontologies/
PSYCHOPATHO
https://loterre‐
dev.inist.fr/Psychopathologies
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
86
http://bioportal.lirmm.fr/annotator
http://services.bioportal.lirmm.fr/annotator/?text=L'alcoolisme (ou l'alcoolodépendance) est un 
type d'abus de substance mais il y a en général aucun signe de carence affective la dedans.
&ontologies=PSYCHOPATHO
&longest_only=true
&negation=true
&score=cvalue
Merci.
Plus de slides ?
jonquet@lirmm.fr
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
87
Create mappings 
with external 
mapping tool(s) 
and then store 
them in BioPortal
Select ontologies to align (from 
BioPortal or not)
Align ontologies for instance with Yam++
Automatically export the results to 
BioPortal
Reuse mappings for annotation, 
indexing and future mapping generation
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
106
AgroPortal mapping life cycle (work in progress)
Conférences INIST “IC 2022” ‐5/12/17 ‐Nancy, France
107

Mais conteúdo relacionado

Semelhante a Portail d’ontologies et annotation sémantique de texte - Application en biomédecine et agronomie

16-02-03_eLene4work_numerique_FTLV_Paris
16-02-03_eLene4work_numerique_FTLV_Paris16-02-03_eLene4work_numerique_FTLV_Paris
16-02-03_eLene4work_numerique_FTLV_ParisDeborah Arnold
 
Program
ProgramProgram
ProgramAnact
 
Un living lab pour Genève
Un living lab pour GenèveUn living lab pour Genève
Un living lab pour GenèveGenève Lab
 
Inria - Plaquette de présentation du centre de sophia
Inria - Plaquette de présentation du centre de sophiaInria - Plaquette de présentation du centre de sophia
Inria - Plaquette de présentation du centre de sophiaInria
 
Forum 02 ressources numeriques
Forum 02 ressources numeriquesForum 02 ressources numeriques
Forum 02 ressources numeriquesMATICE_CDP
 
Rapport academie sciences 2013 : Apprentissage de l'informatique.
Rapport academie sciences 2013 : Apprentissage de l'informatique.Rapport academie sciences 2013 : Apprentissage de l'informatique.
Rapport academie sciences 2013 : Apprentissage de l'informatique.Arsenic Paca
 
TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16
TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16
TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16Jean-François CECI
 
Inria - Plaquette du centre de recherche Rennes - Bretagne Atlantique
Inria - Plaquette du centre de recherche Rennes - Bretagne AtlantiqueInria - Plaquette du centre de recherche Rennes - Bretagne Atlantique
Inria - Plaquette du centre de recherche Rennes - Bretagne AtlantiqueInria
 
Ingénierie ontologique pour la création et la gestion des ressources éducativ...
Ingénierie ontologique pour la création et la gestion des ressources éducativ...Ingénierie ontologique pour la création et la gestion des ressources éducativ...
Ingénierie ontologique pour la création et la gestion des ressources éducativ...Simon Carolan
 
La professionnalisation des étudiants en informatique par les projets libres.
La professionnalisation des étudiants en informatique par les projets libres.La professionnalisation des étudiants en informatique par les projets libres.
La professionnalisation des étudiants en informatique par les projets libres.here_and_there
 
Test 2
Test 2Test 2
Test 2Gos6
 

Semelhante a Portail d’ontologies et annotation sémantique de texte - Application en biomédecine et agronomie (20)

16-02-03_eLene4work_numerique_FTLV_Paris
16-02-03_eLene4work_numerique_FTLV_Paris16-02-03_eLene4work_numerique_FTLV_Paris
16-02-03_eLene4work_numerique_FTLV_Paris
 
CV JMOgier - ULR(1)
CV JMOgier - ULR(1)CV JMOgier - ULR(1)
CV JMOgier - ULR(1)
 
Program
ProgramProgram
Program
 
Un living lab pour Genève
Un living lab pour GenèveUn living lab pour Genève
Un living lab pour Genève
 
Inria - Plaquette de présentation du centre de sophia
Inria - Plaquette de présentation du centre de sophiaInria - Plaquette de présentation du centre de sophia
Inria - Plaquette de présentation du centre de sophia
 
Forum 02 ressources numeriques
Forum 02 ressources numeriquesForum 02 ressources numeriques
Forum 02 ressources numeriques
 
Rapport academie sciences 2013 : Apprentissage de l'informatique.
Rapport academie sciences 2013 : Apprentissage de l'informatique.Rapport academie sciences 2013 : Apprentissage de l'informatique.
Rapport academie sciences 2013 : Apprentissage de l'informatique.
 
TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16
TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16
TEDuX « Pratiques pédagogiques innovantes » au CAIRE le 26-05-16
 
Introduction au Plan de Gestion de Données
Introduction au Plan de Gestion de DonnéesIntroduction au Plan de Gestion de Données
Introduction au Plan de Gestion de Données
 
Inria - Plaquette du centre de recherche Rennes - Bretagne Atlantique
Inria - Plaquette du centre de recherche Rennes - Bretagne AtlantiqueInria - Plaquette du centre de recherche Rennes - Bretagne Atlantique
Inria - Plaquette du centre de recherche Rennes - Bretagne Atlantique
 
Ontology Repository and Ontology-based Services
Ontology Repository and Ontology-based ServicesOntology Repository and Ontology-based Services
Ontology Repository and Ontology-based Services
 
Liege2011 philippe signoret
Liege2011 philippe signoretLiege2011 philippe signoret
Liege2011 philippe signoret
 
Introduction aux données de la recherche
Introduction aux données de la rechercheIntroduction aux données de la recherche
Introduction aux données de la recherche
 
Ingénierie ontologique pour la création et la gestion des ressources éducativ...
Ingénierie ontologique pour la création et la gestion des ressources éducativ...Ingénierie ontologique pour la création et la gestion des ressources éducativ...
Ingénierie ontologique pour la création et la gestion des ressources éducativ...
 
SIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophonesSIFR : Indexation sémantique de ressources biomédicales francophones
SIFR : Indexation sémantique de ressources biomédicales francophones
 
Pourquoi une université numérique
Pourquoi une université numériquePourquoi une université numérique
Pourquoi une université numérique
 
Mmi ecole d'été
Mmi ecole d'étéMmi ecole d'été
Mmi ecole d'été
 
Jilani Lamloumi, University of Tunis
Jilani Lamloumi, University of TunisJilani Lamloumi, University of Tunis
Jilani Lamloumi, University of Tunis
 
La professionnalisation des étudiants en informatique par les projets libres.
La professionnalisation des étudiants en informatique par les projets libres.La professionnalisation des étudiants en informatique par les projets libres.
La professionnalisation des étudiants en informatique par les projets libres.
 
Test 2
Test 2Test 2
Test 2
 

Mais de INRAE (MISTEA) and University of Montpellier (LIRMM)

Mais de INRAE (MISTEA) and University of Montpellier (LIRMM) (20)

Ontology repositories and case study with OntoPortal
Ontology repositories and case study with OntoPortalOntology repositories and case study with OntoPortal
Ontology repositories and case study with OntoPortal
 
Ontology Repositories and Semantic Artefact Catalogues with the OntoPortal Te...
Ontology Repositories and Semantic Artefact Catalogues with the OntoPortal Te...Ontology Repositories and Semantic Artefact Catalogues with the OntoPortal Te...
Ontology Repositories and Semantic Artefact Catalogues with the OntoPortal Te...
 
Semantic artefact and ontology services for long-term data interpretation
Semantic artefact and ontology services for long-term data interpretationSemantic artefact and ontology services for long-term data interpretation
Semantic artefact and ontology services for long-term data interpretation
 
O’FAIRe: Ontology FAIRness Evaluator in the AgroPortal semantic resource rep...
O’FAIRe: Ontology FAIRness Evaluator in theAgroPortal semantic resource rep...O’FAIRe: Ontology FAIRness Evaluator in theAgroPortal semantic resource rep...
O’FAIRe: Ontology FAIRness Evaluator in the AgroPortal semantic resource rep...
 
Presentation OntoCommons Workshop March 2021
Presentation OntoCommons Workshop March 2021Presentation OntoCommons Workshop March 2021
Presentation OntoCommons Workshop March 2021
 
Presentation FAIRsFAIR workshop (June 2021)
Presentation FAIRsFAIR workshop (June 2021)Presentation FAIRsFAIR workshop (June 2021)
Presentation FAIRsFAIR workshop (June 2021)
 
Presentation FAIRsFAIR workshop (April 2020)
Presentation FAIRsFAIR workshop (April 2020)Presentation FAIRsFAIR workshop (April 2020)
Presentation FAIRsFAIR workshop (April 2020)
 
Tutorial: “How to use ontology repositories and ontology–based services”
Tutorial: “How to use ontology repositories and ontology–based services”Tutorial: “How to use ontology repositories and ontology–based services”
Tutorial: “How to use ontology repositories and ontology–based services”
 
Mastering an ontology & vocabulary management technology in France ?
Mastering an ontology & vocabulary management technology in France ?Mastering an ontology & vocabulary management technology in France ?
Mastering an ontology & vocabulary management technology in France ?
 
FAIR data requires FAIR ontologies, how do we do?
FAIR data requires FAIR ontologies, how do we do?FAIR data requires FAIR ontologies, how do we do?
FAIR data requires FAIR ontologies, how do we do?
 
AgroPortal : a vocabulary and ontology repository for agronomy, plant science...
AgroPortal : a vocabulary and ontology repository for agronomy, plant science...AgroPortal : a vocabulary and ontology repository for agronomy, plant science...
AgroPortal : a vocabulary and ontology repository for agronomy, plant science...
 
Tutoriel : "Gestion d’ontologies"
Tutoriel : "Gestion d’ontologies"Tutoriel : "Gestion d’ontologies"
Tutoriel : "Gestion d’ontologies"
 
About the use of biomedical ontologies to play with text in the context of th...
About the use of biomedical ontologies to play with text in the context of th...About the use of biomedical ontologies to play with text in the context of th...
About the use of biomedical ontologies to play with text in the context of th...
 
Challenges for ontology repositories and applications to biomedicine and agro...
Challenges for ontology repositories and applications to biomedicine and agro...Challenges for ontology repositories and applications to biomedicine and agro...
Challenges for ontology repositories and applications to biomedicine and agro...
 
Presentation AgroPortal
Presentation AgroPortalPresentation AgroPortal
Presentation AgroPortal
 
A few contributions of the SIFR (Semantic Indexing of French biomedical Resou...
A few contributions of the SIFR (Semantic Indexing of French biomedical Resou...A few contributions of the SIFR (Semantic Indexing of French biomedical Resou...
A few contributions of the SIFR (Semantic Indexing of French biomedical Resou...
 
AgroPortal : a proposition for ontology- based services in the agronomic domain
AgroPortal : a proposition for ontology- based services in the agronomic domainAgroPortal : a proposition for ontology- based services in the agronomic domain
AgroPortal : a proposition for ontology- based services in the agronomic domain
 
Roadmap for a multilingual BioPortal
Roadmap for a multilingual BioPortalRoadmap for a multilingual BioPortal
Roadmap for a multilingual BioPortal
 
Presentation Sommet iPad en education 2014 Polytech Montpellier
Presentation Sommet iPad en education 2014 Polytech MontpellierPresentation Sommet iPad en education 2014 Polytech Montpellier
Presentation Sommet iPad en education 2014 Polytech Montpellier
 
BioPortal: ontologies and integrated data resources at the click of a mouse
BioPortal: ontologies and integrated data resourcesat the click of a mouseBioPortal: ontologies and integrated data resourcesat the click of a mouse
BioPortal: ontologies and integrated data resources at the click of a mouse
 

Portail d’ontologies et annotation sémantique de texte - Application en biomédecine et agronomie