1. INRA form@doc 2009 - D. L'Hostis -
Décembre 2009
Interroger Pubmed
différemment :
GoPubmed
www.gopubmed.com
2. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
GoPubmed
Introduction - 1
GoPubMed est un outil qui, en plus de
retourner exactement les mêmes résultats
que PubMed lors d’une recherche, exploite
différents systèmes de classification
sémantique (thésaurus MESH; Gene
Ontology …) pour développer des analyses
statistiques des résultats, accessibles de
façon très conviviale à l’utilisateur.
3. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
GoPubmed
Introduction - 2
Les résultats de recherche sont :
triés selon un vocabulaire contrôlé issu du GO (Gene Ontology)
du MeSH (Medical Subject Headings) et Universal Protein
Resource ( UniProt).
analysés et clustérisés via un système de recherche
complémentaire aux mots clés selon 4 filtres prédéfinis :
What est un regroupement thématique,
When un filtre sur la date,
Who et Where permettent en quelques clics de cerner un auteur.
Le système est potentiellement capable de distinguer les
homonymes et de retracer plusieurs affiliations successives par
analyse sémantique. Cet aspect « Social Network »
potentiellement très intéressant permet de visualiser sous forme
de carte, les réseaux de collaborations d’auteurs.
4. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
En bref …
un "top 20" des auteurs ayant le plus publié sur le
sujet,
un "top 20" des publications classées par pays,
un "top 20" des journaux dans lesquels on trouve le
plus de publications en rapport avec le sujet,
une courbe temporelle vous permettant de visualiser
la progression (ou le recul) du nombre de
publications par an sur ce sujet,
une visualisation sous forme de graphe des réseaux
de collaboration entre auteurs (répondant à la
question "qui publie avec qui ?")".
5. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Les ontologies ?…
L’objectif premier d’une ontologie est de modéliser un ensemble de connaissances
dans un domaine donné (Définition Wikipédia)
C’est un réseau sémantique qui regroupe un ensemble de concepts liés les uns aux
autres par des relations taxonomiques (hiérarchisation des concepts) d'une part, et
sémantiques d’autre part.
Extrait de «Les ontologies en biologie … la fin de Babel ?»
Carl Herrmann – 2009
6. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
GO, MeSH …
Gene Ontology vise à construire une ontologie générique
pour décrire le rôle d’un gène / protéine («gene product»)
Fonction biologique (kinase, protéase, liaison à l’ADN …)
Processus biologique (signalisation, métabolisme)
Localisation cellulaire (noyau, cytoplasme, membrane …)
C’est l’ontologie la plus développée et la plus utilisée (depuis 2000)
MeSH (Medical Subject Headings) est le thesaurus de
Medline : un vocabulaire contrôlé et hiérarchisé qui
permet de décrire précisément le contenu d’un article
L’arborescence hiérarchique conduit de concepts très larges à des notions
très spécifiques. Les descripteurs MeSH sont choisis parmi un ensemble de
synonymes pour décrire un concept de façon univoque.
7. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
La requête de recherche (1)
1ère voie : Recherche directement issue de
Pubmed
(("Allergy and Immunology"[Mesh] OR
"Hypersensitivity"[Mesh] OR "Peanut
Hypersensitivity"[Mesh] OR "Food
Hypersensitivity"[Mesh])) AND ("Arachis
hypogaea"[Mesh] OR "arachis oil
"[Substance Name])
487 réponses dans Pubmed (le 20/11/09)
8. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
(("Allergy and Immunology"[Mesh] OR
"Hypersensitivity"[Mesh] OR "Peanut
Hypersensitivity"[Mesh] OR "Food
Hypersensitivity"[Mesh])) AND ("Arachis
hypogaea"[Mesh] OR "arachis oil "[Substance
Name])
Copier – Coller de la
requête Pubmed dans la
fenêtre de recherche
GoPubmed
9. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
2ème voie : Recherche par saisie directe
Par sujet, auteur, journal … : elle est exécutée (et
peut être saisie) selon la syntaxe de Pubmed
Par exemple :
Si l’on ne précise pas de champ de recherche, le terme saisi
est recherché dans l’ensemble des champs.
Pour rechercher un concept dans les champs Title et/ou
Abstract, utiliser [TIAB],
Pour rechercher un nom d’auteur, utiliser [AU]
Pour rechercher une affiliation (University, Institute, Company,
etc), utiliser [AD].
Pour rechercher un mot-clé, utiliser [MeSH]
La requête de recherche (2)
10. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Résultats
Clusters
selon 4
axes
Résultats : 2887 références
analysées de façon sémantique
Accès direct :
statistiques
générales
11. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Statistiques générales
Top author
Affichage de l’auteur
le plus représenté
dans le lot des 2887
références
Top Author
12. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Focalisation
possible :
Tous les éléments
sont cliquables
Statistiques générales
Statistics (1)
13. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Nombre de publications /
année
Localisation / monde
Statistiques générales
Statistics (2)
14. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Statistics (3) Cartographie : réseaux de
collaboration / auteurs
15. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Affichage des 2887
références résultats
Possibilité
d’affinage
selon 4
axes
différents
Statistiques générales
Documents
16. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
what ?
GoPubMed sélectionne les références
pertinentes pour la requête en cours
Il analyse les résumés des documents
sélectionnés et identifie les concepts
relevant de termes présents dans :
le Gene Ontology
les Medical Subject Headings (MeSH)
le Universal Protein Resource
Ces termes sont ensuite classés et
affichés dans le cluster what.
L’exploration du corpus de résultat est
ainsi facilitée : l’utilisateur peut
focaliser sur un concept en cliquant
sur un terme spécifique, il peut aussi
réduire ou étendre sa recherche
initiale en sélectionnant
/désélectionnant des termes (Top
Terms) ou des catégories
sémantiques (Knowledge Database).
17. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
who ?
Accès à différentes informations (3
onglets) sur chaque auteur identifié :
- en cliquant dans la liste
ou
- en faisant une recherche spécifique
sur un nom.
Le système exécute un algorithme
pour lever les ambiguités
d’homonymie.
19. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
when ?
Filtre sur les dates de
publications
20. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Affichage - Liste des résultats
Affichage plus détaillé (résumé)
Accès au menu export
Accès aux statistiques
(idem lien « statistics »
21. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Affichage - Référence
format réduit / format avec résumé
transfert dans un clipboard
passage en mode « curator »
accès au menu export
22. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
Quelle utilisation ?
Exploration d’un résultat de recherche issu de
Pubmed.
Quel est le bon mot ? : l’exploration facilite
l’identification de termes intéressants
Analyse rapide et conviviale d’un lot de références
Analyse statistique et mise en forme
Recherche de partenaires, de collaborations
Qui publie sur tel concept ?
Quels sont les thèmes de prédilection d’un
laboratoire ? et ses principaux partenaires …
23. INRA form@doc 2009 - D. L'Hostis - Décembre 2009
En savoir plus …
Doms, A.; Schroeder, M., 2005. GoPubMed:
exploring PubMed with the Gene Ontology.
Nucleic Acids Res, 33.