2. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Les Partenaires
● INRA
● Clermont-Ferrand
– Unité Génétique, Diversité et Ecophysiologie des Céréales
(GDEC) [Coordinateur]
● MIG (!)
● ARVALIS - Institut du végétal
● UFS (Union Française des Semenciers)
3. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
L'objectif
● Le partage de connaissances entre partenaires en
forme d'une...
Base de Connaissances
● Base de données extraite de la bibliographie
● Vérifiée, testée par les experts & des expériences (ex .
phénotypage)
● Mise à jour en continu
4. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
L'organisation
● En trois années
● Création de la base
● Validation
● ...
● MIG est impliqué surtout dans la phase 1 – création
de la base
5. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Nos propres objectifs
● Moteur de recherche (AlvisIR)
● Aide à la recherche manuelle par les partenaires
● Permet le retour par les partenaires
● Ontologie
● Gène
● Marqueur
● Variété
● Caractère (phénotype)
6. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Notre Partie
* l'étoile indique 'In progress/Coming'
● Extraction des articles à partir du web
– Trouver
– Récupérer
– Transformer en texte
● TAL des articles
– Définir les bons outils (lexiques, termes etc)
● Aide par des Experts
● Transformer l'information en Ontologie
● Créer une Base de Données
7. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Extraction d'Information à partir du Web [1]
● Collection: recherche par mots-clés ou par
« Related/Citing » - offline , batch
● Web of Science – Thomson Reuters
● Web service pour les détails bibliographiques
– Pas de liens vers les éditeurs/article
– Identifient unique Thomson/Reuters
● « Article Match Retrieval » Service (xml toujours)
– DOI/PupMed ID/etc
– Liens vers la page normale de WoS
8. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Extraction d'Information à partir du Web [2]
● Récupérer le lien vers l'éditeur
● DOI : dx.doi.org
● PMID : google-scholar *
● UT : WoS (à voir) *
● Récupérer le pdf / html chez l'éditeur
● Transformer en texte *
● PDF
– Acrobat / Pdftotext
– Abbyy
● HTML ***
9. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Traitement du texte
● Utilisation d' AlvisNLP
● Les bons lexiques
● Utilisation des ressources disponibles : *
– Données BIO: GrainGenes, MASWheat, SwissProt,...
– Données Agro : GG,MASWheat, listes Arvalis, commerciales...
● Validation par les experts nécessaire *
– mais pas donnée.... surtout pour les données type 'langue
naturelle' + agronomiques
10. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Moteur de Recherche [1]
● Utilisation d' AlvisIR
● Recherches par mots-clés, catégories, … - online*
● Résultats avec « valeur ajoutée »
● Snippets, étiquettés et coloriés
● Lien vers la source
● Structures et statistiques extraites
● Question des privilèges des utilisateurs (partenaires) *
11. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Moteur de Recherche [2]
● Adaptation d'AlvisIR *
● Info biliographique
● Structures/champs pertinents
● Autres idées bienvenues
● Retour par les utilisateurs *
● Validation/ évaluation des résultats par les utilisateurs
– Utilisation de cette information (?)
12. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Ontologie
● La même nécessité des lexiques et validation
● PLUS :
● Relations entre les termes à
– Définir à la main *
– Donner par les experts *
– Apprendre *
– Valider par les experts *
● Interface appropriée
13. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Base de Données
● A voir … ****
● Questions de caractère
– Informatique
– Administratif
– Pratique
– De stratégies / préférences des partenaires
14. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Prochaines Étapes
● L'utilisation et verification de la base de
connaissance par les partenaires
15. Dialekti Valsamou ~ 17 Février 2011
Réunion Équipe Bibliome
Merci de votre patience !
D'autres questions ?