Ce projet consiste à réaliser une plate-forme technologique communautaire permettant la valorisation et l’exploitation d’un fonds documentaire construit autour d’un domaine d’expertise. Dans le cadre du projet Naturopédia, le corpus valorisé est dédié à la naturopathie et à l’agro-écologie. Il est composé d’une cinquantaine d’ouvrages soit théoriques soit techniques, ainsi que d’une large documentation annexe. L’objectif de ce projet est de s’appuyer sur ce corpus d’une richesse rare, pour fédérer une communauté de pratique aujourd’hui mal outillée, de favoriser la diffusion de ce savoir et le partage d’expérience entre les acteurs du domaine, professionnels ou amateurs. L’objectif des équipes rassemblées dans le projet Naturopedia est de mettre à disposition des pouvoirs publics, des multiples ONG du secteur, des entreprises de l’Economie Sociale et Solidaire, des technologies de diffusion innovantes, de nouveaux services de collecte et propagation de la connaissance, leur permettant d’amplifier leurs actions et d’œuvrer pour le bien public.
L’originalité de ce projet réside dans l’intégration de différentes approches, théoriques et techniques, issues de l’ingénierie documentaire (séparation fond-forme, publication multi-supports,...) et de l’ingénierie des connaissances (annotation sémantique des contenus par ontologie de domaine) pour la création d’une chaîne éditoriale hybride et innovante. Pour cela, Mnémotix, en partenariat avec Kelis, la société en charge du développement de la chaine éditoriale libre SCENARI, prendra à sa charge le processus d’annotation semi-automatique du corpus Naturopédia, ainsi que l’exploitation de ces annotations dans le processus de génération multi-supports SCENARI.
La souplesse des modèles documentaires conçus pour le projet, la granularité de la structuration des contenus ainsi que la pertinence des annotations sémantiques devront permettre à terme de publier à la volée des compilations de type “livre de recettes” destinés soit aux professionnels du domaine soit au grand public, sous la forme de modules pédagogiques compatibles SCORM, d’ebooks ou d’applications mobiles.
Dans le cadre de notre intervention, nous présenterons tout d’abord l’architecture globale du projet, telle qu’elle a été conçue. Nous détaillerons ensuite la phase de sémantisation et de transformation du corpus documentaire. Nous aborderons également les verrous technologiques que nous avons identifiés ainsi que les stratégies envisagées pour les lever, notamment dans l’intégration des technologies Mnémotix au sein de l'environnement d'édition open-source SCENARI. Enfin, nous parlerons des contraintes liées aux formats d’export : applications mobiles, livres électroniques ou bien formations en ligne et leur intégration avec la plate-forme collaborative destinée à fédérer les communautés Naturopathie
3. Mnémotix en bref...
Société coopérative créée en janvier 2013
⚈ Spin-off de l’équipe Wimmics (INRIA Sophia)
⚈ “Startup INRIA”, JEI, agrément CIR/CII
⚈ Spécialisée en
▸ Ingénierie des connaissances
▸ Ingénierie documentaire
▸ Analyse des réseaux sociaux
4. Un projet fondateur
Projet ANR ISICIL (2009-2012)
Web sémantique et réseaux sociaux pour la veille en entreprise
⚈ Piloté par INRIA (Fabien GANDON)
⚈ Partenaires scientifiques : CNRS, Telecom ParisTech, UTT
⚈ Partenaires industriels : Orange, ADEME
⚈ Accueil enthousiaste des industriels
5. Rencontre du 3e Type
Rencontre avec l’Université de l'avenir (UA)
⚈ Réseau de chercheurs, d’industriels et de citoyens
⚈ Développement durable et solidaire de l’Homme
et de la Société
Besoins
⚈ Animation du réseau, partage d’information
⚈ Ingénierie documentaire
▸ Projet de Bibliothèque de l’écologie
▸ Fonds documentaire important
6. Projet UA1 : Valorisation du fonds “J-C Rodet”
Jean-Claude Rodet (http://fr.wikipedia.org/wiki/Jean-Claude_Rodet)
⚈ Médecin, auteur franco-canadien, membre de l’UA
⚈ Pionnier de l’agriculture biodynamique
⚈ Spécialiste du soin par l’alimentation (nutrithérapie/naturopathie)
⚈ Auteur d’un grand nombre d’ouvrages scientifiques ou de vulgarisation
Objectifs
➲ Numériser son oeuvre et l’ouvrir à la communauté naturo/agro-éco.
➲ Proposer du service pour les professionnels (formations/contenu spécialisé)
7. Roadmap
Projet sur 2 ans
⚈ 2015 : Traitement documentaire
▸ Ré-éditorialisation
▸ Sémantisation (Thésaurus SKOS & Annotation)
⚈ 2016 : Plate-forme communautaire
▸ Publication open-data
▸ Publication multi-supports (Ebooks, SCORM, Web & Mobile)
▸ Workflow de type “wiki”
9. Chaîne éditoriale libre SCENARI
Spécificités
⚈ WYSIWYM (What You See Is What You Mean)
⚈ Model Driven
⚈ Production d’un “source code” documentaire
⚈ Édition collaborative
⚈ Système de générateurs très souple
⚈ Publication multi-supports
Contrainte
Nécessite un modèle documentaire complet et souple en amont
10. Technologies Mnémotix
Spécificités
⚈ Technologies issues du Web Sémantique
⚈ Approche centrée “domaine”
⚈ Exploite la relation homme-document
⚈ Vecteur d’intelligence collective pour les communautés d’intérêt
⚈ Monitoring de l’activité communautaire
⚈ Linked Open Data
Contrainte
Nécessite un thésaurus assez complet en amont
11. Documents Modèle formel Contenus structurés Publications
Étape 1 : Ré-éditorialisation
Le contenu est décomposé en
grains d’information typés selon
un modèle documentaire formel
fourni en amont.
Process SCENARI classique
Étape 2 : Structuration
Les grains de contenu sont
sélectionnés et structurés en
fonction des besoins de
publication.
Étape 3 : Publication multi-support
Un système de générateurs paramétrable et
extensible permet de construire différents types de
publications à partir d’un même contenu source.
12. Documents Modèle formel Contenus structurés Publications
Process
Naturopédia
Triple Store
Thesaurus SKOS
RDF
Étape 1.b : Annotation sémantique
Les contenus sont annotés avec un
thésaurus du domaine (Naturo /
Agro-éco.) Étape 3.b : Composition par
requétage sémantique
Les contenus sélectionnés
pour la génération sont
récupérés par une requête
SPARQL.
Étape 4 : Publication Open-
Data
Étape 2.b : Stockage
Les triplets générés par l’
annotation sémantique sont
stockés dans un triple
store.
13. www.mnemotix.com
318, avenue de la Carraire 06210 MANDELIEU
contact@mnemotix.com
Merci de votre
attention.
nicolas.delaforge@mnemotix.com
@mnemotix