1. SMART CONTENT
SMART CONTENT FACTORY
rendre vos contenus plus intelligents
par les technologies sémantiques
Documation/MIS Master Class – 21/03/2012
2. SMART CONTENT
Smart Content : la vision de Mondeca
• Valoriser toutes les informations et contenus
• Révéler les éléments clefs et de connaissance
• Agréger les contenus et intégrer de l’information complémentaire
• Mettre en réseau les contenus pour offrir richesse et performance
Smart Content Factory
3. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT POUR ENRICHIR LES CONTENUS
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
4. SMART CONTENT
Pourquoi rendre les contenus plus intelligents?
Accroitre la valeur pour les utilisateurs
• Accès plus efficace et personalisé
• Lecture et analyse facilitées
• Decouvert et mash-ups
Smart Content Factory
5. SMART CONTENT
Pourquoi rendre les contenus plus intelligents?
Accroitre les revenus par le trafic et la consommation
• Visibilité
• Nombre de pages vues
• Réutilisation
Smart Content Factory
8. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT POUR ENRICHIR LES CONTENUS
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
9. TROIS ENSEMBLES POUR CONSTITUER LA VALEUR
Ressources et intelligence
Pour comprendre les textes, extraire
l’information pertinente, étendre
l’information et enrichir les contenus
Une chaîne de traitement automatique
La fouille de texte (Text Mining)
Des algorithmes d’extraction et rapprochement
la classification des contenus autour des thèmes
Transformer vers un format RDF ( graphe)
L’exposition de la richesse de vos contenus
Une publication enrichie et automatisée
Qui alimente un portail de consultation
Pour une information maillée, en graphe
Des services de recherche et d’exploration
Ensemble avec les équipes client , les experts Mondeca et les fonds existants
Smart Content Factory
11. DANS L’USINE
Aperçu de Smart Content Factory
Ontologies, référentiels Extraction connaissances et
connaissances, vocabulaires annotation de contenus
rules match
Content delivery
connectors
Smart Content Factory
12. SMARTER CONTENT DELIVERY
Aperçu des solutions
Assistance clients
Digital Asset
Linked Open Data Management
Base de SEO
connaissances
Portail
Sémantique
Smart Content Factory
20. SMART CONTENT FACTORY
Accroitre la productivité
• Automatiser l'annotation, la classification, l'enrichissement,
l'interopérabilité et le contrôle de la qualité
• Mettre en place de workflows collaboratifs
Smart Content Factory
22. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT POUR ENRICHIR LES CONTENUS
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
23. RAISONNEMENT
Intérêt du raisonnement
Pourquoi raisonner ?
• Organiser automatiquement le contenu
• Contrôler la qualité du contenu et en localiser les anomalies
• Enrichir le contenu existant par ajout de nouvelles informations
Bénéfices clients
• Améliorer la qualité et la richesse du contenu
• Réduire les temps et coûts de traitement du contenu
Smart Content Factory
24. RAISONNEMENT
Organiser
Comment ?
Catégorie C =
SI un objet vérifie les critères exprimés dans la condition
ALORS on le range dans la catégorie C
Smart Content Factory
25. RAISONNEMENT : ORGANISER
Cas d’application : Tourisme
SI un hôtel possède au moins 5 étoiles et un Spa
ALORS on le range dans la catégorie «Hôtel de Luxe»
Smart Content Factory
26. RAISONNEMENT
Contrôler
Localiser les manques Localiser les conflits
Comment ?
Règle d’obligation : localiser les manques
SI la condition est trouvée ALORS la partie obligation doit l’être aussi.
Règle d’interdiction : localiser les conflits
SI la condition est trouvée ALORS la partie interdiction ne doit pas l’être.
Smart Content Factory
27. RAISONNEMENT : CONTRÔLER
Cas d’application : Gestion terminologique
- racine = true
Règle d’obligation : Règle d’interdiction :
SI un terme n’a pas d’hyperonyme SI deux termes sont liés par synonymie
ALORS il doit avoir racine=vraie ALORS pas de lien d’hyperonymie
28. RAISONNEMENT
Enrichir
Compléter les manques Etablir des corrélations Enrichir les objets
Comment ?
Règle d’inférence =
SI la condition est trouvée
ALORS on ajoute les informations de la conclusion
Smart Content Factory
29. RAISONNEMENT : ENRICHIR
Cas d’application : Réglementation
SI un bateau est de type « navire à passagers »
et taille > 20m
et date de construction D > au 24/01/12
ALORS le chapitre S41 de la réglementation maritime s’applique à partir de D
Smart Content Factory
30. RAISONNEMENT
Aspects techniques
Les outils en raisonnement
• Editeur de règles
• Moteur de raisonnement
Simplicité et flexibilité
• Utilisable par des non-informaticiens
• Règles indépendantes des données
• Spécialement adapté pour la publication
Fonctionnalités avancées
• Héritage dans la hiérarchie des règles
• Détection de cycles dans l’exécution des règles
• Subsomption de règles
• Gestion de la temporalité
31. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
32. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Situation actuelle
• Temporalité : impliquée dans tous les domaines
• Un axe fondamental pour la recherche d’information
• Pourtant seulement 1,5% des requêtes soumises aux moteurs de
recherche
33. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Situation actuelle
• Sémantique non prise en
compte (mots-clés)
• Raisonnement : faire le lien
entre 1510 et début du XVIe
siècle
• Text-mining : Pas
uniquement métadonnées
autour du document, mais
informations à l’intérieur d’un
document
34. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Objectifs
1. Acquisition de connaissances temporelles
complexes
35. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Objectifs
2. Recherche d’informations temporelles
36. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Objectifs
3. Visualisation d’informations temporelles
37. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Cas d’application
• Tourisme & loisirs : le traitement des dates et horaires
d’ouverture (enrichissement d’une base de connaissances)
38. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
ACQUISITION D’INFORMATIONS
TEMPORELLES
39. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Cas d’application
• Veille informationnelle : fouille d’archives, fouille de
documents, fouille de données
40. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
RECHERCHE D’INFORMATIONS
TEMPORELLES
41. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
RECHERCHE D’INFORMATIONS
TEMPORELLES
42. EXPLOITER AU MIEUX LES INFORMATIONS TEMPORELLES
Solutions
• Traitement automatique des langues pour l’annotation (ingénierie
des langues)
• Raisonnement temporel (ingénierie des connaissances)
• Indexation sémantique (recherche d’information)
Prix de la meilleure application au DeRiVE 2011 Data Challenge
43. PLAN
1. SMART CONTENT
2. SMART CONTENT FACTORY
3. RAISONNEMENT POUR ENRICHIR LES CONTENUS
4. EXPLOITER AU MIEUX LES INFORMATIONS
TEMPORELLES
5. GESTION D'ACTIFS MULTIMÉDIAS
6. QUESTIONS / RÉPONSES
44. Customers
>800 Clients autour du monde
>100 chaines à l’antenne
Présent dans plus de 30 pays
TV & networks, Centres de diffusion, Post-Production, Universités,
Indépendants…
47. SPARK IGNITION
Les besoins
Pérennisation des archives?
Mise à disposition des médias
Valorisation d’un patrimoine
Augmentation de la productivité
Impossibilité de se passer
d’automatisation
Un trop grand volume
d’information à traiter
Un besoin de consolider les
informations et les médias.
48. Pérennisation des archives?
• Les médias sont sur des supports dont les
équipements sont en fin de vie.
• Les supports se dégradent
• Une copie unique ne suffit pas (Assurance,
Désastre physique)
49. Mise à disposition des médias
• Sur cassette
• En fichier
• Vers un NLE
• Dans un format spécifique
• Extrait d’un média plus long
• De façon sécurisée
• En fonction du client
• Dans l’avenir
50. Valorisation d’un patrimoine
• Sortir les médias des armoires
• Les indexer pour les retrouver
• Mettre à jour automatiquement les données
éditoriales en fonction de la Géo Politique /
Langues
• Ouvrir un fond documentaire ou le lier à d’autres
• Echanger les données
• Amortir les investissements
51. Augmentation de la productivité
• Automatiser les taches répétitives
• Indexer automatiquement
• Intégrer les ERP et les CRM
• Limiter les surfaces de Stockage et les
déplacements
52. Impossibilité de se passer
d’automatisation
• Accès 24/24 7/7
• Réseaux complexes
• Stockages hétérogènes
• Contrôle qualité automatisé
• Opérations complexes de transcodage
• De Livraison
• De restauration
53. Un trop grand volume d’information à
traiter
• Les méthodes de classement et de rangement
sont obsolète
• Les supports dont multiples pour une même
instance dans plusieurs localisations
• Les stockages évoluent en fonction des besoins
• Des relations existent entre les médias
54. Un besoin de consolider les
informations et les médias
• Synchronisation avec des bases tierces
• Evolution de la qualification du média au fil du
temps
• Utilisation / Mise à jour des métas données
intrinsèque du média.
55. Points Clés de SPARK IGNITION
• Base de données plurimédias
• Moteur de Workflow
• Gestion multi-formats et multi localisations
• Indexation et recherches avancées
• Archivage
• Open Exchange
• Unicode
• Multi channels play-Out Operations