Operation Libre Brocas: Guide d'ouverture d'une commune
Datapublica annuaire de données et sujets de recherche
1. Annuaire de données
François Bancilhon
francois.bancilhon@data-publica.com
www.data-publica.com
twitter.com/fbancilhon
Nantes, 22 avril 2011
2. Plan
● Data Publica
● Annuaire de données (manuel)
● Cartographie des données publiques françaises
● Annuaire bis (automatisé)
● Sujets de recherche
3. Data Publica « Elevator Pitch »
● Développer la connaissance la plus complète et la
plus fine des données électroniques françaises (base
de connaissance et technologie)
● Monétiser cette connaissance par
– l'opération du « magasin de données » de
référence des données françaises
– la production de jeux de données uniques
(« killer data sets ») vendus dans le magasin et
en direct aux acteurs du marché
4. Data Publica Data Store
Editeurs de
Organismes
Data Publica Données
Publics
Privés
Fournisseurs de données
data-publica.com
Acquéreurs de données
Grands-comptes, Grand public,
Organismes publics Journalistes
PME, TPE Chercheurs
5. Data Publica : annuaire
● Jeux de données publics (ensemble de fichiers
formant un tout cohérent)
● Méta données (date, auteur, mots clés, catégories,
structure, description, etc.)
● Éditeur (organisme public publiant le jeu de
données)
● Moteur de recherche
● Dans les jeux de données et les éditeurs
● Dans les méta données ou le contenu des données
8. Data Publica : annuaire
● Lancé en septembre 2010
● Avril 2011
● 175 éditeurs
● 1 950 jeux de données
● 4750 fichiers
● Troisième annuaire national de données
publiques au monde (après data.gov et
data.gov.uk)
19. Nos sujets de recherche
● Crawl du Web de données (PPGP)
● Crawl du Web public (Régional, Etat, Européen)
● Filtrage et extraction des données
● Normalisation des données (Excel à BD SQL)
● Spatial et Temporel
● Temporel : intervalles ou instants
● Spatial : zone ou points
● Reconnaissance et alignement
20. Nos sujets de recherche
● Alignement généralisé
● Mise à jour automatique
● Raffinage de données
● Visualisation
● ODATA (standard d'interrogation)
● DSPL (représentation)
● Web Sémantique, Linked Data, RDF
21. Nos partenariats de recherche
● INRIA Leo (Ioana Manolescu)
● INRIA Zenith (Patrick Valduriez)
● AVIZ (Jean-Daniel Fekete)
● Internet Memory Research (Julien Masanès)