Projet Open Source Ecology - Transitions² / "Agenda pour le Futur" - Open Con...
Groupe de travail "Normalisation des catalogues des jeux de données" - Open Data France - par Jean-Philippe Clément
1.
2. PRESENTATION DU COLLECTIF OPEN DATA
FRANCE Normalisation catalogue des jeux de données
Jean-Philippe CLEMENT
Chargé de mission TICC / Innovation Ville de Paris
Coordonnateur du projet Open Data Paris
@AgentNum
3. DEFINITION OBJECTIFS ENJEUX DU
CHANTIER
Normaliser pour partager et mutualiser
Définition : Un catalogue des jeux données est un jeu de données recensant
tous les jeux de données publiés par un projet. Il permet un repérage plus rapide et
« automatisable » des jeux de données.
Objectifs : Normaliser le catalogue des jeux de données d’un projet Open Data
Enjeux : Si chacun des projets Open Data utilise le même formalisme pour créer
leur catalogue, il sera possible de créer un méta-catalogue à l’échelle de tous les
projets Open Data. Cela permettra :
- de faciliter l’identification des jeux intéressants pour les réutilisateurs
- de faciliter le repérage des jeux de données identiques ou proches dans chacun des projets
pour créer des réutilisations utilisables avec plusieurs jeux de données d’origine différente
- de repérer au sein des projets Open Data les jeux de données qui mériteraient également
d’être normalisés pour faciliter leur agrégation
PRESENTATION DU COLLECTIF OPEN DATA FRANCE Normalisation catalogue des jeux de données
Jean-Philippe CLEMENT Ville de Paris @AgentNum
4. ACTIONS REALISEES
Mise en commun et objectif sémantique
Fusion des catalogues existants :
Paris, le CG33 et Montpellier ont mis en commun leurs 3 différents catalogue de jeux
de données pour en réaliser une synthèse. (participation de Nantes Métropole).
Sur la route du sémantique :
La normalisation du catalogue doit s’appuyer sur des référentiels existants.
A ce titre la norme DCAT fournit une nomenclature de champs utiles pour qualifier
un catalogue. DCAT est également une norme sémantique qui permet de
positionner le catalogue sur cette voie sans que cela ne soit une obligation stricte.
PRESENTATION DU COLLECTIF OPEN DATA FRANCE Normalisation catalogue des jeux de données
Jean-Philippe CLEMENT Ville de Paris @AgentNum
5. PRESENTATION DU COLLECTIF OPEN DATA FRANCE Normalisation catalogue des jeux de données
Jean-Philippe CLEMENT Ville de Paris @AgentNum
6. PROCHAINES ETAPES MISE EN OEUVRE
Votre participation
Appel à commentaires en cours :
Ce résultat est ouvert à commentaires sur le site http://OpenDataFrance.net
Mise en œuvre progressive du nouveau catalogue :
- Un identifiant unique par jeu de données : SIRET_Prod_service_ID
- Inscrire tous les champs même vide dans son catalogue
- Possibilité d’une phase 1 avec une version tabulaire du catalogue qui ne prend pas
en compte la partie « Ressource » (même si les champs existent et sont vides)
- Possibilité dans une phase 2 de générer en plus de la version tabulaire, une
version xml (plus sémantique) qui prend en compte plusieurs ressources (formats de
fichier du jeu de données)
PRESENTATION DU COLLECTIF OPEN DATA FRANCE Normalisation catalogue des jeux de données
Jean-Philippe CLEMENT Ville de Paris @AgentNum