SlideShare uma empresa Scribd logo
1 de 116
Baixar para ler offline
Romain Lacombe        Ecole des Ponts ParisTech
Pierre-Henri Bertin
  François Vauglin     Rapport remis le 13 juillet 2011 au Ministre de l’Industrie,
  Alice Vieillefosse   de l’Énergie et de l’Économie numérique




          Pour  une  politique  
          ambitieuse  des
          données  publiques

          Juillet      Les données publiques
           2011        au service de l’innovation
                       et de la transparence
École des Ponts ParisTech. 2011. Pour une politique ambitieuse des données
publiques : Les données publiques au service de l’innovation et de la transparence.
Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie,
de l’Energie et de l’Economie numérique le 13 juillet 2011.
!
                                 !
                                 !
                                 !
                     "#$%&!'&(!)$*+(!),-.(/&#0!
                                 !
         1,22$-+!3!%,!45%56,+.$*!,78!9(,6&(!'&!%:;*+&-*&+!!
                  ',*(!%&!#,'-&!'7!2$-+,.%!)-$8.<,!=$>.%&!!
              '&!(&-?.#&(!,78!#.+$@&*(!(7-!+&-<.*,78!<$>.%&(!
                                 !
          1&<.(!,7!=.*.(+-&!'&!%:;*'7(+-.&A!'&!%:"*&-6.&!!
                 &+!'&!%:"#$*$<.&!*7<5-.B7&!!
                        %&!CD!E7.%%&+!FGCC!

                                     !

                     !
    )$7-!7*&!2$%.+.B7&!,<>.+.&7(&!'&(!
           '$**5&(!27>%.B7&(!
                                     !
         "#$!%&''(#$!)*+,-.*#$!/*!$#01-2#!
        %#!,3-''&1/4-&'!#4!%#!,/!40/'$)/0#'2#!
                                         !
                                     !
                                         !
                                         !
                                         !
                                         !
                                         !
!
!
!
!
!
!
                              H7.%%&+!FGCC!
École des Ponts ParisTech. 2011. Pour une politique ambitieuse des données
publiques : Les données publiques au service de l’innovation et de la transparence.
Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie,
de l’Energie et de l’Economie numérique le 13 juillet 2011.

                Vous pouvez contacter les auteurs de ce rapport sur
                        http://rapport-opendata-2011.fr
5!)0&)&$!%#!2#!0/))&04!


    L’ouverture et la réutilisation des données            Deux personnalités académiques expertes
publiques sont des enjeux majeurs de l’action           de l’économie numérique et de ses nouveaux
publique à l’ère numérique. À la croisée des            modes de gouvernance, MM. Pierre-Jean
usages innovants d’Internet et des modes de             Benghozi et Laurent Gille, ont accepté
gouvernance collaborative les plus récents, ils         d’encadrer le travail de ce groupe.
ouvrent le champ à des domaines nouveaux de
                                                            M. Benghozi est Directeur de recherche
l’action de l’État.
                                                        CNRS, Directeur du Pôle de Recherche en
    Ce rapport présente une étude sur la                Économie et Gestion et professeur d’économie
réutilisation des données publiques, menée              à l’École Polytechnique (titulaire de la Chaire
pour la Délégation aux usages de l’Internet du          Orange Innovation et Régulation des Services
Ministère de l’Enseignement supérieur et de la          Numériques), et responsable du pôle
Recherche dans le cadre du Master d’Action              Innovation du Master Innovation et Régulation
Publique de l’École des Ponts ParisTech.                de l’Économie Numérique de Télécom
                                                        ParisTech. M. Laurent Gille, enseignant-
    Il met en perspective la problématique et
                                                        chercheur au Département de Sciences
les enjeux de l’Open Data, propose un état des
                                                        économiques et sociales de Télécom
lieux de la réutilisation des données publiques
                                                        ParisTech, est responsable du parcours
en France, et dessine trois scénarios prospectifs
                                                        Industries de Réseaux du Master Innovation et
pour l’évolution future de ce mouvement. Elle
                                                        Régulation de l’Économie Numérique.
présente seize propositions pour une politique
nationale ambitieuse d’ouverture et de                     Les conclusions de l’étude ont été rédigées
réutilisation des données publiques.                    de novembre à janvier 2011, et présentées au
                                                        public le 20 janvier 2011 au Ministère de la
    Quatre élèves de l’École des Ponts
                                                        Recherche et de l’Enseignement supérieur.
ParisTech, Pierre-Henri Bertin, Romain
Lacombe, François Vauglin et Alice                          Ce rapport a été finalisé par Romain
Vieillefosse ont mené cette analyse de                  Lacombe entre mars et début mai 2011. Il ne
septembre 2010 à janvier 2011, en rencontrant           fait qu’évoquer les développements les plus
les acteurs clés de la réutilisation des données        récents, et présente une synthèse des
publiques, en prenant part à des colloques              évolutions qui ont eu lieu au printemps 2011
internationaux, et en s’appuyant sur la                 en France, notamment au niveau national.
bibliographie existante.


Les recommandations et propositions exprimées ne reflètent que les conclusions de l’analyse menée
par les membres du groupe d’étude, et n’engagent en aucune manière leurs institutions, employeurs ou
corps respectifs. Toutes les erreurs ou omissions qui subsisteraient dans ce document ne sont le fait que
de ses auteurs.




                                                                                                            1
6#7#02-#7#'4$!


    Nous tenons, très modestement, à                chercheur en sciences économiques et sociales
témoigner toute notre gratitude envers              à Télécom ParisTech. Leurs conseils pertinents
Monsieur le Ministre de l’Industrie, de             et le temps qu’ils nous ont consacré, tout au
l’Energie et de l’Economie numérique, pour          long de notre étude, nous ont été très précieux.
avoir bien voulu nous faire l’honneur de
                                                        Nous souhaitons également remercier
recevoir ce rapport sur l’ouverture et la
                                                    l’équipe du Mastère d’Action Publique de
réutilisation des données publiques, ainsi qu’à
                                                    l’École des Ponts ParisTech pour l’opportunité
remercier Séverin Naudet, Directeur de la
                                                    qu’elle nous a accordée : le directeur
mission Etalab auprès du Premier ministre,
                                                    Dominique Schwartz, le directeur adjoint
pour avoir accepté d’en présenter la synthèse,
                                                    Vincent Spenlehauer et la secrétaire Sylvie
le 13 juillet 2011, à l’occasion du lancement du
                                                    Berte.
concours européen « Open Data Proxima
Mobile ».                                               Nos remerciements s’adressent enfin à
                                                    l’ensemble des interlocuteurs qui nous ont
    Nous remercions M. Bernard Benhamou,
                                                    reçus ou nous ont fait part de leurs réflexions
Délégué aux Usages de l’Internet, pour sa
                                                    sur le sujet des données publiques, ainsi qu’à
disponibilité, la confiance qu’il nous a
                                                    toutes celles qui ont répondu à nos nombreuses
témoignée, et ses conseils avisés et constructifs
                                                    questions.
lors de la rédaction de ce rapport. Nous tenons
aussi à remercier pour leur aide l’ensemble des         Merci de nous avoir donné la chance de
équipes de la Délégation.                           contribuer, modestement, à la réflexion sur un
                                                    sujet fondamental pour le futur de l’économie
   Nous remercions également M. Pierre-Jean
                                                    numérique et l’avenir de notre démocratie.
Benghozi, Directeur de recherche au CNRS et
professeur     d’économie       à      l’École
Polytechnique, et M. Laurent Gille, enseignant




                                                                                                       3
6($*7(!!
Les évolutions technologiques récentes ont placé le sujet de la réutilisation des données au cœur de
l’action publique. L’administration collecte et produit un champ très vaste de données, depuis les
budgets des institutions publiques jusqu’aux mesures de la qualité de l’air que nous respirons, en
passant par des statistiques précises sur notre économie, notre société et nos territoires. Ouvrir l’accès
le plus large aux informations publiques, c’est tout d’abord améliorer la transparence de l’État et de ses
institutions, éclairer le débat démocratique, et rapprocher la puissance publique des citoyens. Favoriser
l’ouverture et la réutilisation de ces données (« l’Open Data »), c’est permettre à la communauté des
développeurs et des entrepreneurs d’inventer de nouveaux usages et de nouvelles applications utiles
aux citoyens. C’est donc encourager l’innovation, donner naissance à la société de l’information, et
contribuer au développement des secteurs stratégiques d’avenir pour notre pays, de l’économie
numérique au développement durable. L’État doit s’approprier pleinement cette opportunité majeure. Il
lui faut prendre le virage de cette nouvelle dimension des politiques publiques, pour la mettre au
service de l’ensemble des acteurs du pays.
Mots-clés : Open Data, données publiques, information publique, accès aux documents administratifs, politique publique,
gouvernance ouverte, transparence, démocratie, politique industrielle, politique des technologies, innovation, recherche,
entreprenariat, compétitivité, croissance, emploi, économie numérique, Web sémantique, Internet.



8+$40/24!
Recent evolutions of technology have placed public data at the central focus of public policy.
Government collects and produces a vast array of data, from the budgets of our institutions to the
quality of the air we breathe, through precise statistics on our economy, our society or our territories.
Opening public sector information means improving the transparency of our Government and its
institutions, enlightening the democratic debate, and strengthening the bond between the nation and its
representatives. Encouraging reuse of this data (« Open Data ») allows the community of Web
developers and Internet entrepreneurs to invent new, useful applications for citizens. It is an important
public policy lever in favour of innovation, which can ignite the information society and contribute to
the development of strategic sectors of the economy, from sustainable development to the growth of the
digital economy. Government must fully embrace this major opportunity and this new dimension of
public policy, and put its power to work at the service of the nation’s every constituent.
Keywords : Open Data, public data, public sector information, freedom of information, public policy, Open Government,
transparency, democracy, industrial policy, technology policy, innovation, R&D, entrepreneurship, competitiveness, growth, jobs
creation, digital economy, semantic Web, Internet.




                                                                                                                                  5
15(7<5!,*,%@+.B7&!


   Les évolutions technologiques récentes ont           Une évolution du cadre législatif :
placé le sujet de la réutilisation des données au   l’Union Européenne a adopté deux directives
cœur de l’action publique.                          en la matière, la directive « Informations du
                                                    secteur public » (PSI) en 2003 et la directive
    L’administration collecte et produit un
                                                    INSPIRE en 2008. Une consultation publique
champ très vaste de données, depuis les
                                                    récente sur la directive PSI a notamment porté
budgets des institutions publiques jusqu’aux
                                                    sur l’opportunité de réviser son champ
mesures de la qualité de l’air que nous
                                                    d'application, les redevances et licences
respirons, en passant par des statistiques
                                                    relatives aux données, ainsi que les formats
précises sur notre économie, notre société et
                                                    électroniques utilisés.
nos territoires.
                                                        L’émergence de la notion politique de
    Ouvrir l’accès le plus large aux
                                                    « Gouvernement Ouvert » : les politiques de
informations publiques, c’est tout d’abord
                                                    diffusion des données publiques ont fortement
améliorer la transparence de l’État et de ses
                                                    évolué dans les pays anglo-saxons du fait de
institutions, éclairer le débat démocratique, et
                                                    l’émergence de la notion d’Open Government,
rapprocher la puissance publique des citoyens.
                                                    thème de campagne du Président Barack
    Favoriser l’ouverture et la réutilisation de    Obama. Les États-Unis et la Grande Bretagne
ces données (« l’Open Data »), c’est permettre      ont créé des portails de données publiques
à la communauté des développeurs et des             réutilisables, data.gov et data.gov.uk. En
entrepreneurs d’inventer de nouveaux usages.        France, la mission Etalab vient d’être créée,
C’est donc encourager l’innovation, et              sous l’autorité du Premier ministre François
contribuer au développement des secteurs            Fillon, pour coordonner les administrations en
stratégiques    d’avenir,     de    l’économie      matière de données publiques et mettre en
numérique au développement durable.                 place la future plateforme data.gouv.fr.
    L’État doit s’approprier pleinement cette           Des initiatives citoyennes en faveur de
opportunité majeure. Il lui faut prendre le         l’Open Data : une série d’initiatives récentes,
virage de cette nouvelle dimension des              issues de la société civile et des communautés
politiques publiques, pour la mettre au service     de développeurs, s’efforcent de promouvoir les
de l’ensemble des acteurs du pays.                  concepts de l’Open Data, avec le soutien
                                                    d’associations et de fondations comme la
9'#!)0&+,(7/4-.*#!/*!20&-$#7#'4!%#$!                Sunlight Foundation aux États Unis, l’Open
(1&,*4-&'$!4#2:'&,&;-.*#$<!)&,-4-.*#$!#4!           Knowledge Foundation (OKFN) en Grande
(2&'&7-.*#$!0(2#'4#$=!                              Bretagne, et la FING, LiberTIC et Regards
    L’ouverture et la réutilisation des données     Citoyens en France.
publiques constituent désormais une attente             La double rupture du Web 2.0 et des
évidente de la société civile. Cette                technologies mobiles : les innovations de
problématique a émergé récemment au                 service rendues possibles par les technologies
croisement de plusieurs évolutions profondes.       2.0 (interfaces dynamiques, cartographie en
    Une prise de conscience de la valeur            ligne, ouverture des API) ont amené à la
économique de la réutilisation des données :        généralisation du remix et du phénomène des
chaque année dans l'Union Européenne, la            mashups de données. La nouvelle génération
réutilisation de données issues du secteur          d’applications géolocalisées sur smartphones
public générerait un chiffre d'affaires de plus     repose pour une part importante sur des
de 27 milliards d'euros. Pour Neelie Kroes,         données      géographiques.    Ces     ruptures
vice-présidente de la Commission européenne         technologiques ont révélé le besoin croissant
chargée de la stratégie numérique, « une            de pouvoir réutiliser des données publiques.
grande partie de ces informations, en Europe,           Toutes ces évolutions récentes confèrent
sont sous-exploitées. Nous devons examiner          une actualité nouvelle à la problématique de la
l'opportunité de modifier les règles de l'Union     réutilisation des données publiques.
en matière de réutilisation, pour libérer
pleinement leur potentiel économique ».


                                                                                                      7
9'#!&))&04*'-4(!7/>#*0#!)&*0!,3?4/4!#4!            9'#!7-$#!#'!@*10#!2&7),#A#!.*-!)&*00/-4!B40#!
    ,3/%7-'-$40/4-&'!                                  $-7),-C-(#!
       L’ouverture des données publiques permet            Le cadre juridique est établi pour la
    à des entrepreneurs, des chercheurs, des           majorité des données publiques, mais les types
    développeurs d’accéder aux données collectées      de licences et de contrats se multiplient. Le
    dans le cadre du fonctionnement des                statut des données issues d’organismes
    administrations.                                   parapublics reste à préciser. L’interopérabilité
                                                       technique et juridique est cruciale : il convient
       En les réutilisant, ils inventent de nouveaux
                                                       de clarifier les formats et les licences
    usages et peuvent créer de nouvelles
                                                       acceptables dans une optique d’encouragement
    applications utiles aux citoyens. Cette
                                                       à l’ouverture et à la réutilisation.
    coproduction de services au public peut
    constituer la base d’une nouvelle relation             La gratuité pour la réutilisation des
    numérique de l’administration à l’usager, et       données à titre commercial favorise
    d’un fonctionnement plus efficace de la            l’innovation et les nouveaux usages. Nous
    puissance publique.                                préconisons donc de la généraliser le plus
                                                       possible, et d’éviter à tout prix la
        L’ouverture des données publiques est de
                                                       multiplication et le maintien de redevances
    plus un outil puissant d’amélioration de la
                                                       excessives, qui pourrait conduire à des
    transparence de l’État. En donnant à tous les
                                                       incohérences et freiner la réutilisation.
    citoyens qui le souhaitent accès aux détails du
    fonctionnement des institutions publiques,
                                                       D#$!0-$.*#$!$*07&'4/+,#$!
    cette ouverture nourrit et éclaire le débat
    démocratique. Elle peut contribuer à fonder les        Esquissées dans la loi 1978 sur l’accès aux
    choix politiques sur des analyses éclairées et     documents administratifs, consacrées par deux
    ancrées dans le réel.                              directives européennes, l’ouverture et la
                                                       réutilisation des données publiques s’inscrivent
        Enfin, un accès plus large aux données         dans une évolution durable de nos sociétés.
    publiques peut contribuer à renforcer la
    confiance des consommateurs, et donc la                Elles induisent une transformation de la
    stabilité de notre économie.                       culture et du mode de fonctionnement des
                                                       administrations. Des freins au changement
    9'!&*4-,!$40/4(;-.*#!)&*0!'&40#!(2&'&7-#!          subsistent, et des risques peuvent émerger.
                                                       Rien n’indique cependant qu’ils ne puissent
        Des conditions de réutilisation plus libres
                                                       être surmontés, surtout si l’État s’engage dans
    encourageraient l’innovation et pourraient
                                                       une collaboration rapprochée avec la
    contribuer au développement de l’économie
                                                       communauté des réutilisateurs.
    numérique : les nouveaux services et
    applications mobiles, qui en bénéficieraient
                                                       E0&-$!/A#$!$40/4(;-.*#$!)&*0!C/1&0-$#0!,/!
    particulièrement, connaissent actuellement une     0(*4-,-$/4-&'!%#$!%&''(#$!)*+,-.*#$!
    très forte croissance. L’économie numérique
    est un facteur clé de croissance économique et         Nous proposons les trois axes stratégiques
    de création d’emplois en France.                   suivants pour favoriser la réutilisation des
                                                       données publiques et permettre à la société
        L’accès aux données publiques offre de         d’en retirer l’ensemble des bénéfices attendus.
    plus les prémisses d’une « infrastructure
    informationnelle », qui pourrait faciliter le          Simplifier pour accélérer : réduire les
    développement durable en permettant aux            efforts nécessaires d’une part à la diffusion des
    consommateurs de faire des choix mieux             données par les acteurs publics, et d’autre part
    informés.                                          à leur réutilisation, afin d’accélérer le
                                                       développement de services utiles à partir des
         Enfin, la réutilisation des données           données publiques.
    publiques constitue un élément de soutien aux
    objectifs     stratégiques   d’investissement          Faciliter l’expérimentation : adapter les
    d’avenir pour l’économie française, de la          conditions de réutilisation des données
    société numérique aux villes de demain, aux        publiques pour faciliter l’expérimentation par
    transports intelligents, en passant par            les citoyens, les associations et la communauté
    l’encouragement à la recherche scientifique et     des développeurs et des entrepreneurs.
    à l’innovation.                                       Favoriser l’émergence d’un écosystème :
                                                       favoriser l’émergence d’un écosystème de
                                                       producteurs et de réutilisateurs de données
                                                       publiques en France, autour de la mission
                                                       Etalab et du futur portail data.gouv.fr.


8
F#-G#!)0&)&$-4-&'$!)&*0!*'#!)&,-4-.*#!'/4-&'/,#!    6. Impliquer des acteurs publics pilotes dans
/7+-4-#*$#!%#$!%&''(#$!)*+,-.*#$!                   les projets de recherche sur le Web
    Ce rapport formule seize propositions,          sémantique.
articulées selon les trois axes stratégiques
précédents. Elles sont présentées de manière
détaillée au chapitre 8, et visent à proposer une   7. Rendre la réutilisation des données
feuille de route claire pour mettre en place une    gratuite pour toute réutilisation à titre
politique ambitieuse des données publiques.         personnel.

                                                    8. Encadrer strictement les cas dans lesquels
1. Formaliser les bonnes pratiques de               une redevance est légitime, et charger les
diffusion des données publiques attendues           producteurs de données d’établir l’absolue
par la communauté des réutilisateurs :              nécessité de toute tarification :
   • Expliciter l’effort minimal attendu des           • Dépasser une valorisation purement
      différents acteurs publics.                         commerciale des données publiques et
   • Assurer la formation des agents et leur              encourager leur réutilisation la plus
      accès à des guides clairs et explicatifs.           large.
   • Simplifier les formats de diffusion.              • Généraliser la réutilisation libre et
                                                          gratuite la plus large possible.
2. Mettre en cohérence les conditions légales          • Restreindre la tarification à coûts
de réutilisation des données issues de                    moyens aux marchés matures.
sources différentes :
   • Établir une « licence données ouvertes »       9. Conditionner toute redevance pour
      pour      réutilisation    gratuite   qui     réutilisation de données à valeur ajoutée à la
      s’appliquerait le plus largement possible.    mise à disposition gratuite des données
   • Encourager un marquage graphique des           brutes qui les sous-tendent.
      droits de réutilisation.
                                                    10. Explorer des conditions alternatives de
3. Encourager l’utilisation de formats              réutilisation pour laisser carte blanche à
facilement réexploitables, qui respectent les       l’expérimentation :
normes d’interopérabilité et de « lisibilité           • Privilégier les partenariats avec les
machine » :                                                nouveaux acteurs de l’innovation.
   • Privilégier les formats ouverts respectant        • Explorer les licences gratuites avec
      les normes d’interopérabilité.                       partage des conditions initiales à
   • Communiquer auprès des agents sur                     l’identique (share alike).
      l’importance des formats réexploitables.         • Explorer la rémunération par l’accès aux
   • Maintenir une liste de formats                        données d’usage.
      correspondants à ces critères.                   • Explorer la rémunération par le service
                                                           client.
4. Faire en sorte que chaque contrat public            • Faciliter l’expérimentation avec les Web
clarifie à l’avenir le financement de                      Services.
l’ouverture et les droits de réutilisation liés
aux données produites dans son cadre :              11. Impliquer la communauté des
   • Clarifier le financement de l'ouverture et     réutilisateurs dans les initiatives de mise à
       les droits de réutilisation de données       disposition de données publiques :
       dans les contrats publics.                      • Créer un point d’accès unique centralisé
   • Établir des bonnes pratiques et des                   et mis à jour automatiquement.
       clauses types.                                  • Développer une offre grand public qui
   • Élargir le périmètre des données                      mette en valeur des applications utiles.
       réutilisables aux ressources essentielles.      • Investir dans l’accompagnement de la
                                                           communauté.
5. Faciliter l’enrichissement des données et           • Démultiplier le service aux utilisateurs.
l’intégration de corrections éventuelles par           • Organiser des séminaires ou ateliers de
la communauté :                                            travail ponctuels sur les sujets
   • Faciliter l’intégration des métadonnées.              techniques       d’intérêt    pour       la
   • Permettre l’enrichissement collectif des              communauté.
       jeux de données.


                                                                                                         9
12. Mettre en place des assises des données         • Illustrer la réutilisation des données
     publiques et animer la communauté des                 publiques par le développement de
     réutilisateurs :                                      services aux citoyens.
        • Regrouper l’ensemble de l’écosystème           • Faire des données et de leur réutilisation
            pour des assises des données publiques.        un outil d’éclairage du débat public.
        • Animer          la    communauté       des
                                                       15. Développer une stratégie nationale à
            réutilisateurs.
                                                       partir du rôle de coordination des
     13.    Encourager        le    développement      institutions publiques de la mission Etalab :
     d’applications à partir des données                  • Mutualiser des solutions de mise en
     publiques :                                              ligne pour les administrations et les
        • Organiser un concours national de                   collectivités.
           développement d’applications.                  • Développer une stratégie nationale pour
        • Prendre en compte la réutilisation des              les données publiques.
           données publiques dans les appels à
           projets de R&D numérique.
                                                       16. Élargir le champ de l’Open Data :
        • Pérenniser l’offre d’applications créées à
                                                          • Élargir le champ de la libre réutilisation
           partir des données publiques.
                                                             des données publiques.
                                                          • Explorer l’application de l’Open Data
     14. Intégrer au débat démocratique les                  aux entreprises privées.
     données publiques et leur réutilisation :            • Développer une stratégie européenne et
        • Communiquer       aux    administrations           internationale.
          l’importance des données pour mettre en
          lumière leurs métiers.




10
/,>%&!'&(!<,+.I-&(!

Résumé analytique__________________________________________________________________ 7

Table des matières _________________________________________________________________ 11

Introduction ______________________________________________________________________ 13



Partie 1. « Open Data » : Contexte et enjeux d’une question sociétale ________________________ 17



Chapitre I. Données publiques : émergence d’une question sociétale __________________________ 19

  1. La donnée au cœur des nouveaux usages ___________________________________________ 19

  2. Les données publiques et leur réutilisation __________________________________________ 21

Chapitre II. La libre réutilisation des données publiques à l’international ______________________ 25

  1. Le mouvement Open Data _______________________________________________________ 25

  2. États-Unis : initiatives locales, puis démarche fédérale_________________________________ 26

  3. Grande Bretagne : une impulsion transpartisane du gouvernement________________________ 28

  4. Situations contrastées en Europe __________________________________________________ 30

Chapitre III. Les enjeux de la réutilisation des données publiques ____________________________ 33

  1. Démocratie, transparence et débat public ___________________________________________ 33

  2. Modernisation de l’État _________________________________________________________ 34

  3. Innovation et soutien à l’économie numérique _______________________________________ 35

  4. Des données stratégiques pour l’économie __________________________________________ 38

  5. Un nouveau mode d’action publique _______________________________________________ 42



Partie 2. État des lieux de la réutilisation des données publiques en France _____________________ 47



Chapitre IV. Le cadre de la réutilisation des données publiques en France _____________________ 49

  1. Le cadre juridique pose en principe la liberté de réutilisation ____________________________ 49

  2. Les acteurs de la réutilisation de données publiques ___________________________________ 53




                                                                                                        11
Chapitre V. Premières expériences d’ouverture des données publiques en France ________________ 57

       1. La réutilisation des données dans les collectivités territoriales ___________________________ 57

       2. L’ouverture des données au niveau national : trois études de cas _________________________ 62

       3. La mise en place d’une politique nationale des données publiques________________________ 65



     Partie 3. Comment favoriser la réutilisation des données publiques ?__________________________ 69



     Chapitre VI. Abaisser les barrières à la réutilisation _______________________________________ 71

       1. Répondre aux contraintes techniques ______________________________________________ 71

       2. Gérer la complexité juridique ____________________________________________________ 72

       3. Anticiper l’impact organisationnel ________________________________________________ 74

       4. Établir des modèles économiques propices à l’innovation ______________________________ 75

     Chapitre VII. Prospective : Trois scénarios pour l’avenir ___________________________________ 83

       1. « Inertie » : Développement de l’offre de données publiques à son rythme historique _________ 83

       2. « Capture » : Des monopoles informationnels se substituent à la puissance publique _________ 85

       3. « Symbiose » : Catalyser le développement d’un écosystème____________________________ 87

     Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques ___________ 91

       1. Simplifier pour accélérer ________________________________________________________ 91

       2. Faciliter l’expérimentation pour encourager l’innovation _______________________________ 94

       3. Soutenir l’émergence d’un écosystème _____________________________________________ 96



     Bibliographie ____________________________________________________________________ 101

     Textes règlementaires _____________________________________________________________ 105

     Interlocuteurs____________________________________________________________________ 107

     Liens et références ________________________________________________________________ 109




12
;*+-$'7#+.$*!
                                                                    « Si l’on partage des données sur le
                                                                Web, des données publiques, des données
                                                                scientifiques, des données citoyennes,
                                                                quelles qu’elles soient, d’autres que nous
                                                                sauront en tirer des créations merveilleuses
                                                                que nous n’aurions jamais imaginées. »
                                                                    Tim Berners-Lee, Inventeur du Web




    Hal Varian, Économiste en Chef chez                       inventer de nouveaux usages. Tous types
Google, le précise : « Je répète sans cesse que               d’objets numériques sont concernés : des
la profession sexy dans les dix prochaines                    tableaux chiffrés, des mesures numériques, des
années, ce sera statisticien. Et ce n’est pas de              bases de données, des cartes ou encore des
l’humour.1 »                                                  jeux de données géolocalisées.
    On peut émettre des réserves quant au                         Les applications en question vont des
pouvoir     de     séduction      d’un      tableur           services les plus simples aux plus complexes,
informatique ; il reste que l’attrait de la science           de l’expérimentation au produit professionnel :
des données s’est considérablement accru ces                  des étudiants développent une application
dernières années. Ses algorithmes ont gagné en                mobile, des citoyens quantifient l’action de
puissance et ses applications jouent un rôle                  leurs députés, des journalistes créent de
central dans la société de l’information.                     nouvelles infographies plus instructives, une
                                                              entreprise calcule des itinéraires de transports
   À mesure que nos outils informatiques
                                                              publics au service des internautes.
deviennent plus mobiles, leurs applications
gagnent en importance dans nos vies                               Les      développements      technologiques
quotidiennes. En recoupant des données                        récents      ont    largement     accéléré    le
numériques diverses, en les adaptant à notre                  développement de ce phénomène, et les
usage à travers une ergonomie simple, les                     attentes d’une partie du public sont aujourd’hui
smartphones et les tablettes tactiles simplifient             très fortes.
bon nombre des tâches de la vie quotidienne et
professionnelle.                                              9'#!)0&+,(7/4-.*#!'&*1#,,#!#4!2&7),#A#!)&*0!
                                                              ,#!$#24#*0!)*+,-2!
"/!0(*4-,-$/4-&'!%#$!%&''(#$!)*+,-.*#$!                           La réutilisation des données publiques offre
    Un mouvement de réutilisation des données                 des possibilités nouvelles à la sphère publique.
publiques2 a vu le jour depuis plusieurs années.              Elle appelle une évolution de la culture et du
Concrètement, il s’agit pour des développeurs                 mode de fonctionnement des administrations.
informatiques ou tout autre citoyen d’accéder à               Elle soulève surtout de nombreuses questions.
des données produites initialement dans le                        Quelles opportunités ? Quels risques ?
cadre du fonctionnement de l’État, et de leur                 Quelles pistes pour en faire profiter au mieux
                                                              la société ? Quels enseignements tirer de
1
                                                              l’expérience d’autres pays en la matière ?
  Steve Lohr. 5 août 2009. « For Today’s Graduate, One        Quel(s) public(s) cette politique vise-t-elle,
Word: Statistics ». The New York Times.
http://www.nytimes.com/2009/08/06/technology/06stats.ht       avec quels objectifs et quels moyens ? Quelles
ml                                                            limites et quelles garanties donner au droit à la
2
  À l’exclusion bien sûr des données personnelles et des      réutilisation ?
données confidentielles (loi de 1978 sur la liberté d’accés
aux documents administratifs, modifiée par Ordonnance
n°2005-650 du 6 juin 2005).


                                                                                                                  13
9'#!&))&04*'-4(!-7)&04/'4#!)&*0!,#!                 2011 dans le monde, et un historique des
     %(1#,&))#7#'4!%*!'*7(0-.*#!                         évolutions récentes dans les pays occidentaux
         Grâce aux réseaux mobiles à haut débit, la      (chapitre 2).
     connectivité devient ubiquitaire. Les nouvelles         Nous nous attachons ensuite à cerner les
     plateformes mobiles permettent désormais            bénéfices que l’on peut attendre d’une
     d’accéder en direct à des services ou des           politique de soutien à la réutilisation des
     informations dans le contexte dans lequel           données publiques. Nous évoquons les enjeux
     ceux-ci sont le plus utiles. Ces évolutions ont     liés à la participation démocratique et à
     donné naissance à une industrie nouvelle et en      l’efficacité de l’action publique. Nous
     forte croissance, celle des applications            explicitons les différents mécanismes à travers
     mobiles.                                            lesquels la donnée publique peut contribuer au
         Des acteurs internationaux du Web ont su        développement économique (chapitre 3).
     prendre des positions fortes sur ce marché. La
     France possède des atouts pour réussir dans ce      "/!0(*4-,-$/4-&'!%#$!%&''(#$!)*+,-.*#$!#'!
                                                         I0/'2#!
     secteur. Faciliter l’accès aux données
     publiques en vue d’une réutilisation                   Une deuxième partie fait ensuite le point
     commerciale pourrait favoriser la création          sur la réutilisation des données publiques en
     d’activités économiques novatrices.                 France aujourd’hui (chapitre 4).

     9'!%(+/4!)/$$-&''(!
                                                             Le chapitre suivant vise à fournir aux
                                                         agents publics des pistes et références à partir
         Opportunité de développement économique         desquelles construire leur réflexion. Nous
     et avancée en matière de transparence d’une         cherchons en particulier à comprendre le
     part, érosion potentielle de la capacité d’action   contexte de cette politique, son cadre juridique
     de l’État et de ses ressources propres de           et technique, et les acteurs qu’elle met en jeu
     l’autre : la tarification de la réutilisation des   (chapitre 5).
     données publiques est l’objet d’âpres débats,
     quand elle ne donne pas lieu à des contentieux.     H&77#'4!C/1&0-$#0!,/!0(*4-,-$/4-&'!%#$!
                                                         %&''(#$!)*+,-.*#$!J!
         L’ouverture des données elle-même peut
     faire     peur,     quand     ce     n’est    pas       Le mouvement de réutilisation de données
     l’incompréhension quant à l’intérêt d’un droit      étant durablement amorcé, il convient de
     à la réutilisation de données qui interpelle.       s’interroger sur les difficultés auxquelles il
                                                         risque de se heurter dans l’administration, les
     9'!7&*1#7#'4!#';/;(!$*0!,#!,&';!4#07#!              établissements publics et les collectivités :
                                                         difficultés d’ordre juridique, organisationnel,
        La mise à disposition des données
                                                         technique et financier. Nous abordons la
     publiques pour leur réutilisation n’est pourtant
                                                         question de la tarification optimale, et des
     pas un effet de mode : il s’agit d’un droit
                                                         modèles économiques qui doivent s’appliquent
     opposable consacré par la loi, basé sur une
                                                         aux données publiques (chapitre 6).
     Directive de 2003 que la Commission
     Européenne envisage d’étendre et de renforcer.          À partir des dynamiques en présence, nous
                                                         avons imaginé trois scénarios futurs pour la
        Cette évolution engagée confronte chaque
                                                         réutilisation des données publiques : l’Inertie,
     administration centrale, chaque collectivité
                                                         la Capture et la Symbiose. Nous détaillons les
     locale, chaque établissement public à des
                                                         caractéristiques et les implications de chacun
     questions difficiles. Qu’attend-on d’eux
                                                         de ces futurs possibles (chapitre 7).
     exactement, et comment bien faire ?
                                                         H&'2,*$-&'$!#4!0#2&77/'%/4-&'$!
     H&'4#A4#!#4!#'>#*A!%3*'!$*>#4!%#!$&2-(4(!!
                                                             Le scénario de la Symbiose et du
         Le premier chapitre s’attelle à esquisser un
                                                         développement d’un écosystème présente de
     portrait synthétique des grandes évolutions qui
                                                         loin le plus d’avantages : travailler à
     ont amené la question des données publiques à
                                                         l’ouverture des données publiques en
     devenir, en l’espace de quelques années, un
                                                         collaboration avec la communauté de ceux qui
     véritable sujet de société. Nous passons
                                                         les réutilisent est une nécessité pragmatique
     notamment       en    revue    les    évolutions
                                                         plus qu’un choix idéologique.
     technologiques récentes qui l’ont portée sur le
     devant de la scène (chapitre 1).                       Pour que la société puisse tirer l’ensemble
                                                         des bénéfices potentiels de la réutilisation des
        Le second chapitre dresse un état des lieux
                                                         données publiques, il convient cependant
     de la réutilisation des données publiques en



14
d’encourager son développement au rythme le         développement de services utiles à partir des
plus rapide.                                        données publiques.
    Nous proposons enfin (chapitre 8) seize             Faciliter l’expérimentation : adapter les
propositions groupées en trois axes                 conditions de réutilisation des données
stratégiques, visant à établir une feuille de       publiques pour faciliter l’expérimentation par
route claire vers une politique ambitieuse des      les citoyens, les associations et la communauté
données publiques.                                  des développeurs et des entrepreneurs.
    Simplifier pour accélérer : réduire les            Favoriser l’émergence d’un écosystème :
efforts nécessaires d’une part à la diffusion des   favoriser l’émergence d’un écosystème de
données par les acteurs publics, et d’autre part    producteurs et de réutilisateurs de données
à leur réutilisation, afin d’accélérer le           publiques en France, autour de la mission
                                                    Etalab et du futur portail data.gouv.fr.




                                                                                                      15
),-+.&!CJ!K!K)#'!D/4/!L!M!!
N$*+&8+&!&+!&*E&78!':7*&!B7&(+.$*!($#.5+,%&!




                                               17
N0,2.+-&!;J! 4$**5&(!27>%.B7&(!M!5<&-6&*#&!':7*&!
B7&(+.$*!($#.5+,%&!

    Les évolutions technologiques récentes ont        avait pour but de faciliter l’accès et le
rendu possible le partage rapide et aisé de tous      référencement de documents en symbolisant
types de données. Elles réactivent, sous un jour      leur manipulation sous forme de phrases, liant
nouveau, le débat déjà ancien sur l’accès aux         verbes intuitifs (lire, afficher, remplacer,
documents administratifs, maintenant sous             effacer) et métadonnées d’adressage universel
forme électronique et bien plus aisément              (URL ou Uniform Resource Locator5).
diffusables.
                                                          Bien que basées sur un réseau d’échange de
    L’Internet a fait apparaître une économie         documents, les techniques du Web ont
des données. Les stratégies de croissance des         naturellement développé un tropisme de plus
acteurs du Web, via l’ouverture de leurs              en plus marqué vers les données elles-mêmes.
interfaces de programmation (API), ont illustré       L’introduction des bases de données
le potentiel de la réutilisation des données, et      relationnelles dans les outils de développement
suscité des attentes similaires des développeurs      a permis la création de sites dynamiques, c’est-
vis-à-vis du secteur public. Ils exercent une         à-dire dont les pages s’adaptent aux
pression pour que les États, en facilitant l’accès    circonstances (évolutions de prix, listes
à leurs informations, s’insèrent et tiennent leur     d’objets changeants, « unes » de journaux
rang dans ce « Web des Données ».                     électroniques mises à jour fréquemment). À
                                                      partir de 2004, une technique émergente a vu
    Ces     ruptures     technologiques        ont
                                                      le jour qui consiste à utiliser les fonctionnalités
accompagné par ailleurs une prise de
                                                      de scripting6 présentes dans les navigateurs
conscience de l’importance des données
                                                      pour permettre la mise à jour en temps réel de
produites par l’administration et le secteur
                                                      pages déjà chargées, en allant chercher en
public. La possibilité novatrice de réutiliser ces
                                                      tâche de fond des données remises à jour.
données sous forme brute, pour leur trouver de
                                                      Nommée AJAX7 pour JavaScript Asynchrone
nouveaux usages utiles et instructifs, a abouti à
                                                      et XML (Asynchronous Javascript And XML),
l’émergence de la question des données
                                                      à partir du langage de scripting JavaScript et
publiques en tant que véritable question
                                                      du format d’échanges de données XML, cette
sociétale.
                                                      technique à la croisée de différentes
                                                      technologies Web est reconnaissable derrière
CJ O,!'$**5&!,7!#P7-!'&(!                             des applications Web hautement réactives dont
                                                      les pages ont rarement besoin d’être rafraîchies
*$7?&,78!7(,6&(!                                      – telles que GMail8, Quora9 ou Facebook10.
    Internet et les ruptures technologiques
récentes on fait apparaître une nouvelle
« économie des données ».                             http://www.w3.org/People/Berners-Lee/
                                                      5
                                                        World Wide Web Consortium (W3C). 1994. Uniform
                                                      Resource Locators (URL) : A Syntax for the Expression of
L-M "#!N#+!#$4!$40*24*0(!/*4&*0!%#!,3(2:/';#!%#!      Access Information of Objects on the Network.
%&''(#$=!                                             http://www.w3.org/Addressing/URL/url-spec.txt
                                                      6
                                                        Capacité d’un navigateur à faire tourner dynamiquement
    Le génie informatique (computer science           un programme qui agit en temps réel sur la page affichée.
dans le monde anglo-saxon) est défini comme           Par exemple, une page qui affiche l’heure repose sur un
la manipulation algorithmique de données et de        script qui demande au navigateur de mettre à jour l’heure,
                                                      les minutes et les secondes à mesure qu’elles s’écoulent.
leurs structures de représentation. Le Web,           Dans le cas d’un service de courrier en ligne, c’est souvent
avant d’être un phénomène social, est une             un script qui réagit au click sur l’intitulé d’un email et
architecture logicielle3 conçue par un                change l’affichage pour détailler le contenu du mail plutôt
chercheur britannique en physique des hautes          que celui de la boîte de réception. C’est aussi un script qui
                                                      vérifie automatiquement l’arrivée de nouveaux courriers
énergies au CERN, Sir Tim Berners-Lee4. Elle          en tâche de fond, et réintègre éventuellement ces nouvelles
                                                      données dans le corps de la page affichée.
                                                      7
                                                        Garrett, J.J. 18 février 2005. « Ajax : A New Approach
3
  World Wide Web Consortium (W3C), 2010, HTTP –       To Web Applications ».
Hypertext Transfer Protocol Overview – draft 09.      http://www.adaptivepath.com/ideas/essays/archives/00038
http://www.w3.org/Protocols/                          5.php
4                                                     8
  World Wide Web Consortium (W3C). Sir Tim Berners-     GMail, service de boîte de courrier électronique en ligne
Lee: Bio. Téléchargée le 10 janvier 2011.             de Google, Inc. : http://www.gmail.com


                                                                                                                      19
Pour supporter cette technologie, de plus en              gagne en utilité pour ses utilisateurs, et le
     plus d’applications en ligne ont développé à la               système producteur voit sa position
     fois deux interfaces : une interface graphique                compétitive renforcée par la dépendance
     classique accessible aux utilisateurs à travers               accrue du marché à ses services. En l’essence,
     leur navigateur, et une interface exclusivement               c’est une transaction de marché où l’accès à
     consacrée aux machines, qui permet justement                  des données est échangé contre leur diffusion à
     au moteur de scripting du navigateur de                       un nouveau public ou dans un nouveau
     récupérer des données à la volée. C’est cette                 contexte.
     interface, qu’on peut se représenter comme un
                                                                      L’exposition d’une interface API est
     protocole d’échange de données de machine à
                                                                   aujourd’hui une étape presque obligée du
     machine, qu’on appelle interface de
                                                                   développement d’un nouveau produit en ligne.
     programmation ou API (sigle anglophone pour
                                                                   La généralisation de ce phénomène est d’une
     Application Programming Interface).
                                                                   grande importance pour la question des
                                                                   données publiques, car elle a permis de prendre
     L--M "/!%&''(#<!7&''/-#!%3(2:/';#!#4!,#1-#0!
     %3-'C,*#'2#!$*0!,#!N#+=!                                      conscience de l’omniprésence des données
                                                                   derrière     les      services      qu’utilisent
         Les API sont devenues un véritable outil                  quotidiennement les internautes.
     stratégique pour les sociétés de services en
     ligne.11 Par exemple, c’est dans une large                        En un mot, « l’économie des données »
     mesure grâce à l’ouverture de leur API12 que                  s’est construite autour de l’échange et de la
     Twitter a pu permettre à une communauté de                    fluidité sur le Web : les données ont souvent
     développeurs de se créer, et de multiplier les                plus de valeur comme outil d’échange et
     applications permettant d’utiliser le service en              d’influence qu’isolées au sein des entrepôts de
     dehors du site Web principal (notamment dans                  données des entreprises13.
     les premiers jours de l’App Store d’Apple
     durant l’été 2008). Ce grand nombre                           L---M 81#2!,#!N#+!O=P<!,/!%&''(#!%#1-#'4!
                                                                   2&,,#24-1#!
     d’applications a servi de « force de vente »
     virtuelle pour Twitter, et est un des facteurs                   Un corollaire de la montée en puissance de
     principaux qui expliquent son succès                          la donnée est son rôle de liant social sur le
     populaire.                                                    Web. En particulier, avec l’apparition de
                                                                   phénomènes de collaboration de masse tels que
         Bien documentées et basées sur des
                                                                   Wikipedia, on s’aperçoit que l’échelle
     standards acceptés (tels que JSON ou XML)
                                                                   d’échanges rendue possible par Internet ouvre
     pour éviter les problèmes d’interopérabilité,
                                                                   des possibilités insoupçonnées jusqu’alors.
     ces interfaces s’adressent à des développeurs
     informaticiens. Selon le degré d’ouverture                        Des services tels que Delicious (site de
     (fonction des choix stratégiques de la société)               partage de bookmarks, qui agrège les
     et les conditions de licences (souvent conçues                catégories dans lesquelles les utilisateurs
     pour encourager la réutilisation) consentis à                 rangent différents liens, et permet ensuite de
     ces     derniers,    ils   peuvent     extraire,              trouver des liens par catégorie d’intérêt) ou
     éventuellement modifier, et transformer les                   Flickr (qui permet de chercher des
     données du service Web en question, pour les                  photographies libres de droits sur un sujet
     réutiliser, notamment à la construction de                    particulier, en se basant sur les tags de
     nouveaux      services    ou    de   nouvelles                catégorisation produits par l’ensemble des
     applications.                                                 utilisateurs) ont ainsi profité de ce phénomène
                                                                   de folksonomy, la taxonomie par les foules ou
        L’échange est mutuellement bénéfique : le
                                                                   classification par l’intelligence collective14.
     nouveau service, consommateur de données,
                                                                      D’autres services tels qu’Amazon ou
                                                                   Netflix ont, eux, profité de la masse
     9
        Quora, Inc., site de questions et réponses dynamique
     caractérisé par l’expertise pointue de sa communauté
     d’utilisateurs, fondé en 2009 et qui a connu une très forte   13
                                                                       Ed Parsons - Geospatial Technologist for Europe,
     croissance en 2010 : http://www.quora.com
     10
         Facebook, Inc., le réseau social dominant qu’on ne        Middle East and Africa chez Google, au séminaire
     présente plus, fondé par Mark Zuckerberg en 2004 et           « Innovations et développement du secteur de
     approchant 600 millions d’utilisateurs début 2011 :           l’information géographique » organisé le 5 octobre 2009 à
     http://www.facebook.com                                       la Grande Arche de la Défense par le Conseil National de
     11
         Shah S., 28 August 2010, « Cannibalize Business           l’Information Géographique (CNIG), l’AFIGÉO et
     Development by Popularizing your API » :                      l’Institut des Sciences et des Techniques de l’Équipement
     http://shaivalshah.com/cannabilize-business-development-
                                                                   pour le Développement (ISTED)
     by-populariz                                                  14
     12
        Entretien le 12 novembre 2010 avec Henri Verdier,             Tapscott, D. and Williams, A. 2006. Wikinomics : How
     Président de Cap Digital.                                     Mass Collaboration Changes Everything.


20
d’utilisateurs se servant de leurs sites pour en            « différentes sources au sein d’une seule
extraire des modèles de préférences des                     plateforme, (…) l’une des facettes du design
consommateurs, qui leur permettent de faire                 collaboratif sur le Web17 ». Cette nouvelle
des         recommandations           hautement             tendance a connu un tel succès au tournant des
personnalisées selon les goûts de leurs clients.            années 2006 à 2008 que le prestigieux
                                                            Museum of Modern Art de New York y a
    L’un des enseignements de la nouvelle
                                                            consacré une exposition phare18.
incarnation sociale et collaborative du Web,
c’est que la valeur des données n’est pas                       Au-delà de l’incidence culturelle de ce
intrinsèque, mais dérive de leur agrégation, de             phénomène19, la réappropriation du local et de
leur recoupement, de leur analyse et de la                  l’espace géographique par le biais du Web et
réutilisation qui en est faite.                             du mobile annonçait l’importance croissante de
                                                            la donnée informatique géographique, et, au-
    Le Web a ainsi mis à jour une économie
                                                            delà, l’émergence du phénomène culturel du
des données, qui joue un rôle de monnaie
                                                            remix et de la réutilisation des données.
d’échange parmi les entreprises d’Internet et
les services en ligne.
                                                            FJ O&(!'$**5&(!27>%.B7&(!&+!
L-1M D&''(#$!;(&;0/):-.*#$!#4!Q!7/$:R*)$!S!
                                                            %&7-!-57+.%.(,+.$*!
    L’autre développement technologique qui a
conduit à prendre conscience de l’importance                    La génération des digital natives, qui a
des données, c’est la démocratisation de                    grandi dans l’habitude de la réutilisation, du
l’information géographique.                                 remix et de la recombinaison permanente,
                                                            devait nécessairement s’intéresser aux
    Google indique par exemple que son                      informations      collectées    par      l’État.
approche est « d’utiliser la géographie pour                L’émergence de la réutilisation des données
organiser toute l’information mondiale, qu’elle             publiques comme sujet de société, poussée par
soit géographique ou non. C’est un principe                 les nouveaux usages, a révélé une chaîne de
d’organisation qui sera utilisé pour mieux                  valeur fondée sur ces données qui, lorsqu’elles
comprendre l’information. »15.                              sont mises à disposition de façon brute et
    Si les briques technologiques sont                      réexploitable, permet aux développeurs et aux
disponibles pour utiliser et manipuler la                   entrepreneurs de créer de nouveaux services.
donnée géographique à loisir, ou même pour
l’utiliser pour structurer d’autres données, le             L-M "#$!%&''(#$!'*7(0-.*#$!&'4!1&2/4-&'!T!,/!
                                                            %-CC*$-&'!,/!),*$!,/0;#!
défi qui reste posé est celui de la constitution
d’une véritable infrastructure des données                      Contrairement aux documents papiers dont
géographiques. Ces données sont aujourd’hui                 l’impression engendre des coûts variables
accessibles en nombre et de qualité, mais les               conséquents et qui nécessitent des délais de
repérer et les réutiliser peut rester obscur et             traitement et d’acheminement, les données
complexe16.                                                 numériques ont un coût marginal de diffusion
                                                            nul ou presque20, et sont accessibles quasiment
    Conséquence récente des évolutions du
                                                            instantanément.
Web, des applications cartographiques
puissantes réservées jusque-là à des experts                    Le travail éventuel de mise à disposition de
sont devenues accessibles à tous. Le monde du               données numériques est donc un coût fixe : la
Web collaboratif a largement repris à son                   diffusion la plus large, en distribuant ce coût,
compte la possibilité de représenter des                    est donc le modèle le plus efficace d’un point
données sur des cartes. Grâce à l’ouverture                 de vue économique.
gratuite (dans des limites relativement larges
de volume) de son API, Google Maps est
devenu une base de choix pour la création de                17
                                                               Google Earth mashups 5 of 14, in « Design and the
« mashups », ces applications Web combinant                 Elastic Mind. » Museum of Modern Art. New York, NY.
                                                            2008.
                                                            http://www.moma.org/interactives/exhibitions/2008/elastic
15
   Ed Parsons – Ibid.                                       mind/#/98/
16                                                          18
    Voir l’intervention de Max Craglia, coordonateur           « Design and the Elastic Mind. » Museum of Modern
technique d’Inspire pour la Commission Européenne           Art. New York, NY. 2008.
(centre commun de recherche) au séminaire « Innovations     http://www.moma.org/interactives/exhibitions/2008/elastic
et développement du secteur de l’information                mind/
                                                            19
géographique » organisé le 5 octobre 2009 à la Grande           Lessig, L. 2009. Remix : Making art and commerce
Arche de la Défense par le Conseil National de              thrive in the hybrid economy. http://remix.lessig.org/
                                                            20
l’Information Géographique (CNIG), l’AFIGÉO et                 Les volumes qui peuvent être atteints font que le coût de
l’Institut des Sciences et des Techniques de l’Équipement   diffusion n’est en revanche pas négligeable et peut dans
pour le Développement (ISTED).                              certains cas devenir important.


                                                                                                                           21
L’instantanéité de diffusion et l’ubiquité       riches et très variées ; certaines ont une forte
     d’accès offrent de plus des perspectives tout à      valeur     économique.      Le     marché    de
     fait nouvelles en terme de périmètre de              l’information est estimé en France à
     diffusion et d’audience potentielle, notamment       3,7 milliards d’euros dont 60 % sont des
     au regard de la démocratisation de l’Internet.       données publiques21. Au niveau européen, ce
                                                          chiffre représenterait près de 27 milliards
     L--M H&7+-'#0!,#$!%&''(#$!+0*4#$!/7),-C-#!,#*0!      d’euros22 par an.
     )&4#'4-#,!
                                                              La valorisation passe par différentes étapes
         Marqué par les traditions et les habitudes       nécessaires pour rendre les données publiques
     d’un monde de communication par le papier,           utilisables ou réutilisables. D’une part
     l’État diffuse le plus souvent ses informations      l’institution    productrice     doit     définir
     sous forme de « produits finis », tels que des       précisément quelles données elle doit diffuser
     analyses, des pages Web explicatives ou des          en ligne et de quelle manière, par un travail
     rapports écrits – en quelque sorte des données       d’analyse et de collecte. S’imposent à ce stade
     « retravaillées » afin d’être intelligibles par      le respect de critères de bon sens comme la
     tous. À l’inverse, les données brutes qui sous-      protection de la vie privée, de la propriété
     tendent ces études sont rarement mises à             intellectuelle des tiers, ou de la sécurité
     disposition du public, car leur intérêt pour une     nationale.
     réutilisation potentielle est encore très
     inégalement perçu par les producteurs de                 D’autre part, pour faciliter la réutilisation,
     données publiques.                                   l’institution productrice doit s’assurer de
                                                          fournir une donnée qualifiée et mise à jour.
         Aujourd’hui,     les     technologies      de    Pour cela, il semble important de créer des lots
     l’information permettent une mise à                  de données cohérents et de s’assurer de la
     disposition des données à l’état brut. Loin          présence d’une légende et plus généralement
     d’être un obstacle à leur réutilisation              de la présence des métadonnées.
     ultérieurement à leur mise à disposition par
     l’administration, leur caractère brut permet au          Il faut les mettre à disposition via un
     contraire de les recombiner plus facilement, ce      support adapté mais en réalisant un catalogage
     qui amplifie leur potentiel et permet la création    précis : il ne suffit pas de mettre à disposition
     de services impossibles à réaliser sans ces          des données, encore faut-il qu’elles puissent
     croisements.                                         être découvertes et facilement accessibles
                                                          grâce à un portail de données publiques ou un
        Par exemple, des mesures locales de bruit         moteur de recherche.
     permettent de mettre en perspective la
     corrélation positive mesurée entre les dépenses      Enfin, les données publiques numériques mises
     énergétiques d’un ménage et son taux                 à disposition peuvent être réutilisées par la
     d’équipement en doubles vitrages, paradoxale         communauté des développeurs et des
     au premier abord. Dans le cadre d’un concours        entrepreneurs, qui peuvent leur inventer de
     organisé par la ville de Washington, D.C., des       nouveaux usages. Ces données représentent
     données sur les vols, croisées avec les tracés       aussi un outil interne au service des
     des pistes cyclables, ont aussi permis de créer      administrations, qui peut leur permettre des
     une carte des zones à éviter pour les cyclistes.     échanges d’information plus fluides et
                                                          efficaces.
         Parce qu’elle favorise ces croisements et
     ces combinaisons fertiles sur des sujets             L-1M "/!1-$*/,-$/4-&'!%#!%&''(#$!>&*#!*'!0V,#!
     recoupant des champs extrêmement vastes de           $40*24*0/'4!
     l’économie,     de    la    société     et    de
                                                              Les données géographiques ont un rôle
     l’environnement, la mise à disposition des
                                                          structurant dans la chaîne de valeur. Elles
     données brutes de l’État et des collectivités est
                                                          rendent possible la spatialisation et la
     un terreau fertile pour des réutilisateurs, qui
                                                          visualisation sur carte d’autres jeux de
     peuvent inventer de nouveaux usages à ces
                                                          données, notamment géolocalisées. Selon
     données.
                                                          l’Association Française pour l’Information
     L---M "#$!%&''(#$!)*+,-.*#$!#4!,#*0!0(*4-,-$/4-&'!
     $&'4!T!,3&0-;-'#!%3*'#!2:/U'#!%#!1/,#*0!             21
                                                             http://www.rgpp.modernisation.gouv.fr/index.php?id=51
                                                          &tx_ttnews[tt_news]=531&tx_ttnews[backPid]=11&cHas
         L’État et le secteur public au sens large,       h=89b9c6970f
     dans le cadre de leurs opérations, touchent à        22
                                                              Dekkers, M. et al., 2006, « MEPSIR, Measuring Public
     l’ensemble des secteurs de notre économie,           Sector Information Resources, Final Report of Study on
     notre société et notre environnement. Les            Exploitation of public sector information »,
     données qu’il collecte sont donc naturellement       http://ec.europa.eu/information_society/policy/psi/docs/pdf
                                                          s/mepsir/final_report.pdf


22
Géographique     (AFIGÉO)23,      80 %      des        Le processus de recherche, d’analyse puis
informations qui sont utilisées possèdent une      de représentation graphique synthétique des
dimension géographique. Cela leur confère          données sous forme interactive, qui
donc une importance particulière à la fois d’un    s’apparente à du journalisme et qu’on appelle
point de vue technique, mais aussi en tant         parfois « datajournalism » ou journalisme de
qu’outil de recoupement et de recombinaison        données, a participé à créer une demande pour
de données.                                        plus de transparence de la part des
                                                   gouvernements, et à l’émergence du sujet de la
    Ainsi, dès 1854, John Snow détermina les
                                                   réutilisation   des     données     publiques.
causes de la propagation du choléra grâce à la
visualisation de données sur une carte. À cette
époque, on pensait que la maladie se
propageait par inhalation. Le médecin
                                                               ______________________
superposa sur une carte les adresses des
victimes du choléra à Exeter (quartier de
Londres) durant un épisode aigu, et constata
qu’elles coïncidaient avec l’accès à la pompe à
eau de la Broad Street. Par déduction, il en           Les données publiques offrent, par le biais
conclut au rôle de l’eau et des conditions         des réutilisations qui peuvent en être faites, un
sanitaires dans la propagation de l’épidémie, ce   fort potentiel d’innovation, tant à titre
qui permit de la contrôler, et de réduire          commercial que pour la recherche, le
drastiquement le taux de mortalité lié à cette     développement de nouveaux services aux
pathologie dans les décennies qui suivirent.       citoyens ou l’amélioration du travail de
    De manière plus générale, le succès de         l’administration.
l’infographie en ligne et des nouveaux modes           Les      nouvelles       possibilités     de
de visualisation dynamique ont amené les           recombinaison et de réutilisation offertes par
graphistes et designers à rechercher de            les technologies de l’information ont révélé
nouvelles informations et de nouvelles sources     l’importance de leur réutilisation, et contribué
de données à mettre en scène dans leurs            à en faire une question sociétale.
productions.




23
     http://www.afigeo.asso.fr/


                                                                                                       23
Carte d’Exeter tirée de History of the Cholera in Exeter in 1832, T. Shapter.




24
N0,2.+-&!;;J! O,!%.>-&!-57+.%.(,+.$*!'&(!'$**5&(!
27>%.B7&(!3!%:.*+&-*,+.$*,%!


    Le sujet de la réutilisation des données          nouvelles évolutions, et collaborer à la
publiques et l’appel à la mise à disposition          rédaction d’articles scientifiques, se répand
d’informations publiques sous forme brute a           largement au sein de la communauté des
émergé dans le contexte des ruptures                  chercheurs. Il trouve ensuite un écho dans la
technologiques et économiques de ces                  communauté des développeurs, notamment
dernières années.                                     parmi les contributeurs de projets Open
                                                      Source, dont le mouvement d’ouverture des
    C’est pourtant par deux ruptures politiques,
                                                      données est philosophiquement proche.
au plus haut niveau de l’État, d’abord aux
États-Unis puis en Grande-Bretagne, chaque               Des développeurs, des chercheurs et des
fois dans un contexte d’alternance politique,         économistes de l’information créent ainsi
qu’il a été concrétisé par une politique              l’Open Knowledge Foundation (OKFN) en
ambitieuse d’ouverture des données publiques.         2003 et l’Open Data Foundation (ODaF)25 en
                                                      2006 – organismes à but non lucratif qui
    Le chapitre suivant présente un tour
                                                      cherchent à promouvoir l’adoption de normes
d’horizon de ce mouvement d’ouverture des
                                                      mondiales de formats et de métadonnées
données publiques, et l’historique récent de ces
                                                      (description des jeux de données), et le
deux principales initiatives gouvernementales,
                                                      développement de solutions open source pour
qui l’ont concrétisée à l’international.
                                                      mutualiser les outils de mise en ligne de
                                                      données.
CJ O&!<$7?&<&*+!K)#'!D/4/!                                Les promoteurs de l’Open Data ont ainsi
    Le terme Open Data, littéralement                 développé des définitions formelles des
« données ouvertes » ou « données libres » (au        critères qui caractérisent des données
sens « libres de droits »), est utilisé pour          « ouvertes ». Un groupe de travail « Open
désigner des données en libre accès et ouvertes       Government Data » (OGD) d’experts du Web
à la réutilisation. Il trouve son origine en 1995     s’est fixé huit critères assez larges de définition
dans une publication du Comité sur les                des données publiques ouvertes26. L’Open
Données géophysiques et environnementales             Knowledge Foundation (OKFN), pour sa part,
du Conseil national de la Recherche aux États-        propose onze critères27, plus axé sur les
Unis intitulée « De l’échange complet et ouvert       conditions juridiques acceptables qui doivent
des données scientifiques »24 :                       se retrouver dans la licence de réutilisation.

         « Les programmes internationaux de               Les deux ensembles de critères, qui
     recherche sur le changement global et la         établissent une première définition des données
     surveillance environnementale dépendent          ouvertes, sont détaillés ci-dessous.
     du principe d’un échange complet et ouvert          Données complètes : toutes les données
     des données (i.e. les données et les             sont mises à disposition, sauf exceptions de
     informations sont rendues disponibles sans       bon sens.
     restriction,     sur   une     base     non
     discriminatoire, pour un coût réduit à celui        Données brutes : les données sont telles
     des besoins de reproduction et de                que collectées à la source. Elles ont la plus fine
     distribution). »                                 granularité possible et ne se présentent pas
                                                      sous des formes agrégées ou modifiées.
    Le terme, qui désigne donc à l’origine le
processus de collaboration des scientifiques              Données récentes : les données sont mises
autour de données d’expériences partagées afin        en ligne aussi rapidement que possible.
de multiplier les chances de détecter des
erreurs, se tenir mutuellement au courant des

24                                                    25
                                                         http://www.opendatafoundation.org/
                                                      26
http://www.nap.edu/readingroom.php?book=exch&page=s      http://www.opengovdata.org/home/8principles
                                                      27
ummary.html                                              http://www.opendefinition.org/okd/


                                                                                                            25
Données accessibles : les données sont            public) et l’opportunité politique ont mené au
     accessibles au plus grand nombre d’utilisateurs      lancement, aux États-Unis, en Grande-
     possible, et réutilisables pour des usages les       Bretagne et ailleurs en Europe notamment,
     plus variés.                                         d’initiatives majeures d’ouverture et de
                                                          réutilisation des données publiques.
         Données libres de droits : les données ne
     sont pas soumises au droit d’auteur, à brevet,
     au droit des marques, ou au secret commercial.       FJ Q+,+(R9*.(!M!.*.+.,+.?&(!
         Formats exploitables : les données sont          %$#,%&(A!27.(!'5<,-#0&!
     structurées pour permettre le traitement
     automatisé, et disponibles sous une forme
                                                          S5'5-,%&!!
     pratique et modifiable.                                  L’ouverture des données s’est effectuée
                                                          aux États-Unis du bas vers le haut. Les villes
        Formats non-propriétaires : les données
                                                          de Washington, New York, San Francisco, ont
     sont accessibles dans un format sur lequel
                                                          entrepris de recenser les collections de données
     aucune entité n’a de contrôle exclusif.
                                                          qu’elles envisagent de mettre à disposition,
         Conditions non discriminatoires : les            puis d’ouvrir des « data stores » pour mettre
     données sont accessibles à quiconque sans            ces jeux de données à la disposition du public
     aucune obligation préalable ni inscription, et       des entreprises, des développeurs et des
     sans discrimination entre les domaines               citoyens.28
     d’application. Les données sont notamment
                                                             Ces démarches de « libération » des
     disponibles aussi bien pour des réutilisations
                                                          données publiques sont très souvent
     commerciales que personnelles.
                                                          accompagnées de concours d’applications pour
         Paternité : la licence peut exiger, comme        encourager la réutilisation des données rendues
     condition pour la redistribution et la               publiques.
     réutilisation    des    données,    d’identifier
                                                              Ce mouvement, amorcé par les grandes
     clairement les créateurs de l’œuvre ou les
                                                          métropoles, fait désormais l’objet d’une
     contributeurs initiaux. Si cette condition est
                                                          politique au niveau fédéral.
     imposée, elle ne doit pas être indûment
     complexe à remplir, et notamment la liste des
                                                          L-M "/!0(*4-,-$/4-&'!%#$!%&''(#$!(7#0;#!%/'$!
     contributeurs à citer doit être clairement           ,#$!;0/'%#$!7(40&)&,#$=!
     indiquée.
                                                              L’année 2005 est marquée par une rupture
         Distribution de la licence : les droits          majeure : l’ouverture par Google des
     attachés aux données s’appliquent à tous ceux        « interfaces de programmation » (API) du
     à qui elles sont distribuées.                        service Google Maps donne lieu à une
         Non-transitivité de la licence : la licence ne   floraison d’applications et de mashups29. Un
     peut exiger que toute donnée distribuée              grand nombre de ces applications consistent à
     conjointement avec une donnée sous licence           positionner sur les cartes Google Maps des
     libre soit aussi elle-même sous licence libre, ce    données d’origine publique.
     qui serait un frein à la réutilisation de ces            Ainsi, à Chicago en 2005, Adrian
     données.                                             Holovaty, journaliste et programmeur30 lance
         Droit d’extraction : si les données sont         ChicagoCrime.org, un site qui renseigne sur
     extraites d’un jeu de données, les utilisateurs      une carte les données relatives aux crimes et
     de l’extrait doivent bénéficier des mêmes            délits commis dans la ville et récupérées
     droits que ceux qui sont accordés au jeu de          auprès de la municipalité31. Suite au succès de
     données dans son ensemble.                           l’application, et grâce à un don d’un million de
                                                          dollars de la Knight Foundation32 en 2007, il
         Bien que ce modèle des données ouvertes
     puisse s’appliquer à tous types de données,
     qu’elles soient produites par le secteur public      28
                                                             Benhamou, B., 2010, « Les concours d’applications
     ou non, l’importance démocratique de l’accès         mobiles dans le monde », Délégation aux Usages de
     aux informations publiques a conduit à               l’Internet, 21 octobre 2010.
                                                          29
     focaliser le débat sur l’Open Government Data,          Applications web combinant différentes sources au sein
                                                          d’une seule plateforme, l’une des facettes du design
     ou la réutilisation des données publiques.           collaboratif sur le web.
                                                          30
                                                             Auteur de la librairie de développement en langage
         Les évolutions technologiques, le cadre          Python à succès, Django.
     réglementaire (notamment les lois sur le droit à     31
                                                             Entretien le 18 octobre 2010 avec Sylvain Parasie,
     l’information et la Directive européenne sur la      LATTS, Ecole des Ponts ParisTech.
                                                          32
     réutilisation des informations du secteur               Organisation caritative dédiée aux avancées dans le
                                                          domaine du journalisme. Ce type d’acteurs dotés en fonds


26
développe une version commerciale du site,                   de sa cérémonie d’investiture, le Président
EveryBlock33 (pour « chaque pâté de                          Obama signe son premier acte politique : un
maison »), qui recense et agrège un grand                    mémorandum à destination des ministres et
nombre de données potentiellement utiles pour                directeurs d’agences intitulé « Transparency
les citoyens dans un plusieurs municipalités.                and Open Government » (Transparence et
                                                             Gouvernement Ouvert). Il assigne aux services
    Des services du même type, conçus à partir
                                                             fédéraux        américains trois   objectifs :
de données publiques des municipalités voient
                                                             transparence, implication des citoyens,
le jour dans les domaines de l’éducation, de
                                                             et collaboration.
l’environnement ou de la santé.
                                                                 Adrian Fenty, le maire de Washington,
L--M F*22W$!7(%-/4-.*#!%#$!2&'2&*0$!                         D.C. à l’époque, recommande Vivek Kundra
%3/)),-2/4-&'$=!                                             au Président Obama : le 5 mars 2009, ce
    Vivek Kundra, responsable des systèmes                   dernier est nommé Chief Information Officer
d’information du District de Columbia                        du gouvernement fédéral américain (Directeur
(autorité administrative de la ville de                      des Systèmes d’Information), un poste
Washington), s’empare en 2008 du sujet. Il                   nouveau et symbolique créé sur mesure, avec
lance Apps for Democracy, un concours de                     pour mission de mettre en place les
développement d’applications de services                     technologies pour concrétiser la vision
publics, ouvert à tous les développeurs, libres              politique du chef de l’exécutif.
de s’approprier des jeux de données mis à leur
disposition pour l’occasion34.                               L-1M "#!)&04/-,!C(%(0/,!D/4/=;&1!!

    Contre toute attente, le concours                            Dès le 11 mars, Vivek Kundra demande
d’application, doté par la Mairie d’un prix de               aux DSI de toutes les agences fédérales
50 000 dollars, connaît un succès considérable.              américaines de désigner des jeux de données
Alors qu’ils espéraient une dizaine de                       (« datasets ») susceptibles d’être mis en ligne.
réponses, les organisateurs reçurent 47 dossiers             Se basant sur son expérience à Washington, il
en 30 jours seulement. Le coût estimé du                     se concentre sur les données brutes. Data.gov
travail de conception et de programmation                    sera un point focal faisant autorité pour
ainsi mis à disposition des habitants de                     diffuser les données publiques brutes, sous des
Washington a été évalué à plus de                            formats réexploitables.
2 600 000 dollars, soit un retour sur                            Son équipe développe une première version
investissement de 5 100 % et un effet de levier              beta du site en trois mois, grâce à l’utilisation
de 52 pour 1.                                                de techniques de développement dites
    Apps for Democracy fait école : les                      « agiles » qui découpent la réalisation du
concours d’applications essaiment au sein des                produit en cycles rapides (de vingt-quatre
grandes métropoles américaines (notamment                    heures à quelques jours).
New York, San Francisco, et Vancouver au                         Cette méthodologie aboutit à un processus
Canada)35. En 2010, la Banque Mondiale elle-                 de développement rapide et itératif, qui assure
même lance son concours (Apps for                            une rapidité de développement et la possibilité
Development), qui reçoit plus d’une centaine                 d’intégrer continuellement les évolutions des
de contributions.                                            besoins qui apparaissent très fréquemment
                                                             dans le cadre de projets de développement
L---M "#!Q!;&*1#0'#7#'4!&*1#04!S!%*!X0($-%#'4!               logiciel : « commencer petit à petit, réfléchir
K+/7/!                                                       vite, faire un premier jet, le construire de façon
   Le candidat Barack Obama avait fait du                    incrémentale, prendre du recul. Trouver un
« Gouvernement ouvert » un des axes de son                   moyen pour avancer »36.
programme. Le 21 janvier 2009, au lendemain                     Le site est mis en ligne le 21 mai 2009, 120
                                                             jours seulement après la signature du
                                                             Mémorandum par le Président avec seulement
et organisés pour soutenir des programmes d’action ciblés,
reste rare en France mais joue un rôle important dans le     47 ensembles de données. Le portail connaît
débat social aux États-Unis.                                 dans les mois suivants une évolution très
33
   EveryBlock.com est désormais une filiale de MSNBC.
http://www.everyblock.com/
34
   Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.
Harvard Business School.
http://www.data.gov/documents/hbs_datagov_case_study.
pdf
35
   Bernard Benhamou. 2010. « Les Concours
                                                             36
d’Applications Mobiles dans le Monde », note de la            Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.
Délégation aux Usages de l’Internet.                         Harvard Business School (voir plus haut).


                                                                                                                        27
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech
Rapport donneespubliques2011 ecole des ponts paristech

Mais conteúdo relacionado

Destaque

La femme-grillagee
La femme-grillageeLa femme-grillagee
La femme-grillageecdt34400
 
Visite des carrières de saint maximin
Visite des carrières de saint maximinVisite des carrières de saint maximin
Visite des carrières de saint maximinCéline Langlet
 
Investigacion comercial
Investigacion comercialInvestigacion comercial
Investigacion comercialmiritaortega
 
Top 100 retailers and Mobile
Top 100 retailers and MobileTop 100 retailers and Mobile
Top 100 retailers and MobilePhilippe Dumont
 
Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...
Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...
Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...Ministère de l'Économie et des Finances
 
Nissan part de marché en europe atteignant 3% pour la 4e fois en 5 mois
Nissan  part de marché en europe atteignant  3% pour la 4e fois en 5 moisNissan  part de marché en europe atteignant  3% pour la 4e fois en 5 mois
Nissan part de marché en europe atteignant 3% pour la 4e fois en 5 moisRésultats Autos
 
I Conferencia UX - Experiencia de Usuario
I Conferencia UX - Experiencia de UsuarioI Conferencia UX - Experiencia de Usuario
I Conferencia UX - Experiencia de UsuarioNeo Consulting
 
House explosion
House explosionHouse explosion
House explosionJonSutz
 
Fonds d’assurance maladie igf rapport 2010 / http://www.igf.finances.gouv.fr...
Fonds d’assurance maladie  igf rapport 2010 / http://www.igf.finances.gouv.fr...Fonds d’assurance maladie  igf rapport 2010 / http://www.igf.finances.gouv.fr...
Fonds d’assurance maladie igf rapport 2010 / http://www.igf.finances.gouv.fr...Ministère de l'Économie et des Finances
 
Ameublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéAmeublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéCA Consumer Finance
 
Tour de l'Ariege 2eme étape 2009
Tour de l'Ariege 2eme étape 2009Tour de l'Ariege 2eme étape 2009
Tour de l'Ariege 2eme étape 2009guest4e08a5c
 
Philosophe au 18e
Philosophe au 18ePhilosophe au 18e
Philosophe au 18e1eres2
 
Dr manzo norbert chu fort de france and ulf nestler giessen . gliolan
Dr manzo norbert chu fort de france and ulf nestler  giessen . gliolanDr manzo norbert chu fort de france and ulf nestler  giessen . gliolan
Dr manzo norbert chu fort de france and ulf nestler giessen . gliolanNorbert Manzo
 
Meningiomes%20 atypiques%20version%20finale[1]
Meningiomes%20 atypiques%20version%20finale[1]Meningiomes%20 atypiques%20version%20finale[1]
Meningiomes%20 atypiques%20version%20finale[1]Norbert Manzo
 
Haya (david y alberto)
Haya (david y alberto)Haya (david y alberto)
Haya (david y alberto)cp blan
 

Destaque (20)

La femme-grillagee
La femme-grillageeLa femme-grillagee
La femme-grillagee
 
Periodismo Ciudadano
Periodismo CiudadanoPeriodismo Ciudadano
Periodismo Ciudadano
 
Visite des carrières de saint maximin
Visite des carrières de saint maximinVisite des carrières de saint maximin
Visite des carrières de saint maximin
 
Investigacion comercial
Investigacion comercialInvestigacion comercial
Investigacion comercial
 
Top 100 retailers and Mobile
Top 100 retailers and MobileTop 100 retailers and Mobile
Top 100 retailers and Mobile
 
Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...
Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...
Guide allegat environnement_dgccrf / http://www.dgccrf.bercy.gouv.fr/document...
 
Gradle_ToulouseJUG
Gradle_ToulouseJUGGradle_ToulouseJUG
Gradle_ToulouseJUG
 
Nissan part de marché en europe atteignant 3% pour la 4e fois en 5 mois
Nissan  part de marché en europe atteignant  3% pour la 4e fois en 5 moisNissan  part de marché en europe atteignant  3% pour la 4e fois en 5 mois
Nissan part de marché en europe atteignant 3% pour la 4e fois en 5 mois
 
Depliant logement etudiant_2011
Depliant logement etudiant_2011Depliant logement etudiant_2011
Depliant logement etudiant_2011
 
Synthese complexite entreprises 2011
Synthese complexite entreprises 2011Synthese complexite entreprises 2011
Synthese complexite entreprises 2011
 
I Conferencia UX - Experiencia de Usuario
I Conferencia UX - Experiencia de UsuarioI Conferencia UX - Experiencia de Usuario
I Conferencia UX - Experiencia de Usuario
 
House explosion
House explosionHouse explosion
House explosion
 
Fonds d’assurance maladie igf rapport 2010 / http://www.igf.finances.gouv.fr...
Fonds d’assurance maladie  igf rapport 2010 / http://www.igf.finances.gouv.fr...Fonds d’assurance maladie  igf rapport 2010 / http://www.igf.finances.gouv.fr...
Fonds d’assurance maladie igf rapport 2010 / http://www.igf.finances.gouv.fr...
 
Ameublement et crédit : analyse du marché
Ameublement et crédit : analyse du marchéAmeublement et crédit : analyse du marché
Ameublement et crédit : analyse du marché
 
Tour de l'Ariege 2eme étape 2009
Tour de l'Ariege 2eme étape 2009Tour de l'Ariege 2eme étape 2009
Tour de l'Ariege 2eme étape 2009
 
Philosophe au 18e
Philosophe au 18ePhilosophe au 18e
Philosophe au 18e
 
Dr manzo norbert chu fort de france and ulf nestler giessen . gliolan
Dr manzo norbert chu fort de france and ulf nestler  giessen . gliolanDr manzo norbert chu fort de france and ulf nestler  giessen . gliolan
Dr manzo norbert chu fort de france and ulf nestler giessen . gliolan
 
Meningiomes%20 atypiques%20version%20finale[1]
Meningiomes%20 atypiques%20version%20finale[1]Meningiomes%20 atypiques%20version%20finale[1]
Meningiomes%20 atypiques%20version%20finale[1]
 
Haya (david y alberto)
Haya (david y alberto)Haya (david y alberto)
Haya (david y alberto)
 
Herramientas web 2.0
Herramientas web 2.0Herramientas web 2.0
Herramientas web 2.0
 

Semelhante a Rapport donneespubliques2011 ecole des ponts paristech

Lancement du NumLab le 23/07/14 à Pau
Lancement du NumLab le 23/07/14 à PauLancement du NumLab le 23/07/14 à Pau
Lancement du NumLab le 23/07/14 à PauNumLab
 
Étude - La dynamique d'internet. Prospective 2030
Étude - La dynamique d'internet. Prospective 2030Étude - La dynamique d'internet. Prospective 2030
Étude - La dynamique d'internet. Prospective 2030FrenchWeb.fr
 
Etude internet 2030-web
Etude internet 2030-webEtude internet 2030-web
Etude internet 2030-webGeoffrey Dorne
 
Lettre semestrielle-16-mars-2017
Lettre semestrielle-16-mars-2017Lettre semestrielle-16-mars-2017
Lettre semestrielle-16-mars-2017Télécom Paris
 
Présentation de la Cantine brestoise 16/11/2012
Présentation de la Cantine brestoise 16/11/2012Présentation de la Cantine brestoise 16/11/2012
Présentation de la Cantine brestoise 16/11/2012AnDaolVras
 
Presentation Opendata de la ville de Nantes
Presentation Opendata de la ville de NantesPresentation Opendata de la ville de Nantes
Presentation Opendata de la ville de NantesliberTIC
 
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...Romain Fonnier
 
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?bluenove
 
Barometre des TIC en région Provence-Alpes-Côte d'Azur
Barometre des TIC en région Provence-Alpes-Côte d'AzurBarometre des TIC en région Provence-Alpes-Côte d'Azur
Barometre des TIC en région Provence-Alpes-Côte d'AzurJezabel Roullee
 
Gouvernance inclusive et alliances inédites
Gouvernance inclusive et alliances inéditesGouvernance inclusive et alliances inédites
Gouvernance inclusive et alliances inéditesDr Sebastien Poulain
 
Guide pratique des donnees publiques v1 beta
Guide pratique des donnees publiques v1 betaGuide pratique des donnees publiques v1 beta
Guide pratique des donnees publiques v1 betaFing
 
Innovation et prospective, des priorités stratégiques pour la cnil
Innovation et prospective, des priorités stratégiques pour la cnilInnovation et prospective, des priorités stratégiques pour la cnil
Innovation et prospective, des priorités stratégiques pour la cnilFreelance
 
Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...La French Tech Rennes St Malo
 
Open data - Nouvelles tendances du web public - La Novela 2012
Open data - Nouvelles tendances du web public - La Novela 2012Open data - Nouvelles tendances du web public - La Novela 2012
Open data - Nouvelles tendances du web public - La Novela 2012Ardesi Midi-Pyrénées
 
Séminaire 01052015-yassineaydi [mode de compatibilité]
Séminaire 01052015-yassineaydi [mode de compatibilité]Séminaire 01052015-yassineaydi [mode de compatibilité]
Séminaire 01052015-yassineaydi [mode de compatibilité]gharbi wajdi
 
L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...
L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...
L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...Jérémie34
 
Discours d'ouverture journée ODMEDNUM
Discours d'ouverture journée ODMEDNUMDiscours d'ouverture journée ODMEDNUM
Discours d'ouverture journée ODMEDNUMArsenic Paca
 
OpenDataGarage-ChristopheCastaner-RégionPACA
OpenDataGarage-ChristopheCastaner-RégionPACAOpenDataGarage-ChristopheCastaner-RégionPACA
OpenDataGarage-ChristopheCastaner-RégionPACAFing
 

Semelhante a Rapport donneespubliques2011 ecole des ponts paristech (20)

Lancement du NumLab le 23/07/14 à Pau
Lancement du NumLab le 23/07/14 à PauLancement du NumLab le 23/07/14 à Pau
Lancement du NumLab le 23/07/14 à Pau
 
Etude internet 2030-web
Etude internet 2030-webEtude internet 2030-web
Etude internet 2030-web
 
Étude - La dynamique d'internet. Prospective 2030
Étude - La dynamique d'internet. Prospective 2030Étude - La dynamique d'internet. Prospective 2030
Étude - La dynamique d'internet. Prospective 2030
 
Etude internet 2030-web
Etude internet 2030-webEtude internet 2030-web
Etude internet 2030-web
 
Etude internet 2030-web
Etude internet 2030-webEtude internet 2030-web
Etude internet 2030-web
 
Lettre semestrielle-16-mars-2017
Lettre semestrielle-16-mars-2017Lettre semestrielle-16-mars-2017
Lettre semestrielle-16-mars-2017
 
Présentation de la Cantine brestoise 16/11/2012
Présentation de la Cantine brestoise 16/11/2012Présentation de la Cantine brestoise 16/11/2012
Présentation de la Cantine brestoise 16/11/2012
 
Presentation Opendata de la ville de Nantes
Presentation Opendata de la ville de NantesPresentation Opendata de la ville de Nantes
Presentation Opendata de la ville de Nantes
 
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
Big data : quels enjeux et opportunités pour l'entreprise - livre blanc - Blu...
 
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
Livre blanc - Open Data : Quels enjeux et opportunités pour l'entreprise ?
 
Barometre des TIC en région Provence-Alpes-Côte d'Azur
Barometre des TIC en région Provence-Alpes-Côte d'AzurBarometre des TIC en région Provence-Alpes-Côte d'Azur
Barometre des TIC en région Provence-Alpes-Côte d'Azur
 
Gouvernance inclusive et alliances inédites
Gouvernance inclusive et alliances inéditesGouvernance inclusive et alliances inédites
Gouvernance inclusive et alliances inédites
 
Guide pratique des donnees publiques v1 beta
Guide pratique des donnees publiques v1 betaGuide pratique des donnees publiques v1 beta
Guide pratique des donnees publiques v1 beta
 
Innovation et prospective, des priorités stratégiques pour la cnil
Innovation et prospective, des priorités stratégiques pour la cnilInnovation et prospective, des priorités stratégiques pour la cnil
Innovation et prospective, des priorités stratégiques pour la cnil
 
Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...Afterwork de la recherche : structuration de la recherche sur les usages et l...
Afterwork de la recherche : structuration de la recherche sur les usages et l...
 
Open data - Nouvelles tendances du web public - La Novela 2012
Open data - Nouvelles tendances du web public - La Novela 2012Open data - Nouvelles tendances du web public - La Novela 2012
Open data - Nouvelles tendances du web public - La Novela 2012
 
Séminaire 01052015-yassineaydi [mode de compatibilité]
Séminaire 01052015-yassineaydi [mode de compatibilité]Séminaire 01052015-yassineaydi [mode de compatibilité]
Séminaire 01052015-yassineaydi [mode de compatibilité]
 
L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...
L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...
L’open data le cas de Montpellier - De la mise en ligne à la réutilisation en...
 
Discours d'ouverture journée ODMEDNUM
Discours d'ouverture journée ODMEDNUMDiscours d'ouverture journée ODMEDNUM
Discours d'ouverture journée ODMEDNUM
 
OpenDataGarage-ChristopheCastaner-RégionPACA
OpenDataGarage-ChristopheCastaner-RégionPACAOpenDataGarage-ChristopheCastaner-RégionPACA
OpenDataGarage-ChristopheCastaner-RégionPACA
 

Mais de Ministère de l'Économie et des Finances

Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...Ministère de l'Économie et des Finances
 
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...Ministère de l'Économie et des Finances
 

Mais de Ministère de l'Économie et des Finances (20)

Au-delà du PIB, un tableau de bord pour la France - France Stratégie
Au-delà du PIB, un tableau de bord pour la France - France StratégieAu-delà du PIB, un tableau de bord pour la France - France Stratégie
Au-delà du PIB, un tableau de bord pour la France - France Stratégie
 
Public intangible assets : Issues of attractiveness
Public intangible assets : Issues of attractivenessPublic intangible assets : Issues of attractiveness
Public intangible assets : Issues of attractiveness
 
Le gouvernement soutient les communes rurales
Le gouvernement soutient les communes ruralesLe gouvernement soutient les communes rurales
Le gouvernement soutient les communes rurales
 
focus sur les mesures prises par le gouvernement pour les ruralités
focus sur les mesures prises par le gouvernement pour les ruralitésfocus sur les mesures prises par le gouvernement pour les ruralités
focus sur les mesures prises par le gouvernement pour les ruralités
 
Le Gouvernement (re)valorise les fonctionnaires
Le Gouvernement (re)valorise les fonctionnairesLe Gouvernement (re)valorise les fonctionnaires
Le Gouvernement (re)valorise les fonctionnaires
 
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
 
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
 
Elections departementales : Que fait le département ?
Elections departementales : Que fait le département ?Elections departementales : Que fait le département ?
Elections departementales : Que fait le département ?
 
Désintox redevance mouillage
Désintox redevance mouillageDésintox redevance mouillage
Désintox redevance mouillage
 
Projet de loi NOTRe
Projet de loi NOTReProjet de loi NOTRe
Projet de loi NOTRe
 
Projet de-loi-nouvelle-organisation-territoriale-république
Projet de-loi-nouvelle-organisation-territoriale-républiqueProjet de-loi-nouvelle-organisation-territoriale-république
Projet de-loi-nouvelle-organisation-territoriale-république
 
Un train de réformes
Un train de réformesUn train de réformes
Un train de réformes
 
La réforme territoriale en 4 C
La réforme territoriale en 4 CLa réforme territoriale en 4 C
La réforme territoriale en 4 C
 
Le projet de loi #NOTRe, c'est...
Le projet de loi #NOTRe, c'est...Le projet de loi #NOTRe, c'est...
Le projet de loi #NOTRe, c'est...
 
Infographie le "fait maison" dans la restauration
Infographie le "fait maison" dans la restaurationInfographie le "fait maison" dans la restauration
Infographie le "fait maison" dans la restauration
 
Mesurer la qualité de vie (Insee)
Mesurer la qualité de vie (Insee)Mesurer la qualité de vie (Insee)
Mesurer la qualité de vie (Insee)
 
L'ESS en Rhône-Alpes (INSEE)
L'ESS en Rhône-Alpes (INSEE)L'ESS en Rhône-Alpes (INSEE)
L'ESS en Rhône-Alpes (INSEE)
 
Livre blanc BercyCamp 2013 sur les RSP
Livre blanc BercyCamp 2013 sur les RSPLivre blanc BercyCamp 2013 sur les RSP
Livre blanc BercyCamp 2013 sur les RSP
 
Calendrier campagne ir 2012
Calendrier campagne ir 2012Calendrier campagne ir 2012
Calendrier campagne ir 2012
 
Dossier dinformation dgfip
Dossier dinformation dgfipDossier dinformation dgfip
Dossier dinformation dgfip
 

Rapport donneespubliques2011 ecole des ponts paristech

  • 1. Romain Lacombe Ecole des Ponts ParisTech Pierre-Henri Bertin François Vauglin Rapport remis le 13 juillet 2011 au Ministre de l’Industrie, Alice Vieillefosse de l’Énergie et de l’Économie numérique Pour  une  politique   ambitieuse  des données  publiques Juillet Les données publiques 2011 au service de l’innovation et de la transparence
  • 2. École des Ponts ParisTech. 2011. Pour une politique ambitieuse des données publiques : Les données publiques au service de l’innovation et de la transparence. Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie, de l’Energie et de l’Economie numérique le 13 juillet 2011.
  • 3. ! ! ! ! "#$%&!'&(!)$*+(!),-.(/&#0! ! 1,22$-+!3!%,!45%56,+.$*!,78!9(,6&(!'&!%:;*+&-*&+!! ',*(!%&!#,'-&!'7!2$-+,.%!)-$8.<,!=$>.%&!! '&!(&-?.#&(!,78!#.+$@&*(!(7-!+&-<.*,78!<$>.%&(! ! 1&<.(!,7!=.*.(+-&!'&!%:;*'7(+-.&A!'&!%:"*&-6.&!! &+!'&!%:"#$*$<.&!*7<5-.B7&!! %&!CD!E7.%%&+!FGCC! ! ! )$7-!7*&!2$%.+.B7&!,<>.+.&7(&!'&(! '$**5&(!27>%.B7&(! ! "#$!%&''(#$!)*+,-.*#$!/*!$#01-2#! %#!,3-''&1/4-&'!#4!%#!,/!40/'$)/0#'2#! ! ! ! ! ! ! ! ! ! ! ! ! ! H7.%%&+!FGCC!
  • 4. École des Ponts ParisTech. 2011. Pour une politique ambitieuse des données publiques : Les données publiques au service de l’innovation et de la transparence. Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie, de l’Energie et de l’Economie numérique le 13 juillet 2011. Vous pouvez contacter les auteurs de ce rapport sur http://rapport-opendata-2011.fr
  • 5. 5!)0&)&$!%#!2#!0/))&04! L’ouverture et la réutilisation des données Deux personnalités académiques expertes publiques sont des enjeux majeurs de l’action de l’économie numérique et de ses nouveaux publique à l’ère numérique. À la croisée des modes de gouvernance, MM. Pierre-Jean usages innovants d’Internet et des modes de Benghozi et Laurent Gille, ont accepté gouvernance collaborative les plus récents, ils d’encadrer le travail de ce groupe. ouvrent le champ à des domaines nouveaux de M. Benghozi est Directeur de recherche l’action de l’État. CNRS, Directeur du Pôle de Recherche en Ce rapport présente une étude sur la Économie et Gestion et professeur d’économie réutilisation des données publiques, menée à l’École Polytechnique (titulaire de la Chaire pour la Délégation aux usages de l’Internet du Orange Innovation et Régulation des Services Ministère de l’Enseignement supérieur et de la Numériques), et responsable du pôle Recherche dans le cadre du Master d’Action Innovation du Master Innovation et Régulation Publique de l’École des Ponts ParisTech. de l’Économie Numérique de Télécom ParisTech. M. Laurent Gille, enseignant- Il met en perspective la problématique et chercheur au Département de Sciences les enjeux de l’Open Data, propose un état des économiques et sociales de Télécom lieux de la réutilisation des données publiques ParisTech, est responsable du parcours en France, et dessine trois scénarios prospectifs Industries de Réseaux du Master Innovation et pour l’évolution future de ce mouvement. Elle Régulation de l’Économie Numérique. présente seize propositions pour une politique nationale ambitieuse d’ouverture et de Les conclusions de l’étude ont été rédigées réutilisation des données publiques. de novembre à janvier 2011, et présentées au public le 20 janvier 2011 au Ministère de la Quatre élèves de l’École des Ponts Recherche et de l’Enseignement supérieur. ParisTech, Pierre-Henri Bertin, Romain Lacombe, François Vauglin et Alice Ce rapport a été finalisé par Romain Vieillefosse ont mené cette analyse de Lacombe entre mars et début mai 2011. Il ne septembre 2010 à janvier 2011, en rencontrant fait qu’évoquer les développements les plus les acteurs clés de la réutilisation des données récents, et présente une synthèse des publiques, en prenant part à des colloques évolutions qui ont eu lieu au printemps 2011 internationaux, et en s’appuyant sur la en France, notamment au niveau national. bibliographie existante. Les recommandations et propositions exprimées ne reflètent que les conclusions de l’analyse menée par les membres du groupe d’étude, et n’engagent en aucune manière leurs institutions, employeurs ou corps respectifs. Toutes les erreurs ou omissions qui subsisteraient dans ce document ne sont le fait que de ses auteurs. 1
  • 6.
  • 7. 6#7#02-#7#'4$! Nous tenons, très modestement, à chercheur en sciences économiques et sociales témoigner toute notre gratitude envers à Télécom ParisTech. Leurs conseils pertinents Monsieur le Ministre de l’Industrie, de et le temps qu’ils nous ont consacré, tout au l’Energie et de l’Economie numérique, pour long de notre étude, nous ont été très précieux. avoir bien voulu nous faire l’honneur de Nous souhaitons également remercier recevoir ce rapport sur l’ouverture et la l’équipe du Mastère d’Action Publique de réutilisation des données publiques, ainsi qu’à l’École des Ponts ParisTech pour l’opportunité remercier Séverin Naudet, Directeur de la qu’elle nous a accordée : le directeur mission Etalab auprès du Premier ministre, Dominique Schwartz, le directeur adjoint pour avoir accepté d’en présenter la synthèse, Vincent Spenlehauer et la secrétaire Sylvie le 13 juillet 2011, à l’occasion du lancement du Berte. concours européen « Open Data Proxima Mobile ». Nos remerciements s’adressent enfin à l’ensemble des interlocuteurs qui nous ont Nous remercions M. Bernard Benhamou, reçus ou nous ont fait part de leurs réflexions Délégué aux Usages de l’Internet, pour sa sur le sujet des données publiques, ainsi qu’à disponibilité, la confiance qu’il nous a toutes celles qui ont répondu à nos nombreuses témoignée, et ses conseils avisés et constructifs questions. lors de la rédaction de ce rapport. Nous tenons aussi à remercier pour leur aide l’ensemble des Merci de nous avoir donné la chance de équipes de la Délégation. contribuer, modestement, à la réflexion sur un sujet fondamental pour le futur de l’économie Nous remercions également M. Pierre-Jean numérique et l’avenir de notre démocratie. Benghozi, Directeur de recherche au CNRS et professeur d’économie à l’École Polytechnique, et M. Laurent Gille, enseignant 3
  • 8.
  • 9. 6($*7(!! Les évolutions technologiques récentes ont placé le sujet de la réutilisation des données au cœur de l’action publique. L’administration collecte et produit un champ très vaste de données, depuis les budgets des institutions publiques jusqu’aux mesures de la qualité de l’air que nous respirons, en passant par des statistiques précises sur notre économie, notre société et nos territoires. Ouvrir l’accès le plus large aux informations publiques, c’est tout d’abord améliorer la transparence de l’État et de ses institutions, éclairer le débat démocratique, et rapprocher la puissance publique des citoyens. Favoriser l’ouverture et la réutilisation de ces données (« l’Open Data »), c’est permettre à la communauté des développeurs et des entrepreneurs d’inventer de nouveaux usages et de nouvelles applications utiles aux citoyens. C’est donc encourager l’innovation, donner naissance à la société de l’information, et contribuer au développement des secteurs stratégiques d’avenir pour notre pays, de l’économie numérique au développement durable. L’État doit s’approprier pleinement cette opportunité majeure. Il lui faut prendre le virage de cette nouvelle dimension des politiques publiques, pour la mettre au service de l’ensemble des acteurs du pays. Mots-clés : Open Data, données publiques, information publique, accès aux documents administratifs, politique publique, gouvernance ouverte, transparence, démocratie, politique industrielle, politique des technologies, innovation, recherche, entreprenariat, compétitivité, croissance, emploi, économie numérique, Web sémantique, Internet. 8+$40/24! Recent evolutions of technology have placed public data at the central focus of public policy. Government collects and produces a vast array of data, from the budgets of our institutions to the quality of the air we breathe, through precise statistics on our economy, our society or our territories. Opening public sector information means improving the transparency of our Government and its institutions, enlightening the democratic debate, and strengthening the bond between the nation and its representatives. Encouraging reuse of this data (« Open Data ») allows the community of Web developers and Internet entrepreneurs to invent new, useful applications for citizens. It is an important public policy lever in favour of innovation, which can ignite the information society and contribute to the development of strategic sectors of the economy, from sustainable development to the growth of the digital economy. Government must fully embrace this major opportunity and this new dimension of public policy, and put its power to work at the service of the nation’s every constituent. Keywords : Open Data, public data, public sector information, freedom of information, public policy, Open Government, transparency, democracy, industrial policy, technology policy, innovation, R&D, entrepreneurship, competitiveness, growth, jobs creation, digital economy, semantic Web, Internet. 5
  • 10.
  • 11. 15(7<5!,*,%@+.B7&! Les évolutions technologiques récentes ont Une évolution du cadre législatif : placé le sujet de la réutilisation des données au l’Union Européenne a adopté deux directives cœur de l’action publique. en la matière, la directive « Informations du secteur public » (PSI) en 2003 et la directive L’administration collecte et produit un INSPIRE en 2008. Une consultation publique champ très vaste de données, depuis les récente sur la directive PSI a notamment porté budgets des institutions publiques jusqu’aux sur l’opportunité de réviser son champ mesures de la qualité de l’air que nous d'application, les redevances et licences respirons, en passant par des statistiques relatives aux données, ainsi que les formats précises sur notre économie, notre société et électroniques utilisés. nos territoires. L’émergence de la notion politique de Ouvrir l’accès le plus large aux « Gouvernement Ouvert » : les politiques de informations publiques, c’est tout d’abord diffusion des données publiques ont fortement améliorer la transparence de l’État et de ses évolué dans les pays anglo-saxons du fait de institutions, éclairer le débat démocratique, et l’émergence de la notion d’Open Government, rapprocher la puissance publique des citoyens. thème de campagne du Président Barack Favoriser l’ouverture et la réutilisation de Obama. Les États-Unis et la Grande Bretagne ces données (« l’Open Data »), c’est permettre ont créé des portails de données publiques à la communauté des développeurs et des réutilisables, data.gov et data.gov.uk. En entrepreneurs d’inventer de nouveaux usages. France, la mission Etalab vient d’être créée, C’est donc encourager l’innovation, et sous l’autorité du Premier ministre François contribuer au développement des secteurs Fillon, pour coordonner les administrations en stratégiques d’avenir, de l’économie matière de données publiques et mettre en numérique au développement durable. place la future plateforme data.gouv.fr. L’État doit s’approprier pleinement cette Des initiatives citoyennes en faveur de opportunité majeure. Il lui faut prendre le l’Open Data : une série d’initiatives récentes, virage de cette nouvelle dimension des issues de la société civile et des communautés politiques publiques, pour la mettre au service de développeurs, s’efforcent de promouvoir les de l’ensemble des acteurs du pays. concepts de l’Open Data, avec le soutien d’associations et de fondations comme la 9'#!)0&+,(7/4-.*#!/*!20&-$#7#'4!%#$! Sunlight Foundation aux États Unis, l’Open (1&,*4-&'$!4#2:'&,&;-.*#$<!)&,-4-.*#$!#4! Knowledge Foundation (OKFN) en Grande (2&'&7-.*#$!0(2#'4#$=! Bretagne, et la FING, LiberTIC et Regards L’ouverture et la réutilisation des données Citoyens en France. publiques constituent désormais une attente La double rupture du Web 2.0 et des évidente de la société civile. Cette technologies mobiles : les innovations de problématique a émergé récemment au service rendues possibles par les technologies croisement de plusieurs évolutions profondes. 2.0 (interfaces dynamiques, cartographie en Une prise de conscience de la valeur ligne, ouverture des API) ont amené à la économique de la réutilisation des données : généralisation du remix et du phénomène des chaque année dans l'Union Européenne, la mashups de données. La nouvelle génération réutilisation de données issues du secteur d’applications géolocalisées sur smartphones public générerait un chiffre d'affaires de plus repose pour une part importante sur des de 27 milliards d'euros. Pour Neelie Kroes, données géographiques. Ces ruptures vice-présidente de la Commission européenne technologiques ont révélé le besoin croissant chargée de la stratégie numérique, « une de pouvoir réutiliser des données publiques. grande partie de ces informations, en Europe, Toutes ces évolutions récentes confèrent sont sous-exploitées. Nous devons examiner une actualité nouvelle à la problématique de la l'opportunité de modifier les règles de l'Union réutilisation des données publiques. en matière de réutilisation, pour libérer pleinement leur potentiel économique ». 7
  • 12. 9'#!&))&04*'-4(!7/>#*0#!)&*0!,3?4/4!#4! 9'#!7-$#!#'!@*10#!2&7),#A#!.*-!)&*00/-4!B40#! ,3/%7-'-$40/4-&'! $-7),-C-(#! L’ouverture des données publiques permet Le cadre juridique est établi pour la à des entrepreneurs, des chercheurs, des majorité des données publiques, mais les types développeurs d’accéder aux données collectées de licences et de contrats se multiplient. Le dans le cadre du fonctionnement des statut des données issues d’organismes administrations. parapublics reste à préciser. L’interopérabilité technique et juridique est cruciale : il convient En les réutilisant, ils inventent de nouveaux de clarifier les formats et les licences usages et peuvent créer de nouvelles acceptables dans une optique d’encouragement applications utiles aux citoyens. Cette à l’ouverture et à la réutilisation. coproduction de services au public peut constituer la base d’une nouvelle relation La gratuité pour la réutilisation des numérique de l’administration à l’usager, et données à titre commercial favorise d’un fonctionnement plus efficace de la l’innovation et les nouveaux usages. Nous puissance publique. préconisons donc de la généraliser le plus possible, et d’éviter à tout prix la L’ouverture des données publiques est de multiplication et le maintien de redevances plus un outil puissant d’amélioration de la excessives, qui pourrait conduire à des transparence de l’État. En donnant à tous les incohérences et freiner la réutilisation. citoyens qui le souhaitent accès aux détails du fonctionnement des institutions publiques, D#$!0-$.*#$!$*07&'4/+,#$! cette ouverture nourrit et éclaire le débat démocratique. Elle peut contribuer à fonder les Esquissées dans la loi 1978 sur l’accès aux choix politiques sur des analyses éclairées et documents administratifs, consacrées par deux ancrées dans le réel. directives européennes, l’ouverture et la réutilisation des données publiques s’inscrivent Enfin, un accès plus large aux données dans une évolution durable de nos sociétés. publiques peut contribuer à renforcer la confiance des consommateurs, et donc la Elles induisent une transformation de la stabilité de notre économie. culture et du mode de fonctionnement des administrations. Des freins au changement 9'!&*4-,!$40/4(;-.*#!)&*0!'&40#!(2&'&7-#! subsistent, et des risques peuvent émerger. Rien n’indique cependant qu’ils ne puissent Des conditions de réutilisation plus libres être surmontés, surtout si l’État s’engage dans encourageraient l’innovation et pourraient une collaboration rapprochée avec la contribuer au développement de l’économie communauté des réutilisateurs. numérique : les nouveaux services et applications mobiles, qui en bénéficieraient E0&-$!/A#$!$40/4(;-.*#$!)&*0!C/1&0-$#0!,/! particulièrement, connaissent actuellement une 0(*4-,-$/4-&'!%#$!%&''(#$!)*+,-.*#$! très forte croissance. L’économie numérique est un facteur clé de croissance économique et Nous proposons les trois axes stratégiques de création d’emplois en France. suivants pour favoriser la réutilisation des données publiques et permettre à la société L’accès aux données publiques offre de d’en retirer l’ensemble des bénéfices attendus. plus les prémisses d’une « infrastructure informationnelle », qui pourrait faciliter le Simplifier pour accélérer : réduire les développement durable en permettant aux efforts nécessaires d’une part à la diffusion des consommateurs de faire des choix mieux données par les acteurs publics, et d’autre part informés. à leur réutilisation, afin d’accélérer le développement de services utiles à partir des Enfin, la réutilisation des données données publiques. publiques constitue un élément de soutien aux objectifs stratégiques d’investissement Faciliter l’expérimentation : adapter les d’avenir pour l’économie française, de la conditions de réutilisation des données société numérique aux villes de demain, aux publiques pour faciliter l’expérimentation par transports intelligents, en passant par les citoyens, les associations et la communauté l’encouragement à la recherche scientifique et des développeurs et des entrepreneurs. à l’innovation. Favoriser l’émergence d’un écosystème : favoriser l’émergence d’un écosystème de producteurs et de réutilisateurs de données publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr. 8
  • 13. F#-G#!)0&)&$-4-&'$!)&*0!*'#!)&,-4-.*#!'/4-&'/,#! 6. Impliquer des acteurs publics pilotes dans /7+-4-#*$#!%#$!%&''(#$!)*+,-.*#$! les projets de recherche sur le Web Ce rapport formule seize propositions, sémantique. articulées selon les trois axes stratégiques précédents. Elles sont présentées de manière détaillée au chapitre 8, et visent à proposer une 7. Rendre la réutilisation des données feuille de route claire pour mettre en place une gratuite pour toute réutilisation à titre politique ambitieuse des données publiques. personnel. 8. Encadrer strictement les cas dans lesquels 1. Formaliser les bonnes pratiques de une redevance est légitime, et charger les diffusion des données publiques attendues producteurs de données d’établir l’absolue par la communauté des réutilisateurs : nécessité de toute tarification : • Expliciter l’effort minimal attendu des • Dépasser une valorisation purement différents acteurs publics. commerciale des données publiques et • Assurer la formation des agents et leur encourager leur réutilisation la plus accès à des guides clairs et explicatifs. large. • Simplifier les formats de diffusion. • Généraliser la réutilisation libre et gratuite la plus large possible. 2. Mettre en cohérence les conditions légales • Restreindre la tarification à coûts de réutilisation des données issues de moyens aux marchés matures. sources différentes : • Établir une « licence données ouvertes » 9. Conditionner toute redevance pour pour réutilisation gratuite qui réutilisation de données à valeur ajoutée à la s’appliquerait le plus largement possible. mise à disposition gratuite des données • Encourager un marquage graphique des brutes qui les sous-tendent. droits de réutilisation. 10. Explorer des conditions alternatives de 3. Encourager l’utilisation de formats réutilisation pour laisser carte blanche à facilement réexploitables, qui respectent les l’expérimentation : normes d’interopérabilité et de « lisibilité • Privilégier les partenariats avec les machine » : nouveaux acteurs de l’innovation. • Privilégier les formats ouverts respectant • Explorer les licences gratuites avec les normes d’interopérabilité. partage des conditions initiales à • Communiquer auprès des agents sur l’identique (share alike). l’importance des formats réexploitables. • Explorer la rémunération par l’accès aux • Maintenir une liste de formats données d’usage. correspondants à ces critères. • Explorer la rémunération par le service client. 4. Faire en sorte que chaque contrat public • Faciliter l’expérimentation avec les Web clarifie à l’avenir le financement de Services. l’ouverture et les droits de réutilisation liés aux données produites dans son cadre : 11. Impliquer la communauté des • Clarifier le financement de l'ouverture et réutilisateurs dans les initiatives de mise à les droits de réutilisation de données disposition de données publiques : dans les contrats publics. • Créer un point d’accès unique centralisé • Établir des bonnes pratiques et des et mis à jour automatiquement. clauses types. • Développer une offre grand public qui • Élargir le périmètre des données mette en valeur des applications utiles. réutilisables aux ressources essentielles. • Investir dans l’accompagnement de la communauté. 5. Faciliter l’enrichissement des données et • Démultiplier le service aux utilisateurs. l’intégration de corrections éventuelles par • Organiser des séminaires ou ateliers de la communauté : travail ponctuels sur les sujets • Faciliter l’intégration des métadonnées. techniques d’intérêt pour la • Permettre l’enrichissement collectif des communauté. jeux de données. 9
  • 14. 12. Mettre en place des assises des données • Illustrer la réutilisation des données publiques et animer la communauté des publiques par le développement de réutilisateurs : services aux citoyens. • Regrouper l’ensemble de l’écosystème • Faire des données et de leur réutilisation pour des assises des données publiques. un outil d’éclairage du débat public. • Animer la communauté des 15. Développer une stratégie nationale à réutilisateurs. partir du rôle de coordination des 13. Encourager le développement institutions publiques de la mission Etalab : d’applications à partir des données • Mutualiser des solutions de mise en publiques : ligne pour les administrations et les • Organiser un concours national de collectivités. développement d’applications. • Développer une stratégie nationale pour • Prendre en compte la réutilisation des les données publiques. données publiques dans les appels à projets de R&D numérique. 16. Élargir le champ de l’Open Data : • Pérenniser l’offre d’applications créées à • Élargir le champ de la libre réutilisation partir des données publiques. des données publiques. • Explorer l’application de l’Open Data 14. Intégrer au débat démocratique les aux entreprises privées. données publiques et leur réutilisation : • Développer une stratégie européenne et • Communiquer aux administrations internationale. l’importance des données pour mettre en lumière leurs métiers. 10
  • 15. /,>%&!'&(!<,+.I-&(! Résumé analytique__________________________________________________________________ 7 Table des matières _________________________________________________________________ 11 Introduction ______________________________________________________________________ 13 Partie 1. « Open Data » : Contexte et enjeux d’une question sociétale ________________________ 17 Chapitre I. Données publiques : émergence d’une question sociétale __________________________ 19 1. La donnée au cœur des nouveaux usages ___________________________________________ 19 2. Les données publiques et leur réutilisation __________________________________________ 21 Chapitre II. La libre réutilisation des données publiques à l’international ______________________ 25 1. Le mouvement Open Data _______________________________________________________ 25 2. États-Unis : initiatives locales, puis démarche fédérale_________________________________ 26 3. Grande Bretagne : une impulsion transpartisane du gouvernement________________________ 28 4. Situations contrastées en Europe __________________________________________________ 30 Chapitre III. Les enjeux de la réutilisation des données publiques ____________________________ 33 1. Démocratie, transparence et débat public ___________________________________________ 33 2. Modernisation de l’État _________________________________________________________ 34 3. Innovation et soutien à l’économie numérique _______________________________________ 35 4. Des données stratégiques pour l’économie __________________________________________ 38 5. Un nouveau mode d’action publique _______________________________________________ 42 Partie 2. État des lieux de la réutilisation des données publiques en France _____________________ 47 Chapitre IV. Le cadre de la réutilisation des données publiques en France _____________________ 49 1. Le cadre juridique pose en principe la liberté de réutilisation ____________________________ 49 2. Les acteurs de la réutilisation de données publiques ___________________________________ 53 11
  • 16. Chapitre V. Premières expériences d’ouverture des données publiques en France ________________ 57 1. La réutilisation des données dans les collectivités territoriales ___________________________ 57 2. L’ouverture des données au niveau national : trois études de cas _________________________ 62 3. La mise en place d’une politique nationale des données publiques________________________ 65 Partie 3. Comment favoriser la réutilisation des données publiques ?__________________________ 69 Chapitre VI. Abaisser les barrières à la réutilisation _______________________________________ 71 1. Répondre aux contraintes techniques ______________________________________________ 71 2. Gérer la complexité juridique ____________________________________________________ 72 3. Anticiper l’impact organisationnel ________________________________________________ 74 4. Établir des modèles économiques propices à l’innovation ______________________________ 75 Chapitre VII. Prospective : Trois scénarios pour l’avenir ___________________________________ 83 1. « Inertie » : Développement de l’offre de données publiques à son rythme historique _________ 83 2. « Capture » : Des monopoles informationnels se substituent à la puissance publique _________ 85 3. « Symbiose » : Catalyser le développement d’un écosystème____________________________ 87 Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques ___________ 91 1. Simplifier pour accélérer ________________________________________________________ 91 2. Faciliter l’expérimentation pour encourager l’innovation _______________________________ 94 3. Soutenir l’émergence d’un écosystème _____________________________________________ 96 Bibliographie ____________________________________________________________________ 101 Textes règlementaires _____________________________________________________________ 105 Interlocuteurs____________________________________________________________________ 107 Liens et références ________________________________________________________________ 109 12
  • 17. ;*+-$'7#+.$*! « Si l’on partage des données sur le Web, des données publiques, des données scientifiques, des données citoyennes, quelles qu’elles soient, d’autres que nous sauront en tirer des créations merveilleuses que nous n’aurions jamais imaginées. » Tim Berners-Lee, Inventeur du Web Hal Varian, Économiste en Chef chez inventer de nouveaux usages. Tous types Google, le précise : « Je répète sans cesse que d’objets numériques sont concernés : des la profession sexy dans les dix prochaines tableaux chiffrés, des mesures numériques, des années, ce sera statisticien. Et ce n’est pas de bases de données, des cartes ou encore des l’humour.1 » jeux de données géolocalisées. On peut émettre des réserves quant au Les applications en question vont des pouvoir de séduction d’un tableur services les plus simples aux plus complexes, informatique ; il reste que l’attrait de la science de l’expérimentation au produit professionnel : des données s’est considérablement accru ces des étudiants développent une application dernières années. Ses algorithmes ont gagné en mobile, des citoyens quantifient l’action de puissance et ses applications jouent un rôle leurs députés, des journalistes créent de central dans la société de l’information. nouvelles infographies plus instructives, une entreprise calcule des itinéraires de transports À mesure que nos outils informatiques publics au service des internautes. deviennent plus mobiles, leurs applications gagnent en importance dans nos vies Les développements technologiques quotidiennes. En recoupant des données récents ont largement accéléré le numériques diverses, en les adaptant à notre développement de ce phénomène, et les usage à travers une ergonomie simple, les attentes d’une partie du public sont aujourd’hui smartphones et les tablettes tactiles simplifient très fortes. bon nombre des tâches de la vie quotidienne et professionnelle. 9'#!)0&+,(7/4-.*#!'&*1#,,#!#4!2&7),#A#!)&*0! ,#!$#24#*0!)*+,-2! "/!0(*4-,-$/4-&'!%#$!%&''(#$!)*+,-.*#$! La réutilisation des données publiques offre Un mouvement de réutilisation des données des possibilités nouvelles à la sphère publique. publiques2 a vu le jour depuis plusieurs années. Elle appelle une évolution de la culture et du Concrètement, il s’agit pour des développeurs mode de fonctionnement des administrations. informatiques ou tout autre citoyen d’accéder à Elle soulève surtout de nombreuses questions. des données produites initialement dans le Quelles opportunités ? Quels risques ? cadre du fonctionnement de l’État, et de leur Quelles pistes pour en faire profiter au mieux la société ? Quels enseignements tirer de 1 l’expérience d’autres pays en la matière ? Steve Lohr. 5 août 2009. « For Today’s Graduate, One Quel(s) public(s) cette politique vise-t-elle, Word: Statistics ». The New York Times. http://www.nytimes.com/2009/08/06/technology/06stats.ht avec quels objectifs et quels moyens ? Quelles ml limites et quelles garanties donner au droit à la 2 À l’exclusion bien sûr des données personnelles et des réutilisation ? données confidentielles (loi de 1978 sur la liberté d’accés aux documents administratifs, modifiée par Ordonnance n°2005-650 du 6 juin 2005). 13
  • 18. 9'#!&))&04*'-4(!-7)&04/'4#!)&*0!,#! 2011 dans le monde, et un historique des %(1#,&))#7#'4!%*!'*7(0-.*#! évolutions récentes dans les pays occidentaux Grâce aux réseaux mobiles à haut débit, la (chapitre 2). connectivité devient ubiquitaire. Les nouvelles Nous nous attachons ensuite à cerner les plateformes mobiles permettent désormais bénéfices que l’on peut attendre d’une d’accéder en direct à des services ou des politique de soutien à la réutilisation des informations dans le contexte dans lequel données publiques. Nous évoquons les enjeux ceux-ci sont le plus utiles. Ces évolutions ont liés à la participation démocratique et à donné naissance à une industrie nouvelle et en l’efficacité de l’action publique. Nous forte croissance, celle des applications explicitons les différents mécanismes à travers mobiles. lesquels la donnée publique peut contribuer au Des acteurs internationaux du Web ont su développement économique (chapitre 3). prendre des positions fortes sur ce marché. La France possède des atouts pour réussir dans ce "/!0(*4-,-$/4-&'!%#$!%&''(#$!)*+,-.*#$!#'! I0/'2#! secteur. Faciliter l’accès aux données publiques en vue d’une réutilisation Une deuxième partie fait ensuite le point commerciale pourrait favoriser la création sur la réutilisation des données publiques en d’activités économiques novatrices. France aujourd’hui (chapitre 4). 9'!%(+/4!)/$$-&''(! Le chapitre suivant vise à fournir aux agents publics des pistes et références à partir Opportunité de développement économique desquelles construire leur réflexion. Nous et avancée en matière de transparence d’une cherchons en particulier à comprendre le part, érosion potentielle de la capacité d’action contexte de cette politique, son cadre juridique de l’État et de ses ressources propres de et technique, et les acteurs qu’elle met en jeu l’autre : la tarification de la réutilisation des (chapitre 5). données publiques est l’objet d’âpres débats, quand elle ne donne pas lieu à des contentieux. H&77#'4!C/1&0-$#0!,/!0(*4-,-$/4-&'!%#$! %&''(#$!)*+,-.*#$!J! L’ouverture des données elle-même peut faire peur, quand ce n’est pas Le mouvement de réutilisation de données l’incompréhension quant à l’intérêt d’un droit étant durablement amorcé, il convient de à la réutilisation de données qui interpelle. s’interroger sur les difficultés auxquelles il risque de se heurter dans l’administration, les 9'!7&*1#7#'4!#';/;(!$*0!,#!,&';!4#07#! établissements publics et les collectivités : difficultés d’ordre juridique, organisationnel, La mise à disposition des données technique et financier. Nous abordons la publiques pour leur réutilisation n’est pourtant question de la tarification optimale, et des pas un effet de mode : il s’agit d’un droit modèles économiques qui doivent s’appliquent opposable consacré par la loi, basé sur une aux données publiques (chapitre 6). Directive de 2003 que la Commission Européenne envisage d’étendre et de renforcer. À partir des dynamiques en présence, nous avons imaginé trois scénarios futurs pour la Cette évolution engagée confronte chaque réutilisation des données publiques : l’Inertie, administration centrale, chaque collectivité la Capture et la Symbiose. Nous détaillons les locale, chaque établissement public à des caractéristiques et les implications de chacun questions difficiles. Qu’attend-on d’eux de ces futurs possibles (chapitre 7). exactement, et comment bien faire ? H&'2,*$-&'$!#4!0#2&77/'%/4-&'$! H&'4#A4#!#4!#'>#*A!%3*'!$*>#4!%#!$&2-(4(!! Le scénario de la Symbiose et du Le premier chapitre s’attelle à esquisser un développement d’un écosystème présente de portrait synthétique des grandes évolutions qui loin le plus d’avantages : travailler à ont amené la question des données publiques à l’ouverture des données publiques en devenir, en l’espace de quelques années, un collaboration avec la communauté de ceux qui véritable sujet de société. Nous passons les réutilisent est une nécessité pragmatique notamment en revue les évolutions plus qu’un choix idéologique. technologiques récentes qui l’ont portée sur le devant de la scène (chapitre 1). Pour que la société puisse tirer l’ensemble des bénéfices potentiels de la réutilisation des Le second chapitre dresse un état des lieux données publiques, il convient cependant de la réutilisation des données publiques en 14
  • 19. d’encourager son développement au rythme le développement de services utiles à partir des plus rapide. données publiques. Nous proposons enfin (chapitre 8) seize Faciliter l’expérimentation : adapter les propositions groupées en trois axes conditions de réutilisation des données stratégiques, visant à établir une feuille de publiques pour faciliter l’expérimentation par route claire vers une politique ambitieuse des les citoyens, les associations et la communauté données publiques. des développeurs et des entrepreneurs. Simplifier pour accélérer : réduire les Favoriser l’émergence d’un écosystème : efforts nécessaires d’une part à la diffusion des favoriser l’émergence d’un écosystème de données par les acteurs publics, et d’autre part producteurs et de réutilisateurs de données à leur réutilisation, afin d’accélérer le publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr. 15
  • 20.
  • 22.
  • 23. N0,2.+-&!;J! 4$**5&(!27>%.B7&(!M!5<&-6&*#&!':7*&! B7&(+.$*!($#.5+,%&! Les évolutions technologiques récentes ont avait pour but de faciliter l’accès et le rendu possible le partage rapide et aisé de tous référencement de documents en symbolisant types de données. Elles réactivent, sous un jour leur manipulation sous forme de phrases, liant nouveau, le débat déjà ancien sur l’accès aux verbes intuitifs (lire, afficher, remplacer, documents administratifs, maintenant sous effacer) et métadonnées d’adressage universel forme électronique et bien plus aisément (URL ou Uniform Resource Locator5). diffusables. Bien que basées sur un réseau d’échange de L’Internet a fait apparaître une économie documents, les techniques du Web ont des données. Les stratégies de croissance des naturellement développé un tropisme de plus acteurs du Web, via l’ouverture de leurs en plus marqué vers les données elles-mêmes. interfaces de programmation (API), ont illustré L’introduction des bases de données le potentiel de la réutilisation des données, et relationnelles dans les outils de développement suscité des attentes similaires des développeurs a permis la création de sites dynamiques, c’est- vis-à-vis du secteur public. Ils exercent une à-dire dont les pages s’adaptent aux pression pour que les États, en facilitant l’accès circonstances (évolutions de prix, listes à leurs informations, s’insèrent et tiennent leur d’objets changeants, « unes » de journaux rang dans ce « Web des Données ». électroniques mises à jour fréquemment). À partir de 2004, une technique émergente a vu Ces ruptures technologiques ont le jour qui consiste à utiliser les fonctionnalités accompagné par ailleurs une prise de de scripting6 présentes dans les navigateurs conscience de l’importance des données pour permettre la mise à jour en temps réel de produites par l’administration et le secteur pages déjà chargées, en allant chercher en public. La possibilité novatrice de réutiliser ces tâche de fond des données remises à jour. données sous forme brute, pour leur trouver de Nommée AJAX7 pour JavaScript Asynchrone nouveaux usages utiles et instructifs, a abouti à et XML (Asynchronous Javascript And XML), l’émergence de la question des données à partir du langage de scripting JavaScript et publiques en tant que véritable question du format d’échanges de données XML, cette sociétale. technique à la croisée de différentes technologies Web est reconnaissable derrière CJ O,!'$**5&!,7!#P7-!'&(! des applications Web hautement réactives dont les pages ont rarement besoin d’être rafraîchies *$7?&,78!7(,6&(! – telles que GMail8, Quora9 ou Facebook10. Internet et les ruptures technologiques récentes on fait apparaître une nouvelle « économie des données ». http://www.w3.org/People/Berners-Lee/ 5 World Wide Web Consortium (W3C). 1994. Uniform Resource Locators (URL) : A Syntax for the Expression of L-M "#!N#+!#$4!$40*24*0(!/*4&*0!%#!,3(2:/';#!%#! Access Information of Objects on the Network. %&''(#$=! http://www.w3.org/Addressing/URL/url-spec.txt 6 Capacité d’un navigateur à faire tourner dynamiquement Le génie informatique (computer science un programme qui agit en temps réel sur la page affichée. dans le monde anglo-saxon) est défini comme Par exemple, une page qui affiche l’heure repose sur un la manipulation algorithmique de données et de script qui demande au navigateur de mettre à jour l’heure, les minutes et les secondes à mesure qu’elles s’écoulent. leurs structures de représentation. Le Web, Dans le cas d’un service de courrier en ligne, c’est souvent avant d’être un phénomène social, est une un script qui réagit au click sur l’intitulé d’un email et architecture logicielle3 conçue par un change l’affichage pour détailler le contenu du mail plutôt chercheur britannique en physique des hautes que celui de la boîte de réception. C’est aussi un script qui vérifie automatiquement l’arrivée de nouveaux courriers énergies au CERN, Sir Tim Berners-Lee4. Elle en tâche de fond, et réintègre éventuellement ces nouvelles données dans le corps de la page affichée. 7 Garrett, J.J. 18 février 2005. « Ajax : A New Approach 3 World Wide Web Consortium (W3C), 2010, HTTP – To Web Applications ». Hypertext Transfer Protocol Overview – draft 09. http://www.adaptivepath.com/ideas/essays/archives/00038 http://www.w3.org/Protocols/ 5.php 4 8 World Wide Web Consortium (W3C). Sir Tim Berners- GMail, service de boîte de courrier électronique en ligne Lee: Bio. Téléchargée le 10 janvier 2011. de Google, Inc. : http://www.gmail.com 19
  • 24. Pour supporter cette technologie, de plus en gagne en utilité pour ses utilisateurs, et le plus d’applications en ligne ont développé à la système producteur voit sa position fois deux interfaces : une interface graphique compétitive renforcée par la dépendance classique accessible aux utilisateurs à travers accrue du marché à ses services. En l’essence, leur navigateur, et une interface exclusivement c’est une transaction de marché où l’accès à consacrée aux machines, qui permet justement des données est échangé contre leur diffusion à au moteur de scripting du navigateur de un nouveau public ou dans un nouveau récupérer des données à la volée. C’est cette contexte. interface, qu’on peut se représenter comme un L’exposition d’une interface API est protocole d’échange de données de machine à aujourd’hui une étape presque obligée du machine, qu’on appelle interface de développement d’un nouveau produit en ligne. programmation ou API (sigle anglophone pour La généralisation de ce phénomène est d’une Application Programming Interface). grande importance pour la question des données publiques, car elle a permis de prendre L--M "/!%&''(#<!7&''/-#!%3(2:/';#!#4!,#1-#0! %3-'C,*#'2#!$*0!,#!N#+=! conscience de l’omniprésence des données derrière les services qu’utilisent Les API sont devenues un véritable outil quotidiennement les internautes. stratégique pour les sociétés de services en ligne.11 Par exemple, c’est dans une large En un mot, « l’économie des données » mesure grâce à l’ouverture de leur API12 que s’est construite autour de l’échange et de la Twitter a pu permettre à une communauté de fluidité sur le Web : les données ont souvent développeurs de se créer, et de multiplier les plus de valeur comme outil d’échange et applications permettant d’utiliser le service en d’influence qu’isolées au sein des entrepôts de dehors du site Web principal (notamment dans données des entreprises13. les premiers jours de l’App Store d’Apple durant l’été 2008). Ce grand nombre L---M 81#2!,#!N#+!O=P<!,/!%&''(#!%#1-#'4! 2&,,#24-1#! d’applications a servi de « force de vente » virtuelle pour Twitter, et est un des facteurs Un corollaire de la montée en puissance de principaux qui expliquent son succès la donnée est son rôle de liant social sur le populaire. Web. En particulier, avec l’apparition de phénomènes de collaboration de masse tels que Bien documentées et basées sur des Wikipedia, on s’aperçoit que l’échelle standards acceptés (tels que JSON ou XML) d’échanges rendue possible par Internet ouvre pour éviter les problèmes d’interopérabilité, des possibilités insoupçonnées jusqu’alors. ces interfaces s’adressent à des développeurs informaticiens. Selon le degré d’ouverture Des services tels que Delicious (site de (fonction des choix stratégiques de la société) partage de bookmarks, qui agrège les et les conditions de licences (souvent conçues catégories dans lesquelles les utilisateurs pour encourager la réutilisation) consentis à rangent différents liens, et permet ensuite de ces derniers, ils peuvent extraire, trouver des liens par catégorie d’intérêt) ou éventuellement modifier, et transformer les Flickr (qui permet de chercher des données du service Web en question, pour les photographies libres de droits sur un sujet réutiliser, notamment à la construction de particulier, en se basant sur les tags de nouveaux services ou de nouvelles catégorisation produits par l’ensemble des applications. utilisateurs) ont ainsi profité de ce phénomène de folksonomy, la taxonomie par les foules ou L’échange est mutuellement bénéfique : le classification par l’intelligence collective14. nouveau service, consommateur de données, D’autres services tels qu’Amazon ou Netflix ont, eux, profité de la masse 9 Quora, Inc., site de questions et réponses dynamique caractérisé par l’expertise pointue de sa communauté d’utilisateurs, fondé en 2009 et qui a connu une très forte 13 Ed Parsons - Geospatial Technologist for Europe, croissance en 2010 : http://www.quora.com 10 Facebook, Inc., le réseau social dominant qu’on ne Middle East and Africa chez Google, au séminaire présente plus, fondé par Mark Zuckerberg en 2004 et « Innovations et développement du secteur de approchant 600 millions d’utilisateurs début 2011 : l’information géographique » organisé le 5 octobre 2009 à http://www.facebook.com la Grande Arche de la Défense par le Conseil National de 11 Shah S., 28 August 2010, « Cannibalize Business l’Information Géographique (CNIG), l’AFIGÉO et Development by Popularizing your API » : l’Institut des Sciences et des Techniques de l’Équipement http://shaivalshah.com/cannabilize-business-development- pour le Développement (ISTED) by-populariz 14 12 Entretien le 12 novembre 2010 avec Henri Verdier, Tapscott, D. and Williams, A. 2006. Wikinomics : How Président de Cap Digital. Mass Collaboration Changes Everything. 20
  • 25. d’utilisateurs se servant de leurs sites pour en « différentes sources au sein d’une seule extraire des modèles de préférences des plateforme, (…) l’une des facettes du design consommateurs, qui leur permettent de faire collaboratif sur le Web17 ». Cette nouvelle des recommandations hautement tendance a connu un tel succès au tournant des personnalisées selon les goûts de leurs clients. années 2006 à 2008 que le prestigieux Museum of Modern Art de New York y a L’un des enseignements de la nouvelle consacré une exposition phare18. incarnation sociale et collaborative du Web, c’est que la valeur des données n’est pas Au-delà de l’incidence culturelle de ce intrinsèque, mais dérive de leur agrégation, de phénomène19, la réappropriation du local et de leur recoupement, de leur analyse et de la l’espace géographique par le biais du Web et réutilisation qui en est faite. du mobile annonçait l’importance croissante de la donnée informatique géographique, et, au- Le Web a ainsi mis à jour une économie delà, l’émergence du phénomène culturel du des données, qui joue un rôle de monnaie remix et de la réutilisation des données. d’échange parmi les entreprises d’Internet et les services en ligne. FJ O&(!'$**5&(!27>%.B7&(!&+! L-1M D&''(#$!;(&;0/):-.*#$!#4!Q!7/$:R*)$!S! %&7-!-57+.%.(,+.$*! L’autre développement technologique qui a conduit à prendre conscience de l’importance La génération des digital natives, qui a des données, c’est la démocratisation de grandi dans l’habitude de la réutilisation, du l’information géographique. remix et de la recombinaison permanente, devait nécessairement s’intéresser aux Google indique par exemple que son informations collectées par l’État. approche est « d’utiliser la géographie pour L’émergence de la réutilisation des données organiser toute l’information mondiale, qu’elle publiques comme sujet de société, poussée par soit géographique ou non. C’est un principe les nouveaux usages, a révélé une chaîne de d’organisation qui sera utilisé pour mieux valeur fondée sur ces données qui, lorsqu’elles comprendre l’information. »15. sont mises à disposition de façon brute et Si les briques technologiques sont réexploitable, permet aux développeurs et aux disponibles pour utiliser et manipuler la entrepreneurs de créer de nouveaux services. donnée géographique à loisir, ou même pour l’utiliser pour structurer d’autres données, le L-M "#$!%&''(#$!'*7(0-.*#$!&'4!1&2/4-&'!T!,/! %-CC*$-&'!,/!),*$!,/0;#! défi qui reste posé est celui de la constitution d’une véritable infrastructure des données Contrairement aux documents papiers dont géographiques. Ces données sont aujourd’hui l’impression engendre des coûts variables accessibles en nombre et de qualité, mais les conséquents et qui nécessitent des délais de repérer et les réutiliser peut rester obscur et traitement et d’acheminement, les données complexe16. numériques ont un coût marginal de diffusion nul ou presque20, et sont accessibles quasiment Conséquence récente des évolutions du instantanément. Web, des applications cartographiques puissantes réservées jusque-là à des experts Le travail éventuel de mise à disposition de sont devenues accessibles à tous. Le monde du données numériques est donc un coût fixe : la Web collaboratif a largement repris à son diffusion la plus large, en distribuant ce coût, compte la possibilité de représenter des est donc le modèle le plus efficace d’un point données sur des cartes. Grâce à l’ouverture de vue économique. gratuite (dans des limites relativement larges de volume) de son API, Google Maps est devenu une base de choix pour la création de 17 Google Earth mashups 5 of 14, in « Design and the « mashups », ces applications Web combinant Elastic Mind. » Museum of Modern Art. New York, NY. 2008. http://www.moma.org/interactives/exhibitions/2008/elastic 15 Ed Parsons – Ibid. mind/#/98/ 16 18 Voir l’intervention de Max Craglia, coordonateur « Design and the Elastic Mind. » Museum of Modern technique d’Inspire pour la Commission Européenne Art. New York, NY. 2008. (centre commun de recherche) au séminaire « Innovations http://www.moma.org/interactives/exhibitions/2008/elastic et développement du secteur de l’information mind/ 19 géographique » organisé le 5 octobre 2009 à la Grande Lessig, L. 2009. Remix : Making art and commerce Arche de la Défense par le Conseil National de thrive in the hybrid economy. http://remix.lessig.org/ 20 l’Information Géographique (CNIG), l’AFIGÉO et Les volumes qui peuvent être atteints font que le coût de l’Institut des Sciences et des Techniques de l’Équipement diffusion n’est en revanche pas négligeable et peut dans pour le Développement (ISTED). certains cas devenir important. 21
  • 26. L’instantanéité de diffusion et l’ubiquité riches et très variées ; certaines ont une forte d’accès offrent de plus des perspectives tout à valeur économique. Le marché de fait nouvelles en terme de périmètre de l’information est estimé en France à diffusion et d’audience potentielle, notamment 3,7 milliards d’euros dont 60 % sont des au regard de la démocratisation de l’Internet. données publiques21. Au niveau européen, ce chiffre représenterait près de 27 milliards L--M H&7+-'#0!,#$!%&''(#$!+0*4#$!/7),-C-#!,#*0! d’euros22 par an. )&4#'4-#,! La valorisation passe par différentes étapes Marqué par les traditions et les habitudes nécessaires pour rendre les données publiques d’un monde de communication par le papier, utilisables ou réutilisables. D’une part l’État diffuse le plus souvent ses informations l’institution productrice doit définir sous forme de « produits finis », tels que des précisément quelles données elle doit diffuser analyses, des pages Web explicatives ou des en ligne et de quelle manière, par un travail rapports écrits – en quelque sorte des données d’analyse et de collecte. S’imposent à ce stade « retravaillées » afin d’être intelligibles par le respect de critères de bon sens comme la tous. À l’inverse, les données brutes qui sous- protection de la vie privée, de la propriété tendent ces études sont rarement mises à intellectuelle des tiers, ou de la sécurité disposition du public, car leur intérêt pour une nationale. réutilisation potentielle est encore très inégalement perçu par les producteurs de D’autre part, pour faciliter la réutilisation, données publiques. l’institution productrice doit s’assurer de fournir une donnée qualifiée et mise à jour. Aujourd’hui, les technologies de Pour cela, il semble important de créer des lots l’information permettent une mise à de données cohérents et de s’assurer de la disposition des données à l’état brut. Loin présence d’une légende et plus généralement d’être un obstacle à leur réutilisation de la présence des métadonnées. ultérieurement à leur mise à disposition par l’administration, leur caractère brut permet au Il faut les mettre à disposition via un contraire de les recombiner plus facilement, ce support adapté mais en réalisant un catalogage qui amplifie leur potentiel et permet la création précis : il ne suffit pas de mettre à disposition de services impossibles à réaliser sans ces des données, encore faut-il qu’elles puissent croisements. être découvertes et facilement accessibles grâce à un portail de données publiques ou un Par exemple, des mesures locales de bruit moteur de recherche. permettent de mettre en perspective la corrélation positive mesurée entre les dépenses Enfin, les données publiques numériques mises énergétiques d’un ménage et son taux à disposition peuvent être réutilisées par la d’équipement en doubles vitrages, paradoxale communauté des développeurs et des au premier abord. Dans le cadre d’un concours entrepreneurs, qui peuvent leur inventer de organisé par la ville de Washington, D.C., des nouveaux usages. Ces données représentent données sur les vols, croisées avec les tracés aussi un outil interne au service des des pistes cyclables, ont aussi permis de créer administrations, qui peut leur permettre des une carte des zones à éviter pour les cyclistes. échanges d’information plus fluides et efficaces. Parce qu’elle favorise ces croisements et ces combinaisons fertiles sur des sujets L-1M "/!1-$*/,-$/4-&'!%#!%&''(#$!>&*#!*'!0V,#! recoupant des champs extrêmement vastes de $40*24*0/'4! l’économie, de la société et de Les données géographiques ont un rôle l’environnement, la mise à disposition des structurant dans la chaîne de valeur. Elles données brutes de l’État et des collectivités est rendent possible la spatialisation et la un terreau fertile pour des réutilisateurs, qui visualisation sur carte d’autres jeux de peuvent inventer de nouveaux usages à ces données, notamment géolocalisées. Selon données. l’Association Française pour l’Information L---M "#$!%&''(#$!)*+,-.*#$!#4!,#*0!0(*4-,-$/4-&'! $&'4!T!,3&0-;-'#!%3*'#!2:/U'#!%#!1/,#*0! 21 http://www.rgpp.modernisation.gouv.fr/index.php?id=51 &tx_ttnews[tt_news]=531&tx_ttnews[backPid]=11&cHas L’État et le secteur public au sens large, h=89b9c6970f dans le cadre de leurs opérations, touchent à 22 Dekkers, M. et al., 2006, « MEPSIR, Measuring Public l’ensemble des secteurs de notre économie, Sector Information Resources, Final Report of Study on notre société et notre environnement. Les Exploitation of public sector information », données qu’il collecte sont donc naturellement http://ec.europa.eu/information_society/policy/psi/docs/pdf s/mepsir/final_report.pdf 22
  • 27. Géographique (AFIGÉO)23, 80 % des Le processus de recherche, d’analyse puis informations qui sont utilisées possèdent une de représentation graphique synthétique des dimension géographique. Cela leur confère données sous forme interactive, qui donc une importance particulière à la fois d’un s’apparente à du journalisme et qu’on appelle point de vue technique, mais aussi en tant parfois « datajournalism » ou journalisme de qu’outil de recoupement et de recombinaison données, a participé à créer une demande pour de données. plus de transparence de la part des gouvernements, et à l’émergence du sujet de la Ainsi, dès 1854, John Snow détermina les réutilisation des données publiques. causes de la propagation du choléra grâce à la visualisation de données sur une carte. À cette époque, on pensait que la maladie se propageait par inhalation. Le médecin ______________________ superposa sur une carte les adresses des victimes du choléra à Exeter (quartier de Londres) durant un épisode aigu, et constata qu’elles coïncidaient avec l’accès à la pompe à eau de la Broad Street. Par déduction, il en Les données publiques offrent, par le biais conclut au rôle de l’eau et des conditions des réutilisations qui peuvent en être faites, un sanitaires dans la propagation de l’épidémie, ce fort potentiel d’innovation, tant à titre qui permit de la contrôler, et de réduire commercial que pour la recherche, le drastiquement le taux de mortalité lié à cette développement de nouveaux services aux pathologie dans les décennies qui suivirent. citoyens ou l’amélioration du travail de De manière plus générale, le succès de l’administration. l’infographie en ligne et des nouveaux modes Les nouvelles possibilités de de visualisation dynamique ont amené les recombinaison et de réutilisation offertes par graphistes et designers à rechercher de les technologies de l’information ont révélé nouvelles informations et de nouvelles sources l’importance de leur réutilisation, et contribué de données à mettre en scène dans leurs à en faire une question sociétale. productions. 23 http://www.afigeo.asso.fr/ 23
  • 28. Carte d’Exeter tirée de History of the Cholera in Exeter in 1832, T. Shapter. 24
  • 29. N0,2.+-&!;;J! O,!%.>-&!-57+.%.(,+.$*!'&(!'$**5&(! 27>%.B7&(!3!%:.*+&-*,+.$*,%! Le sujet de la réutilisation des données nouvelles évolutions, et collaborer à la publiques et l’appel à la mise à disposition rédaction d’articles scientifiques, se répand d’informations publiques sous forme brute a largement au sein de la communauté des émergé dans le contexte des ruptures chercheurs. Il trouve ensuite un écho dans la technologiques et économiques de ces communauté des développeurs, notamment dernières années. parmi les contributeurs de projets Open Source, dont le mouvement d’ouverture des C’est pourtant par deux ruptures politiques, données est philosophiquement proche. au plus haut niveau de l’État, d’abord aux États-Unis puis en Grande-Bretagne, chaque Des développeurs, des chercheurs et des fois dans un contexte d’alternance politique, économistes de l’information créent ainsi qu’il a été concrétisé par une politique l’Open Knowledge Foundation (OKFN) en ambitieuse d’ouverture des données publiques. 2003 et l’Open Data Foundation (ODaF)25 en 2006 – organismes à but non lucratif qui Le chapitre suivant présente un tour cherchent à promouvoir l’adoption de normes d’horizon de ce mouvement d’ouverture des mondiales de formats et de métadonnées données publiques, et l’historique récent de ces (description des jeux de données), et le deux principales initiatives gouvernementales, développement de solutions open source pour qui l’ont concrétisée à l’international. mutualiser les outils de mise en ligne de données. CJ O&!<$7?&<&*+!K)#'!D/4/! Les promoteurs de l’Open Data ont ainsi Le terme Open Data, littéralement développé des définitions formelles des « données ouvertes » ou « données libres » (au critères qui caractérisent des données sens « libres de droits »), est utilisé pour « ouvertes ». Un groupe de travail « Open désigner des données en libre accès et ouvertes Government Data » (OGD) d’experts du Web à la réutilisation. Il trouve son origine en 1995 s’est fixé huit critères assez larges de définition dans une publication du Comité sur les des données publiques ouvertes26. L’Open Données géophysiques et environnementales Knowledge Foundation (OKFN), pour sa part, du Conseil national de la Recherche aux États- propose onze critères27, plus axé sur les Unis intitulée « De l’échange complet et ouvert conditions juridiques acceptables qui doivent des données scientifiques »24 : se retrouver dans la licence de réutilisation. « Les programmes internationaux de Les deux ensembles de critères, qui recherche sur le changement global et la établissent une première définition des données surveillance environnementale dépendent ouvertes, sont détaillés ci-dessous. du principe d’un échange complet et ouvert Données complètes : toutes les données des données (i.e. les données et les sont mises à disposition, sauf exceptions de informations sont rendues disponibles sans bon sens. restriction, sur une base non discriminatoire, pour un coût réduit à celui Données brutes : les données sont telles des besoins de reproduction et de que collectées à la source. Elles ont la plus fine distribution). » granularité possible et ne se présentent pas sous des formes agrégées ou modifiées. Le terme, qui désigne donc à l’origine le processus de collaboration des scientifiques Données récentes : les données sont mises autour de données d’expériences partagées afin en ligne aussi rapidement que possible. de multiplier les chances de détecter des erreurs, se tenir mutuellement au courant des 24 25 http://www.opendatafoundation.org/ 26 http://www.nap.edu/readingroom.php?book=exch&page=s http://www.opengovdata.org/home/8principles 27 ummary.html http://www.opendefinition.org/okd/ 25
  • 30. Données accessibles : les données sont public) et l’opportunité politique ont mené au accessibles au plus grand nombre d’utilisateurs lancement, aux États-Unis, en Grande- possible, et réutilisables pour des usages les Bretagne et ailleurs en Europe notamment, plus variés. d’initiatives majeures d’ouverture et de réutilisation des données publiques. Données libres de droits : les données ne sont pas soumises au droit d’auteur, à brevet, au droit des marques, ou au secret commercial. FJ Q+,+(R9*.(!M!.*.+.,+.?&(! Formats exploitables : les données sont %$#,%&(A!27.(!'5<,-#0&! structurées pour permettre le traitement automatisé, et disponibles sous une forme S5'5-,%&!! pratique et modifiable. L’ouverture des données s’est effectuée aux États-Unis du bas vers le haut. Les villes Formats non-propriétaires : les données de Washington, New York, San Francisco, ont sont accessibles dans un format sur lequel entrepris de recenser les collections de données aucune entité n’a de contrôle exclusif. qu’elles envisagent de mettre à disposition, Conditions non discriminatoires : les puis d’ouvrir des « data stores » pour mettre données sont accessibles à quiconque sans ces jeux de données à la disposition du public aucune obligation préalable ni inscription, et des entreprises, des développeurs et des sans discrimination entre les domaines citoyens.28 d’application. Les données sont notamment Ces démarches de « libération » des disponibles aussi bien pour des réutilisations données publiques sont très souvent commerciales que personnelles. accompagnées de concours d’applications pour Paternité : la licence peut exiger, comme encourager la réutilisation des données rendues condition pour la redistribution et la publiques. réutilisation des données, d’identifier Ce mouvement, amorcé par les grandes clairement les créateurs de l’œuvre ou les métropoles, fait désormais l’objet d’une contributeurs initiaux. Si cette condition est politique au niveau fédéral. imposée, elle ne doit pas être indûment complexe à remplir, et notamment la liste des L-M "/!0(*4-,-$/4-&'!%#$!%&''(#$!(7#0;#!%/'$! contributeurs à citer doit être clairement ,#$!;0/'%#$!7(40&)&,#$=! indiquée. L’année 2005 est marquée par une rupture Distribution de la licence : les droits majeure : l’ouverture par Google des attachés aux données s’appliquent à tous ceux « interfaces de programmation » (API) du à qui elles sont distribuées. service Google Maps donne lieu à une Non-transitivité de la licence : la licence ne floraison d’applications et de mashups29. Un peut exiger que toute donnée distribuée grand nombre de ces applications consistent à conjointement avec une donnée sous licence positionner sur les cartes Google Maps des libre soit aussi elle-même sous licence libre, ce données d’origine publique. qui serait un frein à la réutilisation de ces Ainsi, à Chicago en 2005, Adrian données. Holovaty, journaliste et programmeur30 lance Droit d’extraction : si les données sont ChicagoCrime.org, un site qui renseigne sur extraites d’un jeu de données, les utilisateurs une carte les données relatives aux crimes et de l’extrait doivent bénéficier des mêmes délits commis dans la ville et récupérées droits que ceux qui sont accordés au jeu de auprès de la municipalité31. Suite au succès de données dans son ensemble. l’application, et grâce à un don d’un million de dollars de la Knight Foundation32 en 2007, il Bien que ce modèle des données ouvertes puisse s’appliquer à tous types de données, qu’elles soient produites par le secteur public 28 Benhamou, B., 2010, « Les concours d’applications ou non, l’importance démocratique de l’accès mobiles dans le monde », Délégation aux Usages de aux informations publiques a conduit à l’Internet, 21 octobre 2010. 29 focaliser le débat sur l’Open Government Data, Applications web combinant différentes sources au sein d’une seule plateforme, l’une des facettes du design ou la réutilisation des données publiques. collaboratif sur le web. 30 Auteur de la librairie de développement en langage Les évolutions technologiques, le cadre Python à succès, Django. réglementaire (notamment les lois sur le droit à 31 Entretien le 18 octobre 2010 avec Sylvain Parasie, l’information et la Directive européenne sur la LATTS, Ecole des Ponts ParisTech. 32 réutilisation des informations du secteur Organisation caritative dédiée aux avancées dans le domaine du journalisme. Ce type d’acteurs dotés en fonds 26
  • 31. développe une version commerciale du site, de sa cérémonie d’investiture, le Président EveryBlock33 (pour « chaque pâté de Obama signe son premier acte politique : un maison »), qui recense et agrège un grand mémorandum à destination des ministres et nombre de données potentiellement utiles pour directeurs d’agences intitulé « Transparency les citoyens dans un plusieurs municipalités. and Open Government » (Transparence et Gouvernement Ouvert). Il assigne aux services Des services du même type, conçus à partir fédéraux américains trois objectifs : de données publiques des municipalités voient transparence, implication des citoyens, le jour dans les domaines de l’éducation, de et collaboration. l’environnement ou de la santé. Adrian Fenty, le maire de Washington, L--M F*22W$!7(%-/4-.*#!%#$!2&'2&*0$! D.C. à l’époque, recommande Vivek Kundra %3/)),-2/4-&'$=! au Président Obama : le 5 mars 2009, ce Vivek Kundra, responsable des systèmes dernier est nommé Chief Information Officer d’information du District de Columbia du gouvernement fédéral américain (Directeur (autorité administrative de la ville de des Systèmes d’Information), un poste Washington), s’empare en 2008 du sujet. Il nouveau et symbolique créé sur mesure, avec lance Apps for Democracy, un concours de pour mission de mettre en place les développement d’applications de services technologies pour concrétiser la vision publics, ouvert à tous les développeurs, libres politique du chef de l’exécutif. de s’approprier des jeux de données mis à leur disposition pour l’occasion34. L-1M "#!)&04/-,!C(%(0/,!D/4/=;&1!! Contre toute attente, le concours Dès le 11 mars, Vivek Kundra demande d’application, doté par la Mairie d’un prix de aux DSI de toutes les agences fédérales 50 000 dollars, connaît un succès considérable. américaines de désigner des jeux de données Alors qu’ils espéraient une dizaine de (« datasets ») susceptibles d’être mis en ligne. réponses, les organisateurs reçurent 47 dossiers Se basant sur son expérience à Washington, il en 30 jours seulement. Le coût estimé du se concentre sur les données brutes. Data.gov travail de conception et de programmation sera un point focal faisant autorité pour ainsi mis à disposition des habitants de diffuser les données publiques brutes, sous des Washington a été évalué à plus de formats réexploitables. 2 600 000 dollars, soit un retour sur Son équipe développe une première version investissement de 5 100 % et un effet de levier beta du site en trois mois, grâce à l’utilisation de 52 pour 1. de techniques de développement dites Apps for Democracy fait école : les « agiles » qui découpent la réalisation du concours d’applications essaiment au sein des produit en cycles rapides (de vingt-quatre grandes métropoles américaines (notamment heures à quelques jours). New York, San Francisco, et Vancouver au Cette méthodologie aboutit à un processus Canada)35. En 2010, la Banque Mondiale elle- de développement rapide et itératif, qui assure même lance son concours (Apps for une rapidité de développement et la possibilité Development), qui reçoit plus d’une centaine d’intégrer continuellement les évolutions des de contributions. besoins qui apparaissent très fréquemment dans le cadre de projets de développement L---M "#!Q!;&*1#0'#7#'4!&*1#04!S!%*!X0($-%#'4! logiciel : « commencer petit à petit, réfléchir K+/7/! vite, faire un premier jet, le construire de façon Le candidat Barack Obama avait fait du incrémentale, prendre du recul. Trouver un « Gouvernement ouvert » un des axes de son moyen pour avancer »36. programme. Le 21 janvier 2009, au lendemain Le site est mis en ligne le 21 mai 2009, 120 jours seulement après la signature du Mémorandum par le Président avec seulement et organisés pour soutenir des programmes d’action ciblés, reste rare en France mais joue un rôle important dans le 47 ensembles de données. Le portail connaît débat social aux États-Unis. dans les mois suivants une évolution très 33 EveryBlock.com est désormais une filiale de MSNBC. http://www.everyblock.com/ 34 Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study. Harvard Business School. http://www.data.gov/documents/hbs_datagov_case_study. pdf 35 Bernard Benhamou. 2010. « Les Concours 36 d’Applications Mobiles dans le Monde », note de la Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study. Délégation aux Usages de l’Internet. Harvard Business School (voir plus haut). 27