SlideShare uma empresa Scribd logo
1 de 50
Baixar para ler offline
INFOLABDévelopper une «culture de la donnée» au service
des entreprises & des acteurs du territoire.
ATELIER 1
Groupe de travail national 11 avril 2013 - Atelier 1
La Campagne Infolab a Ă©tĂ© lancĂ©e le jeudi 11 avril Ă  l’oc-
casion de la premiĂšre rencontre du groupe de travail national, portant
sur le thÚme « Culture de la donnée et médiations ». Acteurs associatifs
(Libertic, Open Street Map, collectifs citoyens Open Data Tours, Poitiers,
Les Petits-DĂ©brouillards, DĂ©cider Ensemble, La Fonderie
), membres de
collectivités territoriales (Région PACA, Communauté urbaine de Bor-
deaux, CG Gironde, CG Hauts-de-Seine, CG Manche, Mairies de Paris et
de Rennes
) et grands comptes (Alcatel Lucent, La Poste, La Caisse des
dépÎts, Gemalto
) étaient rassemblés pour entamer une réflexion sur la
culture de la donnée et ses différentes formes de médiation. Retour sur
cette journée

Keywords - INFOLAB, OPENDATA, MEDIATIONS, CULTURE.
06 2011
INVENTONS ENSEMBLE L’INFOLAB INTRODUCTION
Groupe de travail national 11 avril 2013 - Atelier 1
I.
II.
III.
IV.
V.
VI.
FORGEONS UNE CULTURE DE LA DONNÉE !
Par Simon CHIGNARD
RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE
Par Loup CELLARD, Fing
METTRE LES DONNÉES EN DÉBAT
Par Amandine BRUGIÈRE, Fing
COMMENT CONSTRUIRE UN GUIDE DES MÉDIATIONS
Par Fabienne GUIBÉ, Fing
LA MÉDIATION, UNE NOTION FLOUE, VICTIME DE SON SUCCÈS
Par Faustine BOUGRO, Fing
LA CULTURE DES DONNÉES EN ENTREPRISE
Par Claire GALLON, LiberTIC
INTRODUCTION
SOMMAIRE
CONTACT
INVENTONS ENSEMBLE L’INFOLAB SOMMAINE
Groupe de travail national 11 avril 2013 - Atelier 1
FORGEONS UNE CULTURE DE LA DONNÉE !
Par Simon CHIGNARD
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB FORGEONS UNE CULTURE DE LA DONNÉE
	 C’est en forgeant que l’on devient forgeron ». Le proverbe aurait
pu figurer en sous-titre du premier atelier national Infolab. Il traduit l’idĂ©e
que la compréhension des enjeux de la donnée passe aussi (avant tout ?)
par notre capacité à mettre les mains dans le cambouis.
Nous avons donc beaucoup forgé lors de cette aprÚs-midi. La donnée
(notre matiĂšre premiĂšre), nous l’avons manipulĂ©e, chauffĂ©e, tordue pour
essayer d’en tirer quelques idĂ©es sur la culture de la donnĂ©e et sa (nĂ©ces-
saire) médiation.
Les sujets Ă©tudiĂ©s Ă©taient diffĂ©rents : les donnĂ©es d’entreprises, les sta-
tistiques de l’emploi et de l’activitĂ© Ă©conomique, les prĂ©noms les plus
populaires
 Mais au-delà de cette apparente diversité, les questions se
ressemblent : Comment traduire les questions en données ? Comment
aborder avec un regard critique les données disponibles ?
QUELLES COMPÉTENCES REQUISES POUR LES FAIRE PARLER ?
C’est en forgeant que l’on devient forgeron. Mais que devient-on en
manipulant de la donnée ? La question du rÎle des médiateurs est posée
ici, de mĂȘme que celle de l’expertise. Les sachants d’un domaine (ceux
qui maĂźtrisent un sujet ou une thĂ©matique) vont-ils ĂȘtre supplantĂ©s par
les experts de la manipulation des donnĂ©es ? Au moment oĂč data-scien-
tist devient un métier sexy, cette mise en pratique aura pu démontrer
que la donnĂ©e n’est pas rĂ©servĂ©e aux forts en maths

AprÚs le bruit et le chaleur de la forge, nous avons souhaité prendre un peu
de recul, pour rĂ©-interroger la notion-mĂȘme de mĂ©diation (le forgeron est
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB FORGEONS UNE CULTURE DE LA DONNÉE
devenu praticien rĂ©flexif 
). Qu’est-ce que ce terme veut dire ? Qui sont
les acteurs et les objets de la médiation ? Sarah Labelle nous a proposé un
Ă©clairage, de la mĂ©diation culturelle Ă  la sociologie de l’innovation, souli-
gnant la diversité des objets et des processus de médiation existants et
envisageables. L’échange qui a suivi aura mĂȘme permis d’imaginer un pos-
sible “MusĂ©e de la donnĂ©e”, ses expositions permanentes et temporaires,
ses ateliers de dĂ©couverte et de co-construction. La rencontre s’est conclue
par la prĂ©sentation d’un premier inventaire des outils et des dispositifs
d’animation et de mĂ©diation autour de la donnĂ©e. Un travail qui se pour-
suivra au cours des prochains mois pour alimenter les expérimentations
territoriales et le guide des mĂ©diations. “Practice makes perfect” disent
nos voisins d’outre-manche : ce premier atelier n’est que la premiĂšre Ă©tape
de notre parcours Infolab, nous aurons donc l’occasion de remettre le sujet
de la culture de la donnée sur la table

Simon CHIGNARD, Consultant Open Data, http://donneesouvertes.info
Groupe de travail national 11 avril 2013 - Atelier 1
RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE
Par Loup Cellard, Fing
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE
	 Afin de mieux comprendre le contexte et les limites de l’ouverture
d’un jeu de donnĂ©es, le thĂšme de l’atelier proposĂ© par Simon Chignard était
particuliÚrement bien choisi : les prénoms. Tout le monde en a un, tout le
monde sait ce que cela reprĂ©sente, et c’est une notion centrĂ©e sur l’hu-
main et l’identitĂ©, de quoi rassurer les data-sceptiques, et de quoi faire
vibrer les data-dandys.
L’entrĂ©e en matiĂšre dans le sujet s’est faite grĂące Ă  plusieurs articles de
presse qui mettaient en évidence les modes de médiatisation du sujet :
le prénom comme bien de mode, la recherche du prénom rare, les stéréo-
types éditoriaux véhiculés par la presse
 AprÚs analyse de divers corpus
de donnĂ©es sur les prĂ©noms (INSEE, data.gouv, fichier d’état civil
 jeu de
données de Paris et Rennes), il est aisé de déceler les biais de ces jeux qui
limitent leurs utilisations possibles.
En effet, les jeux de données ne sont pas identiques entre collectivités
territoriales, la comparaison entre territoires devient alors difficile : une
normalisation serait bénéfique, mais qui peut la porter ?
QUI EST LE GARANT ?
Il y a un effet boßte noire sur la constitution des jeux de données et un
manque de normes  institutionnelles qui pourrait régler ces problÚmes.
Il serait également  intéressant de préciser les limites de chaque jeux de
donnĂ©es (ce qu’ils ne contiennent pas). Par exemple, dans les jeux de don-
nĂ©es des prĂ©noms de l’INSEE, l’occurrence minimale (prĂ©nom rare) pour
Groupe de travail national 11 avril 2013 - Atelier 1
qu’un prĂ©nom soit inscrit est de 3 (si un prĂ©nom X a Ă©tĂ© donnĂ© que 2 fois
sur ce territoire il n’apparaütra pas dans le fichier). Sur le portail de la ville
de Paris, elle est de 5. Pourquoi ce choix et cette différence? Qui fixe la
norme (ou à défaut une pratique commune) ?
EST-CE LE RÔLE D’ETALAB ?
Bien souvent, les problÚmes de réutilisation de données viennent du fait
que l’on ignore le contexte de production de ces mĂȘmes donnĂ©es. Il nous
manque des informations autour de la constitution des jeux : les méta-
donnĂ©es. Dans les donnĂ©es des prĂ©noms d’une ville, on ne sait si la date
d’inscription dans le jeu de donnĂ©es est la date de naissance de l’enfant
ou la date de son enregistrement d’état civil ? Les enfants nĂ©s autour du
31 dĂ©cembre sont certaines fois enregistrĂ©s sur l’annĂ©e suivante, dĂ©lai
d’enregistrement oblige !
Les diffĂ©rences d’orthographe, de prononciation et de genre des prĂ©noms
ne sont pas prises en compte dans la constitution des jeux de données.
Lorsque l’on veut analyser le prĂ©nom Justin comme indicateur social, on ne
sait s’il se prononce Ă  la française ou Ă  l’amĂ©ricaine, et si du coup il se rĂ©-
fÚre davantage à Justin (de La Borderie), prénom à connotation bourgeoise,
ou Ă  Justin (Bieber), jeune chanteur de pop amĂ©ricaine reprĂ©sentatif d’une
culture populaire transnationale. Les prénoms sont des données relative-
ment simples et on s’aperçoit qu’elles posent dĂ©jĂ  un certain nombre de
problÚmes: quel degré de complexité vont avoir des jeux de données de
résultats financiers ou de santé publique ?!
INVENTONS ENSEMBLE L’INFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE
Groupe de travail national 11 avril 2013 - Atelier 1
AprÚs cette analyse critique des données, nous avons identifié les princi-
paux cas de rĂ©utilisation : les jeux de donnĂ©es des prĂ©noms peuvent ĂȘtre
utilisĂ©s pour montrer la diversitĂ© des prĂ©noms (relativiser l’utilisation des
prénoms rares, montrer la diversité des prénoms dans le temps), révéler
les modes dans l’utilisation de tel ou tel prĂ©nom (orthographe, influence
d’un fait d’actualitĂ©, d’un personnage de fiction, d’une star) ou encore uti-
liser le prénom comme indicateur social ou comme révélateur en période
de crise.
EST-ON PLUS ORIGINAL DANS LE CHOIX DE SON PRÉNOM
EN PÉRIODE DE CROISSANCE OU D’AUSTÉRITÉ ?
TrÚs pédagogique, cet atelier permet de comprendre les étapes clés de
l’utilisation d’un jeu de donnĂ©es : sa rĂ©ception, l’analyse de ses potentia-
litĂ©s, le dĂ©frichage Ă  l’intĂ©rieur du jeu, les possibilitĂ©s d’enrichissement et
de rĂ©utilisation. Simon Chignard insiste Ă©galement sur l’importance des
métadonnées dans la publication des jeux de données : il faut davantage
documenter le contexte de production des jeux.
On comprend alors les bonnes questions à se poser avant d’envisager
toute production de sens avec un jeu de donnĂ©es : Qu’est ce qui est rĂ©el-
lement présent dans le fichier ? Comment a-t-il été constitué ? Le fichier
reprĂ©sente-t-il l’ensemble du corpus Ă  Ă©tudier ?
Loup CELLARD, Assistant Chef de Projet, Fing
INVENTONS ENSEMBLE L’INFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE
Groupe de travail national 11 avril 2013 - Atelier 1
PREMIERS BÉBÉS 2013Source : http://fr.slideshare.net/schignard/infolab-les-prnoms-une-donne-populaire
PAR LE TÉLÉGRAMME
Groupe de travail national 11 avril 2013 - Atelier 1
METTRE LES DONNÉES EN DÉBAT
Par Amandine BRUGIÈRE.
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
	 Dans ce 2e atelier main dans le cambouis, Vincent Mandinaud
de  l’ANACT  et HervĂ© Paris d’AlterCarto/CitĂ© Publique  ont prĂ©sentĂ© une
méthode originale - et éprouvée ! - de mise en discussion des données
articulant des approches quantitatives et qualitatives des données. Pour
bien comprendre la démarche, revenons sur les caractéristiques des ac-
teurs en présence. 
L’ANACT (Agence Nationale pour l’AmĂ©lioration des Conditions de Travail)
est un EPA sous tutelle du ministĂšre du travail, et les organisations pa-
tronales et syndicales dites reprĂ©sentatives siĂšgent Ă  son conseil d’ad-
ministration. L’ANACT forme un rĂ©seau, avec 26 ARACT (Associations
RĂ©gionales pour l’AmĂ©lioration des Conditions de Travail) implantĂ©es dans
chaque rĂ©gion de France. La vocation de ce rĂ©seau est d’aider les organisa-
tions à développer des projets innovants touchant au travail, dans le cadre
d’un dialogue social constructif, pour amĂ©liorer Ă  la fois la situation des
salariĂ©s et l’efficacitĂ© des entreprises.
Aussi, ces derniÚres années, le réseau ANACT a déployé des outils de car-
tographie statisitique et expĂ©rimentĂ© une mĂ©thodologie d’enquĂȘte sur
les contextes de travail dans les territoires. Mobilisés et éprouvés par des
acteurs territoriaux (ARACT, ComitĂ©s de Bassin d’Emploi; Maison de l’Em-
ploi et de la Formation Professionelle, etc.), ces outils de rapprochement
cartographique de donnĂ©es et ces methodes d’investigation leur ont per-
mis d’alimenter la reflexion, d’affiner la problĂ©matisation des contextes
d’action face aux mutations du travail dans les enterprises et les terri-
toires. Le travail de mediation que rĂ©alisent ces groupes d’acteurs  table
sur la mise en scĂšne et l’analyse de donnĂ©es de statistiques publiques,
couplĂ©es, articulĂ©es Ă  des savoirs d’expĂ©riences, des connaissances de
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
terrain. Le positionnement - presque Ă©thique - de l’agence est de ne pas
livrer de corrélations statistiques toutes faites aux acteurs, mais de pro-
poser des cadres de travail soutenant la capacité des acteurs (non experts
des données) à formuler de corrélations délibératives, soutenues par des
formes d’enquĂȘtes collaboratives, de partage d’expĂ©riences et d’expertise
collective.
Sur son chemin lyonnais, l’ANACT a croisĂ© le bureau d’étude  CitĂ© Pu-
blique  (concepteur et dĂ©veloppeur de l’application web de cartographie
statistique) et l’association  AlterCarto  : une association engagĂ©e dans
les problématiques de débat citoyen, préoccupée par le développement
de technologies démocratiques et plus spécialement de cartes réflexives.
Cette rencontre a ouvert sur une collaboration fructueuse entre les orga-
nismes et sur la co-Ă©laboration d’un projet nommé ATTLAS, reprenant la
suite technologique Suite Cairo.
ATTLAS se base sur la réutilisation des données publiques géoloca-
lisées et propose une lecture nouvelle des contextes de travail dans les
territoires, complémentaire aux approches sectorielles traditionnelles. La
dĂ©marche d’investigation proposĂ©e aux partenaires, soutenue par l’uti-
lisation de modules cartographiques dit « PageCarto », consiste en une
plongée dans les problématiques des territoires, étayée de données, mé-
diée par des cartes, des graphiques et des commentaires. 
Cette démarche articule trois types de compétences :
- l’expertise mĂ©tier et terrain des clients ou partenaires;
- l’expertise mĂ©tier du rĂ©seau ANACT sur la champ problĂ©matique du tra-
vail et des changements technologiques et organisationnels;
- l’expertise socio-technique et cartographique d’AlterCarto. 
Groupe de travail national 11 avril 2013 - Atelier 1
ATTLASSource : http://www.anact.fr/web/services/attlas
PAR ANACT
Groupe de travail national 11 avril 2013 - Atelier 1
Les intervenants dĂ©finissent leur rĂŽle comme celui d’un appui Ă  la pro-
blĂ©matisation, d’une expertise de facilitation concourant Ă  l’encapacitation
des acteurs concernĂ©s sur les phĂ©nomĂšnes explorĂ©s. L’objectif est non pas
de résoudre les problÚmes des acteurs à leur place, mais de mettre en
place un cadre d’usages facilitant le partage des expĂ©riences, la mutuali-
sation des ressources pour renouveler les capacitĂ©s d’agir sur les phĂ©no-
mĂšnes.
Une question que soulÚve cet attelage de compétences concerne la spé-
cialisation thématique des experts de la donnée : peut-on jouer un rÎle
de datascientist pour des tiers, sans comprendre les problématiques du
domaine, les implicites du langage, les conflits d’acteurs, etc. ?
LES MÉDIATIONS À LA DONNÉE DOIVENT-ELLES ÊTRE
SPÉCIALISÉES PAR MÉTIER ?
La démarche se construit en deux temps principaux.
Le back office comprend :
- la problématisation du sujet : de quoi parle-t-on ? Objectif : affiner les
questions, définir des problématiques communes ;
- le choix des périmÚtres : discussion autour des échelles, des cartes, des
reprĂ©sentations (quelle gĂ©ographie des donnĂ©es pour parler d’un pays
– sous-entitĂ© rĂ©gionale)  : les frontiĂšres administratives des donnĂ©es
cachent parfois le véritable étalement géographique des problématiques
Ă©conomiques et sociales.
- la dĂ©finition d’une stratĂ©gie de collecte de donnĂ©es (trouver les donnĂ©es
disponibles rĂ©pondant Ă  la problĂ©matique soulevĂ©e, qu’elle soit publique
INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
gratuite et ouverte, ou publique et payante). 
- la constitution d’un cahier de donnĂ©es ;
- le bidouillage des données pour passer des tableaux aux cartes.
Cette Ă©tape est longue, chronophage et, aux dires des instigateurs eux-
mĂȘmes, la plus laborieuse. Les clients ou partenaires n’ont pas toujours le
temps de rĂ©ellement s’y plonger. La tentation est forte de vouloir recevoir
le prĂȘt-Ă -consommer, et de s’absoudre de la cuisine prĂ©alable. Pourtant
cette étape une a une plus-value didactique forte : elle fonctionne comme
une formation, qui permet l’acculturation des acteurs à des formes induc-
tives de raisonnement, à la complexité de la représentation des phéno-
mĂšnes Ă©conomiques et sociaux, au caractĂšre construit des donnĂ©es qu’on
cherche à représenter et mobiliser.
La mise en discussion des cartes comprend :
On est Ă  ce moment-lĂ  face au produit prĂȘt Ă  l’usage. Mais les choses ne
se font pas toutes seules pour autant. La mise en discussion des cartes et
des donnĂ©es s’opĂšre d’une part grĂące au rĂŽle de tiers que jouent l’ANACT
et AlterCarto. D’autre part un principe prĂ©vaut pas de carte sans commen-
taire. Toutes les donnĂ©es reprĂ©sentĂ©es font ainsi l’objet de discussions, de
corrĂ©lations commentĂ©es, ce qu’on pourrait appeler l’hypertextualitĂ© des
données et des cartes. Les modules « PageCarto » offrent une fonction
de prise de notes dynamique, intégrant les commentaires aux cartes et
générant ensuite, si besoin, de nouvelles représentations plus adéquates. 
RMQ : Les données utilisées sont issues de différentes sources. Le recen-
sement de la population et le fichier connaissance locale de l’appareil pro-
ductif de l’INSEE sont jusqu’alors les sources principales pour constituer
Groupe de travail national 11 avril 2013 - Atelier 1
les jeux de données réutilisées. Des données provenant de la DARES, de
PĂŽle Emploi, ou encore de la CNAM-TS ont pu ĂȘtre mobilisĂ©es. Les donnĂ©es
sont Ă  la fois remises Ă  disposition sous format tabloĂŻde facilitant le trai-
tement machine et représentées sous formes de métadonnées cartogra-
phiques. Les cartes, les supports et les textes de commentaires sont sous
licence GNU GPL. 
CULTURE DE LA DONNÉE OU MÉDIATION ?
La démarche mise en oeuvre participe à développer une culture de la don-
nĂ©e auprĂšs des acteurs impliquĂ©s. C’est un des constats qui ressortait
de cet atelier. « Développer une culture de la donnée au service des entre-
prises et des territoires consiste bien à relancer un processus de médiation,
à reconfigurer la relation entre producteurs et réutilisateurs et renouveler
les usages » reconnaissait Vincent Mandinaud. Médiation et culture de
la donnĂ©e pourraient bien ĂȘtre indissociables
 « Jusqu’à prĂ©sent les spĂ©-
cialistes de la donnée (statisticiens, acteurs publics, etc.) ont privatisé les
mĂ©diations  : la production, la collecte et l’analyse des donnĂ©es ne pas-
saient que par eux. L’enjeu de l’Open Data aujourd’hui est donc autant un
enjeu d’acculturation Ă  la donnĂ©e par un plus grand nombre, qu’un enjeu de
dĂ©sappropriation par ceux qui, jusqu’à prĂ©sent, avait la main mise dessus »,
concluaient les intervenants.
UNE MÉTHODE POSSIBLE POUR DES INFOLABS CITOYENS ?...
INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
Groupe de travail national 11 avril 2013 - Atelier 1
Cette approche de co-Ă©laboration et de discussion des diagnostics terri-
toriaux avec les acteurs concernés faisait, pour notre petite équipe Info-
lab, largement Ă©cho aux scĂ©narios – fictifs – dĂ©veloppĂ©s avec l’associa-
tion Décider Ensemble, dans le cadre du rapport « Ouvertures des données
publiques et participation » en 2012. Dans chacun des 3 scénarios (CNDP /
Plan Climat Energie / Aménagement urbain) en effet, un dispositif de type
Infolab s’avĂ©rait nĂ©cessaire : pour rĂ©unir, partager et mettre en discussion
les donnĂ©es. Le dispositif fonctionnait autour d’une rĂ©union de compĂ©-
tences techniques et de traducteur/formateur/médiateur.
Est-ce que la mĂ©thodologie dĂ©veloppĂ©e par l’ANACT, CitĂ© Publique et Al-
terCarto pourrait fonctionner dans le cadre d’une concertation publique ?
L’acculturation des acteurs (qu’ils soit professionnels ou citoyens) à la
manipulation de données est-elle possible sur un temps court ? Sur tout
type de population ? Ou faudrait-il imaginer qu’un panel d’acteurs, choisi
au hasard, participe Ă  un processus long Ă  l’instar des jurĂ©s d’assises ? En
la matiĂšre, tout reste Ă  expĂ©rimenter
 !
A noter qu’à Lyon, toujours,  la municipalitĂ© forme dĂ©jĂ  les chargĂ©s de mis-
sions de développement local à des modes de concertation appuyés par
la mĂȘme technologie, et selon une approche mĂ©thodologique similaire,
pour entredéfinir, avec les comités de quartier, les zones prioritaires dans
le cadre des Contrats Urbains de Cohésion Sociale ; et pour mettre en place
un observatoire de la santé préfigurant le futur contrat local de santé
entre la Ville et l’ARS.
Pour en savoir plus sur ces initiatives : sven.grillet@mairie-lyon.fr
Amandine BRUGIÈRE, Chargée de missions, Fing
INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
Groupe de travail national 11 avril 2013 - Atelier 1
COMMENT CONSTRUIRE UN GUIDE DES MÉDIATIONS
Quels outils/méthodes/animations autour des données existe-t-il déjà ?
Par Fabienne GUIBÉ
Groupe de travail national 11 avril 2013 - Atelier 1
	 La derniÚre présentation de la journée, menée par Amandine Bru-
giĂšre (FING), portait sur l’analyse de la veille qu’a initiĂ©e, depuis 2 mois,
l’équipe INFOLAB (voir sur Diigo le fil de veille, ainsi qu’ici le tableau par-
tagĂ© oĂč sont rĂ©fĂ©rencĂ©s plus d’une centaine de dispositifs de mĂ©diation,
qu’ils soient formats d’animation, outils, mĂ©thodes
L’objectif n’étant pas
de capter l’exhaustivitĂ© mais la diversitĂ© des exemples).
Il s’agissait de livrer une premiùre photographie de ce qui est directement
accessible sur le web : Si on cherche aujourd’hui Ă  exploiter des donnĂ©es,
quelles soient ouvertes, fermées, personnelles ou publiques, quels sont
les outils, les mĂ©thodes, les formats d’animation documentĂ©s et acces-
sibles sur le web ?
QU’EST-CE QUI SE TROUVE À PORTÉE DE MAIN ?
Cette analyse de la veille s’est structurĂ©e autour :
- du type de mĂ©diation dĂ©veloppĂ©e. Est-ce que l’on est face Ă  des outils,
des mĂ©thodologies, des formats d’animation, des services, des ressources
documentaires, des serious game, des plateformes
?        
- du type d’actions possibles. Qu’est-ce que cela permet de faire ? Sensibi-
liser, explorer, imaginer, partager, analyser
?
Les catégories qui ont été retenues ici ne sont pas des catégories stabili-
sées. Le but de la présentation de ce work-in-progress était de faire réagir
les participants. Ainsi n’hĂ©sitez pas Ă  complĂ©ter le tableau, Ă  le commen-
ter, à partager les ressources identifiées, à nous contacter pour en discu-
ter. Ce travail s’enrichira au fil des rencontres, grñce à vos contributions.
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
SENSIBILISER
La sensibilisation aux enjeux de la donnée reste, visiblement, un domaine
Ă  investir : peu d’exemples Ă©mergent, relativement aux autres catĂ©gories
d’actions.
Ceux trouvés montraient cependant une grande diversité de formes. Cela
allait des ateliers rennais de sensibilisation des enfants Ă  la manipula-
tion et la représentation de données, au serious game sur les données ou-
vertes du budget de l’Etat, ou encore l’enquĂȘte Orange-lab-OWNI-FING «
OĂč habitez-vous vraiment ? », sorte de quizz – Ă  base de donnĂ©es ouvertes
- testant les connaissances territoriales des habitants. Les plateformes
Openstreetmap ou OpenfoodFacts (dé)montrant facilement la force du
crowdsourcing ( la production collaborative de données).
Un exemple particuliĂšrement pĂ©dagogique – mais s’adressant tout de
mĂȘme Ă  un public d’initiĂ©s – est la School of Data de l’association OKFN.
C’est une des seules initiatives proposant des ressources documentaires
et méthodologiques.
On le voit, ces formes de médiation développent chacune des pédagogies
trĂšs diffĂ©rentes, face Ă  la complexitĂ© des donnĂ©es. Elles n’hĂ©sitent pas Ă 
investir le ludique et s’adressent à tout type de public.
Groupe de travail national 11 avril 2013 - Atelier 1
OPEN FOOD FACTSSource : http://www.openfoodfacts.org
PAR STÉPHANE GIGANDET
Groupe de travail national 11 avril 2013 - Atelier 1
IMAGINER ET PRODUIRE DES USAGES
Avoir des données à disposition est nécessaire mais pas suffisant. Encore
faut-il avoir des idées de (ré)utilisation des données, et souvent faut-il
mĂȘme stimuler les rĂ©utilisateurs potentiels.
Dans ce champ-lĂ , les exemples trouvĂ©s relĂšvent essentiellement de l’ani-
mation : Concours ou appel Ă  projet, hackathon, dataconnexion, Data-
apĂ©ro ou Data-Tuesday. On est dans le champ de l’incitation, de la stimu-
lation, de la recherche de sĂ©rendipitĂ©, ou de l’innovation ouverte.
Quatre caractéristiques communes apparaissent :
- Ces formats d’animation s’adressent à des publics relativement avertis :
Innovateurs, start-upeurs, designers, dĂ©veloppeurs
             
- Ce sont majoritairement des exercices collectifs : la créativité découle-t-
elle du croisement de regard ?
- Ils sont d’une durĂ©e relative.
- Ils s’adaptent Ă  des donnĂ©es ouvertes comme « propriĂ©taires ».         
 
A noter toutefois un outil de sérendipité : Creadata, développé par Bas-
tien Kerspern proposant des idées de mash-up aléatoires entre les jeux de
données mis à disposition par la ville de Nantes.
 
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
CREADATASource : http://www.creadata.fr
PAR BASTIEN KERSPERN
Groupe de travail national 11 avril 2013 - Atelier 1
CUISINER
Une fois que les donnĂ©es et les idĂ©es sont lĂ , s’ouvre alors un champ d’ac-
tions relativement techniques : Récupérer les données (EasyOpenData) les
stocker, les nettoyer (Open Refine, DataWrangler), les anonymiser (norme
ISO de pseudonymisation), les croiser (DataLift), etc. Ce champ-lĂ  foi-
sonne d’outils destinĂ©s Ă  des publics trĂšs spĂ©cialistes.
Beaucoup d’entre eux Ă©mergent du champ des donnĂ©es personnelles : du
cÎté du VRM Vendor Relationship Manager (My Personal Vault), du quan-
tified self – la mesure de soi (BodyMedia), ou des pratiques de dĂ©veloppe-
ment durable (Green Button Data), pour ne citer que ces exemples-lĂ . La
relation aux donnĂ©es peut mĂȘme ĂȘtre mĂ©diĂ©e par des objets (Withings).
 
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
GREEN BUTTONSource : http://www.greenbuttondata.org
PAR WHITE HOUSE
Groupe de travail national 11 avril 2013 - Atelier 1
PARTAGER
Quant on cherche à partager des données brutes, ou à communiquer sur
leur analyse, plusieurs solutions s’offrent à nous : La plus connue d’entre
elle est la datavisualisation. ÉnormĂ©ment de solutions techniques existent
en la matiùre : Voir la trùs riche boüte à outils d’ExpoViz (made in La Fonde-
rie). Ces dataviz vont du graphique / diagramme classiques (Google Image
Chart) à des représentations plus sophistiquées (Treemap, graphe du web,
cartographie). Tous ces outils nécessitent un haut niveau de compétences
techniques.
D’autres outils permettent de partager des donnĂ©es avec des tiers, en
maĂźtrisant, autant que possible, les termes de l’échange. LĂ  encore le
champ des données personnelles est riche (Mine!Project, Personal.com).
Dans le champ des données de santé, on trouve des plateformes de par-
tage collectif de données (Curetogether, Asthmapolis).
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
GOOGLE IMAGE CHARTSource : http://www.imagecharteditor.appspot.com
PAR GOOGLE
Groupe de travail national 11 avril 2013 - Atelier 1
ANALYSER
Dans le champ de l’analyse des donnĂ©es, ce qu’on identifie comme outils
(Precog, Continuuity, StatMix, Coheris Liberty, Google Prediction API), pla-
teformes de services (DataPublica, Qunb, Captain Dash) offrent la possibi-
lité de construire des modÚles décisionnels, voire des modÚles prédictifs,
via des interfaces finales, des tableaux de bord. La complexité des opéra-
tions sous-jacentes liĂ©es au traitement des donnĂ©es n’est pas explicitĂ©e
: Comment s’opĂšrent les corrĂ©lations entre jeux de donnĂ©es, quels sont
les considérations, les choix qui prévalent aux datavisualisations, aux ta-
bleaux de bord ? Comment se font les modĂ©lisations, les simulations ? OĂč
se trouve la part de décision humaine dans les process ? Les pondérations
dépendent-elles essentiellement des profils techniques ?
A l’opposĂ©, dans le champ des sciences humaines, Ă©mergent des mĂ©tho-
dologies – et outils – permettant de mettre les donnĂ©es en dĂ©bat : la mĂ©-
thode dĂ©veloppĂ©e par l’ANACT/AlterCarto autour de la plateforme ATTLAS
montrait comment les acteurs pouvaient monter en compétences et opé-
rer leur propre corrélation de données. La méthode de cartographie des
controverses, développée par Bruno Latour, va aussi dans ce sens. Face
à des phénomÚnes sociaux (scientifiques, techniques) non stabilisés, les
cartographies des controverses mettent en visibilité différents points de
vue qui s’opposent, afin de favoriser l’objectivitĂ© dans les prises de dĂ©ci-
sion qui peuvent découler.
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
CAPTAIN DASHSource : http://www.captaindash.com
PAR GILLES BABINET & BRUNO WALTHER
Groupe de travail national 11 avril 2013 - Atelier 1
ET MAINTENANT, QUE FAISONS-NOUS ?
Ce travail de recensement et d’analyse des formes de mĂ©diation existantes
(qu’elles soient humaines, sous forme d’outils et de mĂ©thodologies, de
ressources documentaires ou de services
) ne fait que commencer. Il se
poursuivra jusqu’à la rentrĂ©e 2013.
Livrer ce premier niveau de lecture Ă©tait instructif rien qu’au regard :
de la nature des ressources disponibles : plus outils que ressources docu-
mentaires ou méthodologiques ou ludiques ; du niveau requis de compé-
tences pour leur utilisation : du geek au développeur professionnel, majo-
ritairement.  
Les données sont encore largement affaire de spécialistes
 On le savait.
Quasiment tout reste à faire en matiÚre de démocratisation des données
et Ă  tout niveau : sensibilisation, information, formation, accompagne-
ment, services.
Heureusement, la campagne Infolab ne fait que commencer !
Fabienne GUIBÉ, Chef de projet, Fing.
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
MÉDIATION : UNE NOTION FLOUE VICTIME DE SON SUCCÈS
Par Faustine BOUGRO
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
	 AprĂšs ces temps d’exploration, Sarah Labelle (maĂźtre de confĂ©-
rence en SIC, Paris 13) a mis en lumiĂšre une nouvelle entrĂ©e dans l’éco-
systÚme de la donnée, celle de la médiation, notion floue victime de son
succĂšs. Cette ouverture s’est rĂ©vĂ©lĂ©e ĂȘtre l’objet d’enjeux, qui dĂ©termine-
ront l’évolution d’une culture de la donnĂ©e face aux transformations qui
rythment notre société.
La donnĂ©e dite brute transforme sa valeur dĂšs lors qu’elle est rendue intel-
ligible et visualisée. Aussi, toute mise en forme de données, visant à favo-
riser la comprĂ©hension, construit une mĂ©diation, et c’est justement parce
que le pouvoir de l’image semble plus immĂ©diat que celui d’un corpus de
texte, que cette mĂ©diation doit ĂȘtre rĂ©flĂ©chie. Effectivement, la rĂ©utilisa-
tion de donnĂ©es brutes en vue d’un traitement intelligent, engage nĂ©ces-
sairement des objectifs différents de ceux qui ont présidé à la collecte.
En cela, toute forme ou processus de mĂ©diation reflĂšte la place que l’on
souhaite donner Ă  l’objet mĂ©diĂ© dans son environnement. De fait, la notion
de médiation nous incite à réfléchir, à travers nos conceptions du statut
des données dans la société, aux formes et processus que nous souhai-
tons mettre en place. Ce dernier champ a ainsi su Ă©veiller notre attention
quant aux problématiques soulevées qui esquissent de futurs champs
d’action pour l’Infolab.
Le premier repĂšre constitutif de cet Ă©cosystĂšme est la position humaine
relative Ă  l’utilisation des diffĂ©rents dispositifs et aux rĂ©percussions de ces
derniers sur l’appropriation et la production de sens. Le deuxiùme repùre
significatif est le scĂ©nario d’usage engageant la participation, Ă  savoir le
contexte au sein duquel la médiation est pratiquée.
Aussi, réfléchir sur les modalités de participation comme un processus so-
Groupe de travail national 11 avril 2013 - Atelier 1
cio-technique, nous a amené à observer de quelle maniÚre les dispositifs
de médiation façonnaient notre sensibilité, notre participation et quels
modÚles de pensée ils suggéraient. Les dispositifs de médiation, présen-
tĂ©s par Amandine BrugiĂšre (Fing), peuvent ĂȘtre abordĂ©s comme diffĂ©-
rentes techniques et outils pour crĂ©er la rencontre. L’usage Ă©tait selon les
dispositifs plus ou moins encadrĂ© et donc plus ou moins spontanĂ©. Jusqu’à
quel point peut-il fournir des cadres pour limiter les abus ? Quelles marges
de liberté la médiation confÚrent-elles aux citoyens ?
N’OUVRENT-ELLES PAS DE NOUVELLES CONFIGURATIONS
ENTRE LES ACTEURS ?
Á ce niveau, plutÎt que de réfléchir la médiation comme un procédé linéaire
allant du savoir Ă  l’objet, on la conçoit comme une Ă©conomie d’interac-
tions au sein de laquelle les participants s’enrichissent mutuellement. Les
dispositifs de médiation se doivent alors de conceptualiser une structure
dynamique, malléable et participative composant un modÚle réceptif aux
usages et aux imaginaires de différents individus et engageant ainsi une
nouvelle forme de dialogue, qui s’enrichira au travers d’interactions nĂ©go-
ciĂ©es. Il s’agit bien de produire de l’intĂ©rĂȘt gĂ©nĂ©ral tout en prĂ©servant les
spĂ©cificitĂ©s individuelles. Penser la mĂ©diation, c’est Ă©galement prĂŽner une
utilisation plus située, une gestion plus contextuelle des problématiques,
avec ce qu’elle implique dans la circulation d’information du mĂ©diateur
vers son public et inversement.
Si l’on Ă©voque beaucoup la pĂ©dagogie envers les citoyens dans les procĂ©-
dures de participation, il apparaßt que pour réussir cette combinaison, les
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
acteur publics et privĂ©s doivent eux-mĂȘme ĂȘtre dĂ©tenteurs d’une Ă©duca-
tion Ă  la reprĂ©sentation, Ă  l’analyse visuelle, Ă  la synthĂšse graphique pour
que ces dispositifs hybrides soient pleinement préhensibles. De surcroit,
la participation doit ĂȘtre dĂ©clenchĂ©e et motivĂ©e, pour dĂ©couvrir toute sa
puissance. C’est pourquoi accorder la reprĂ©sentation de la donnĂ©e et la
participation nécessite un cahier des charges éclairé et un travail attentif
de l’expĂ©rience utilisateur.
L’idĂ©e d’une plateforme musĂ©ale de la donnĂ©e, comme un territoire Ă  ex-
plorer, au travers duquel chacun pourra bùtir sa place, développant son
champs des possibles, a été introduite par Sarah Labelle  : « Comment
pourrait-on mettre en avant des donnĂ©es stabilisĂ©es?  ». Elle nous l’ex-
plique : « cette plate-forme permettrait d’offrir des expositions temporaires
sur des sujets thĂ©matiques ; une collection fixe, ce que l’on pourrait consi-
dérer comme un cadrage général pour entrée dans la culture de la donnée ;
des ateliers de manipulation réclamant les mains dans le cambouis ; des
visites guidĂ©s d’entrepĂŽt de la donnĂ©e ; et surtout un espace collaboratif de
co-construction autour de projets mobilisant la donnée ».
Faustine BOUGRO, Designer, Fing
INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
Groupe de travail national 11 avril 2013 - Atelier 1
OCCUPY WALL STREETSource : http://www.clickklack.net
PAR DARWIN YAMAMOTO
Groupe de travail national 11 avril 2013 - Atelier 1
LA CULTURE DES DONNÉES EN ENTREPRISE
Par Claire GALLON
Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
	 La gestion des données en entreprise ne concerne plus unique-
ment les acteurs du web et les grands comptes. Toutes les entreprises
créent des données numériques : données financiÚres, données sur la
clientÚle, données de localisation ou de production
 Et ces données font
de plus en plus partie des valeurs commerciales.
Aujourd’hui, les entreprises et notamment les petites entreprises qui
n’ont pas encore dĂ©veloppĂ© de valorisation de leurs donnĂ©es doivent ap-
prendre Ă  dĂ©velopper une culture de traitement en interne afin d’identifier
et profiter de la valeur qui se cache notamment derriĂšre :
- Les donnĂ©es de prĂ©sentation gĂ©nĂ©rale de l’entreprise : localisation, rĂ©fĂ©-
rencement, finances...
- La collecte de données sur les clients
- Les données sur les offres, produits, services
- Les données de qualité, satisfaction, et relation client
- Les données décisionnelles, prévision, prédiction, analyse
- Les donnĂ©es de temporalitĂ© dans l’entreprise : agendas, congĂ©s, saison-
nalité
- Les donnĂ©es d’impact social et environnemental, RSE
- Les données des Ressources Humaines
L’objet de l’atelier « DonnĂ©es des Entreprises » organisĂ© durant la premiĂšre
rencontre Infolab et animé par Charles Nepote (FING) était de proposer
des thĂšmes et exercices autour de l’intĂ©gration d’une culture de donnĂ©es
en entreprise en questionnant la qualification et normalisation des don-
nĂ©es en interne ainsi qu’en illustrant les Ă©changes de cas concrets.
Groupe de travail national 11 avril 2013 - Atelier 1
LES PROBLÈMES DE STANDARDISATION DES DONNÉES
Afin d’initier les participants Ă  la question de qualification des donnĂ©es,
la liste des inscrits Ă  l’atelier Infolab extraite du logiciel de la Fing a Ă©tĂ©
présentée et soumise aux commentaires. Les participants étaient invités
à exprimer leurs retours et étonnements sur cette liste qui détaille les
noms, prénoms, adresse email, coordonnées, et ville des inscrits.
Les premiers étonnements relÚvent le caractÚre hétéroclite des rensei-
gnements fournis dans la base de données et ce malgré la collecte via un
formulaire-type unique.
Parmi les problÚmes de standardisation identifiés :
Les problĂšmes de casse : des noms tantĂŽt en majuscules et tantĂŽt en
minuscules.
Ce qui questionne la clarté de la présentation en cas de publication.
Les problÚmes de champs : des adresses email renseignées dans le
champs des noms de famille.
On ne connaĂźt donc pas l’identitĂ© de la personne qui participera. Il y a des
adresses email personnelles renseignées au lieu des adresses profession-
nelles, on ne sait donc pas si la personne participe à titre personnel ou s’il
n’existe pas de mail d’entreprise.
Les problÚmes de doublons : un inscrit renseigné à deux reprises.
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
Groupe de travail national 11 avril 2013 - Atelier 1
Ces doublons peuvent biaiser le nombre de participants inscrits, Ă  moins
que l’auteur n’ait effectuĂ© une inscription pour une tierce personne dont
on ne connaĂźt pas l’identitĂ©.
Les problĂšmes d’exhaustivitĂ© : certains champs ne sont pas renseignĂ©s
(organisation par exemple).
Il manque des noms d’organisations et le champs « ville d’origine » a ra-
rement Ă©tĂ© renseignĂ©. Il n’est d’ailleurs pas prĂ©cisĂ© s’il s’agit de la ville
d’origine du participant, de la ville d’implantation de l’organisation, son
siĂšge social ? Ces manquements limitent les bĂ©nĂ©fices d’usage de la liste
d’inscription.
Les problĂšmes d’identifiants : une mĂȘme structure renseignĂ©e avec son
nom ou son acronyme.
A dĂ©faut d’identifiant unique, les opĂ©rations de tri des participants par
organisation ou d’identification du nombre d’organisations prĂ©sentes
se rĂ©vĂšlent erronĂ©s. On pourrait comptabiliser plusieurs fois une mĂȘme
structure sans mĂȘme relever la possibilitĂ© du doublon car il peut y avoir
confusion sur l’identitĂ© de l’organisation. Rennes MĂ©tropole dĂ©signe l’or-
ganisation plutît que la ville. Si ALVLF est le nom d’usage pour Alcatel-
Lucent, peu de personnes les connaissent cependant sous cet acronyme.
Il y a de véritables enjeux autour des identifiants et une position de pou-
voir pour leurs détenteurs qui peuvent faire disparaßtre une identité ou la
recouper. Si l’adresse e-mail d’un participant pourrait constituer un identi-
fiant unique interne, elle pose Ă©galement problĂšme en cas de changement
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
Groupe de travail national 11 avril 2013 - Atelier 1
de fournisseur d’accùs.
Les problĂšmes de droits : l’usage des donnĂ©es doit ĂȘtre dĂ©fini dans un
périmÚtre pré-établi.
La collecte de données personnelles tombe sous la loi Informatique et Li-
bertĂ©s et impose de dĂ©poser une dĂ©claration d’usage rendant la base inex-
ploitable dans des cas d’utilisations non-identifiĂ©s au prĂ©alable. Comment
faire quand on ne sait pas systématiquement quels usages peuvent suivre
? Et quid de la diffĂ©renciation de l’adresse professionnelle et personnelle ?
DES DÉMARCHES DE QUALIFICATION DES DONNÉES
Avoir une liste qualifiée de participants à un événement est pourtant pri-
mordial. Si quelqu’un n’est pas dans la liste d’un Ă©vĂ©nement alors qu’il
essaye d’y entrer aprĂšs s’ĂȘtre inscrit, cela dĂ©montre un certain amateu-
risme et impacte la relation client.
DiffĂ©rentes procĂ©dures permettent pourtant d’optimiser et mieux quali-
fier une base. Il serait ainsi possible de rajouter une case de reconnaissance
des emails pour automatiser le renseignements des champs et Ă©viter aux
participants de remplir Ă  nouveau le formulaire. SĂ©parer les champs noms
et prĂ©noms permet de clarifier l’identitĂ©. La casse peut ĂȘtre normalisĂ©e
automatiquement. Des infobulles ou informations complémentaires des
champs permettraient de mieux préciser les attentes de remplissage. Il
est enfin possible de proposer une reconnaissance des structures par liste
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
Groupe de travail national 11 avril 2013 - Atelier 1
existante pour s’assurer d’une dĂ©nomination unique des organisations, ou
crĂ©er un champs « nom d’usage » en plus du nom de l’organisation. On
peut encore rendre obligatoire le renseignement de tous les champs pour
Ă©viter les absences de renseignements. Ces procĂ©dures requiĂšrent d’orga-
niser une réflexion sur la qualification des données.
On peut également permettre aux participants de modifier leurs données
a posteriori, Ă  l’image du projet Mesinfos. Dans un tableur, on peut dĂ©dou-
blonner ou ajuster la casse automatique voire utiliser des outils plus puis-
sants comme OpenRefine. Des outils de CMS existent aussi pour nettoyer
les bases. S’ils nĂ©cessitent un investissement, ils permettent d’avoir une
base toujours à jour et qualifiée en normalisant et utilisant les nomen-
clatures d’usage. Il existe des sociĂ©tĂ©s spĂ©cialisĂ©es dans la correction de
fichiers (casse, doublons, conversion, etc.), tel Datalgo.
Si la normalisation est essentielle Ă  l’exploitation des donnĂ©es, la culture
de traitement qu’elle implique n’est pas Ă©quitablement rĂ©partie. Lorsque
Tom Tom demande des donnĂ©es du territoire Aquitaine qu’il ne rĂ©utilise
finalement pas car elles ne sont pas assez bien organisées, on constate
que la qualité des données est asymétrique et que la faible qualification
représente une perte de valeur. Si des outils existent pour améliorer les
données, tout ne se résoudra pas par les outils qui suivent les pratiques,
les usages et la normalisation. Au W3C, il faut au moins deux ans pour
valider une norme tandis que les données qui intÚgrent une composante
sociale Ă©voluent bien plus rapidement.
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
Groupe de travail national 11 avril 2013 - Atelier 1
VERS UNE CULTURE DES DONNÉES
La question de normalisation est complexe et différente selon la typolo-
gie des données : géographiques, personnelles, textuelles, etc. Elle diffÚre
Ă©galement dans le temps : les enseignants ont longtemps appris Ă  ne pas
mettre d’accent sur les majuscules car il n’y en avait pas sur les machines
Ă  Ă©crire. Comment proposer des solutions Ă  la normalisation et suivre leur
évolution ? Faut-il former les employés ?
Il semble a priori difficile de faire en sorte que le problÚme du réutilisateur
de la base (qui a besoin d’une base spĂ©cifiquement qualifiĂ©e) devienne le
problÚme du producteur de la base surtout quand celle-ci répond déjà à
ses besoins. Pourtant au sein des structures, de mĂȘme jeux de donnĂ©es
sont maintenus par plusieurs services pour différents usages. Que ces dif-
férents secteurs réalisent la nécessité de la normalisation est hautement
pertinent.
La normalisation fait penser Ă  la grammaire, qui est faite pour communi-
quer avec les autres. On a appris Ă  Ă©crire son nom avec une majuscule, ces
rĂšgles sont culturelles. Bien souvent, on ne respecte pas les standards car
on ne sait pas à quoi ils servent et ce qu’ils facilitent. Expliquer la raison
de chaque collecte des donnĂ©es peut ĂȘtre un premier pas. Il serait possible
d’imaginer des formations à la standardisation et des animations propo-
sant de crĂ©er un jeu oĂč l’on amplifie les erreurs pour rendre l’enjeu de la
normalisation compréhensible.
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
Groupe de travail national 11 avril 2013 - Atelier 1
LA MAITRISE DE SES DONNÉES, COMME DE SON IMAGE DE MARQUE
Les participant de l’atelier Infolab ont Ă©tĂ© invitĂ©s Ă  Ă©tudier la diffĂ©rence de
référencement en ligne de plusieurs organisations. En utilisant le moteur
de recherche de Google, ils ont questionné les différences de présenta-
tion des structures suite aux requĂȘtes FING, Alcatel Lucent, Gemalto ou
Orange.
Pour la FING il y a uniquement la présentation du site et de ses rubriques.
Pour Alcatel on retrouve un plan d’accùs et un lien vers l’article de Wikipe-
dia. Pour Gemalto, les coordonnées sont également indiquées tandis que
la requĂȘte pour Orange nous indique les trois agences les plus proches.
On constate que le niveau d’information et la trouvabilitĂ© d’une organi-
sation peut montrer de grandes disparités. Or la qualité des résultats
dĂ©pend largement des informations et donnĂ©es de l’organisation trou-
vĂ©es sur internet : donnĂ©es fournies par l’entreprise mais aussi donnĂ©es
issues d’autres personnes. L’exemple ci-dessus illustre la dĂ©pendance Ă 
un moteur de recherche. Comment avoir de meilleures données pour un
meilleur référencement ? Le projet Google Knowledge Graph vise à relier
des informations entre elles grĂące Ă  des relations comme sur DBpedia.
ComplĂ©ter ses donnĂ©es dans Dbpedia ou d’autres sources, devient donc
une forme d’enjeu marketing. Suivre les dĂ©marches de schema.org Bing,
Yahoo, Google, qui ont des impacts en terme de référencement des sites
web devient indispensable.
Le quasi monopole de Google sur la recherche en ligne impose de suivre
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
Groupe de travail national 11 avril 2013 - Atelier 1
de prĂšs ses mĂ©thodes de rĂ©fĂ©rencement et ses stratĂ©gies afin d’assurer
sa propre visibilité en ligne. En Aquitaine, un chùteau a été déclassé des
listes de référencement car il lui manquait des points de notoriété web,
bien que ces indicateurs soient diffĂ©rents selon le lieu de requĂȘte.
S’agissant de prĂ©sentation gĂ©nĂ©rale de l’entreprise, les donnĂ©es des si-
gnatures des emails sont aussi une maniÚre de se présenter et de pré-
senter son organisation. Certains utilisent des fichiers Vcard (.vcf) qui sont
de vĂ©ritables fichiers de donnĂ©es. D’autres se contentent d’une signature
rédigée dans le corps et automatiquement ajoutée à chaque email. Ces
signatures dans le corps des emails peuvent ĂȘtre automatiquement ana-
lysées, extraites et transformées en données, par des services comme
Writethatname qui peuvent enrichir automatiquement les donnĂ©es d’un
CRM. Demain il pourait ĂȘtre capable de publier de l’information en ligne
comme les organigrammes des entreprises.
Ce rapide tour d’horizon de la qualification des donnĂ©es en entreprises dĂ©-
montre que l’appropriation d’une culture de donnĂ©es en interne est d’au-
tant plus nĂ©cessaire au sein du secteur privĂ©. L’exploitation de ces don-
nées pour mieux gérer, optimiser et valoriser ses ressources représente un
avantage concurrentiel non-négligeable dans une situation économique
tendue. Comment standardiser ses données ? Comment former et implé-
menter des méthodes de normalisation ? Autant de questions que les
Infolabs se proposent d’explorer.
Claire GALLON, LiberTIC
INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
Groupe de travail national 11 avril 2013 - Atelier 1
Amandine BRUGIÈRE, Chargée de mission, FING
Email : abrugiere@fing.org
Faustine BOUGRO, Designer, FING
Email : fbougro@fing.org
Fabienne GUIBÉ, Chef de projet, FING
Email : fguibe@fing.org
Loup CELLARD, Assistant Chef de Projet, FING
Email : lcellard@fing.org
Charles NEPOTE, Directeur de programme d’action, FING
Email : cnepote@fing.org
Vincent MANDINAUD, Chef de projet ATTLAS
Email : v.mandinaud@anact.fr
Hervé PARIS, Chef de projet AlterCarto/Cité Publique
Email : cite.publique@wanadoo.fr
Sarah LABELLE, Maßtre de conférence en SIC, Paris 13
Email : sarah.labelle@sic.univ-paris13.fr
Simon CHIGNARD, Consultant Open Data
Email : simonchignard@me.com
Claire GALLON, Co-fondatrice et administratrice, LiberTIC
Email : claire.gallon@gmail.com
Pour plus d’informations : http://www.reseaufing.org
INVENTONS ENSEMBLE L’INFOLAB CONTACT
INVENTONS ENSEMBLE L’INFOLAB LES PARTENAIRES
LES PARTENAIRES DE LA CAMPAGNE INFOLAB
Groupe de travail national 11 avril 2013 - Atelier 1

Mais conteĂșdo relacionado

Destaque

Circulos
CirculosCirculos
Circulos
gloria
 
OpenDataGarage-ChristopheCastaner-RĂ©gionPACA
OpenDataGarage-ChristopheCastaner-RĂ©gionPACAOpenDataGarage-ChristopheCastaner-RĂ©gionPACA
OpenDataGarage-ChristopheCastaner-RĂ©gionPACA
Fing
 
Destreses comunicatives i avaluaciĂł tema 6
Destreses comunicatives i avaluaciĂł tema 6Destreses comunicatives i avaluaciĂł tema 6
Destreses comunicatives i avaluaciĂł tema 6
Anna GascĂłn
 
Revuepresse21.03
Revuepresse21.03Revuepresse21.03
Revuepresse21.03
ramondiaz
 
PresentaciĂłN2
PresentaciĂłN2PresentaciĂłN2
PresentaciĂłN2
Isidorogg
 
Shibo Et Wen
Shibo Et WenShibo Et Wen
Shibo Et Wen
zhymonica
 
Revuepresse04.05
Revuepresse04.05Revuepresse04.05
Revuepresse04.05
ramondiaz
 

Destaque (20)

Corriges criteres et baremes cfee 2015
Corriges criteres et baremes cfee 2015Corriges criteres et baremes cfee 2015
Corriges criteres et baremes cfee 2015
 
Circulos
CirculosCirculos
Circulos
 
02 desarrollodesoftwarecomoingenieria isi
02 desarrollodesoftwarecomoingenieria isi02 desarrollodesoftwarecomoingenieria isi
02 desarrollodesoftwarecomoingenieria isi
 
OpenDataGarage-ChristopheCastaner-RĂ©gionPACA
OpenDataGarage-ChristopheCastaner-RĂ©gionPACAOpenDataGarage-ChristopheCastaner-RĂ©gionPACA
OpenDataGarage-ChristopheCastaner-RĂ©gionPACA
 
Expédition ReFaire - Karim Houni, Seb
Expédition ReFaire - Karim Houni, SebExpédition ReFaire - Karim Houni, Seb
Expédition ReFaire - Karim Houni, Seb
 
Propuesta5 - Proyecto de Ley de CreaciĂłn de la Universidad de las Artes
Propuesta5 -  Proyecto de Ley de CreaciĂłn de la Universidad de las ArtesPropuesta5 -  Proyecto de Ley de CreaciĂłn de la Universidad de las Artes
Propuesta5 - Proyecto de Ley de CreaciĂłn de la Universidad de las Artes
 
Pc hardware
Pc hardwarePc hardware
Pc hardware
 
Destreses comunicatives i avaluaciĂł tema 6
Destreses comunicatives i avaluaciĂł tema 6Destreses comunicatives i avaluaciĂł tema 6
Destreses comunicatives i avaluaciĂł tema 6
 
Trasanquelos2010
Trasanquelos2010Trasanquelos2010
Trasanquelos2010
 
La Gestion du Papier.
La Gestion du Papier.La Gestion du Papier.
La Gestion du Papier.
 
Gerencia Integral
Gerencia IntegralGerencia Integral
Gerencia Integral
 
Tic en la educaciĂłn
Tic en la educaciĂłnTic en la educaciĂłn
Tic en la educaciĂłn
 
Bootcamp Irapuato Welcome
Bootcamp Irapuato WelcomeBootcamp Irapuato Welcome
Bootcamp Irapuato Welcome
 
Revuepresse21.03
Revuepresse21.03Revuepresse21.03
Revuepresse21.03
 
PresentaciĂłN2
PresentaciĂłN2PresentaciĂłN2
PresentaciĂłN2
 
Shibo Et Wen
Shibo Et WenShibo Et Wen
Shibo Et Wen
 
Jawad
JawadJawad
Jawad
 
Revuepresse04.05
Revuepresse04.05Revuepresse04.05
Revuepresse04.05
 
La France (K.L)
La France (K.L)La France (K.L)
La France (K.L)
 
Publication harcelement - sollicitation abusive de la Force publique
Publication harcelement - sollicitation abusive de la Force publiquePublication harcelement - sollicitation abusive de la Force publique
Publication harcelement - sollicitation abusive de la Force publique
 

Semelhante a Atelier1- Groupe national 11 avril 0

ContrÎle de ses données et écriture de soi
ContrÎle de ses données et écriture de soiContrÎle de ses données et écriture de soi
ContrÎle de ses données et écriture de soi
Olivier Le Deuff
 

Semelhante a Atelier1- Groupe national 11 avril 0 (20)

Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
 
DĂ©sinformation, fake news : pourquoi on y adhĂšre et comment s’en prĂ©munir ?
DĂ©sinformation, fake news : pourquoi on y adhĂšre et comment s’en prĂ©munir ?DĂ©sinformation, fake news : pourquoi on y adhĂšre et comment s’en prĂ©munir ?
DĂ©sinformation, fake news : pourquoi on y adhĂšre et comment s’en prĂ©munir ?
 
Livre blanc - Datavisualisation 10h11 - Mars 2015
Livre blanc - Datavisualisation 10h11 - Mars 2015Livre blanc - Datavisualisation 10h11 - Mars 2015
Livre blanc - Datavisualisation 10h11 - Mars 2015
 
SystÚmes d'information, société de l'information
SystÚmes d'information, société de l'informationSystÚmes d'information, société de l'information
SystÚmes d'information, société de l'information
 
Livre blanc information reseaux sociaux et innovation - jean-gabriel giraud
Livre blanc   information reseaux sociaux et innovation - jean-gabriel giraudLivre blanc   information reseaux sociaux et innovation - jean-gabriel giraud
Livre blanc information reseaux sociaux et innovation - jean-gabriel giraud
 
Le renseignement humain augmenté
Le renseignement humain augmentéLe renseignement humain augmenté
Le renseignement humain augmenté
 
Gestion de l’information à l’ùre de l’entreprise 2.0
Gestion de l’information à l’ùre de l’entreprise 2.0Gestion de l’information à l’ùre de l’entreprise 2.0
Gestion de l’information à l’ùre de l’entreprise 2.0
 
Identité numérique et e reputation
Identité numérique et e reputationIdentité numérique et e reputation
Identité numérique et e reputation
 
Pres 15jan13 machines a scandales
Pres 15jan13 machines a scandalesPres 15jan13 machines a scandales
Pres 15jan13 machines a scandales
 
Reputation day lingway
Reputation day  lingwayReputation day  lingway
Reputation day lingway
 
Avons-nous besoin d’infolabs ?
Avons-nous besoin d’infolabs ?Avons-nous besoin d’infolabs ?
Avons-nous besoin d’infolabs ?
 
Les données numériques : porte-paroles des citoyens dans un processus de conc...
Les données numériques : porte-paroles des citoyens dans un processus de conc...Les données numériques : porte-paroles des citoyens dans un processus de conc...
Les données numériques : porte-paroles des citoyens dans un processus de conc...
 
Open Data - Rencontre Bi-départementale des EPN 26-07
Open Data - Rencontre Bi-départementale des EPN 26-07Open Data - Rencontre Bi-départementale des EPN 26-07
Open Data - Rencontre Bi-départementale des EPN 26-07
 
MoviCamp la MYNE - oct 2018
MoviCamp la MYNE - oct 2018MoviCamp la MYNE - oct 2018
MoviCamp la MYNE - oct 2018
 
Livre blanc Artishoc : relation aux publics connecté(e)s
Livre blanc Artishoc : relation aux publics connecté(e)sLivre blanc Artishoc : relation aux publics connecté(e)s
Livre blanc Artishoc : relation aux publics connecté(e)s
 
BibliothÚques et données personnelles
BibliothÚques et données personnellesBibliothÚques et données personnelles
BibliothÚques et données personnelles
 
ContrÎle de ses données et écriture de soi
ContrÎle de ses données et écriture de soiContrÎle de ses données et écriture de soi
ContrÎle de ses données et écriture de soi
 
Movilab en 2020
Movilab en 2020Movilab en 2020
Movilab en 2020
 
Intelligence collective dans les environnements numériques : pourquoi et comm...
Intelligence collective dans les environnements numériques : pourquoi et comm...Intelligence collective dans les environnements numériques : pourquoi et comm...
Intelligence collective dans les environnements numériques : pourquoi et comm...
 

Mais de Fing

Présentation de la Musette numérique de l'actif (juillet 2017)
Présentation de la Musette numérique de l'actif (juillet 2017)Présentation de la Musette numérique de l'actif (juillet 2017)
Présentation de la Musette numérique de l'actif (juillet 2017)
Fing
 

Mais de Fing (20)

Guide methodologique Innovation Facteur 4 by La Fing
Guide methodologique Innovation Facteur 4 by La FingGuide methodologique Innovation Facteur 4 by La Fing
Guide methodologique Innovation Facteur 4 by La Fing
 
L'agenda pour un futur numérique et écologique (Fing, 2019)
L'agenda pour un futur numérique et écologique (Fing, 2019)L'agenda pour un futur numérique et écologique (Fing, 2019)
L'agenda pour un futur numérique et écologique (Fing, 2019)
 
Nos SystĂšmes by Fing : "Signaux Faibles"
Nos SystĂšmes by Fing : "Signaux Faibles"Nos SystĂšmes by Fing : "Signaux Faibles"
Nos SystĂšmes by Fing : "Signaux Faibles"
 
Nos SystĂšmes by Fing : "Kit d'auto-Ă©valuation des algorithmes"
Nos SystĂšmes by Fing : "Kit d'auto-Ă©valuation des algorithmes"Nos SystĂšmes by Fing : "Kit d'auto-Ă©valuation des algorithmes"
Nos SystĂšmes by Fing : "Kit d'auto-Ă©valuation des algorithmes"
 
Nos SystĂšme by Fing : "La taxe d'habitation"
Nos SystĂšme by Fing : "La taxe d'habitation"Nos SystĂšme by Fing : "La taxe d'habitation"
Nos SystĂšme by Fing : "La taxe d'habitation"
 
ANR_Capacity_SeminaireCloture_21092018
ANR_Capacity_SeminaireCloture_21092018ANR_Capacity_SeminaireCloture_21092018
ANR_Capacity_SeminaireCloture_21092018
 
SobriĂ©tĂ© NumĂ©rique - Fabrice Flipo @TransitionsÂČ
SobriĂ©tĂ© NumĂ©rique - Fabrice Flipo @TransitionsÂČSobriĂ©tĂ© NumĂ©rique - Fabrice Flipo @TransitionsÂČ
SobriĂ©tĂ© NumĂ©rique - Fabrice Flipo @TransitionsÂČ
 
L'Agenda pour le Futur de TransitionsÂČ / 3 juillet 2018, Paris, Le Square
L'Agenda pour le Futur de TransitionsÂČ / 3 juillet 2018, Paris, Le SquareL'Agenda pour le Futur de TransitionsÂČ / 3 juillet 2018, Paris, Le Square
L'Agenda pour le Futur de TransitionsÂČ / 3 juillet 2018, Paris, Le Square
 
Kit AgirLocal, le numérique au service des démarches environnementales de nos...
Kit AgirLocal, le numérique au service des démarches environnementales de nos...Kit AgirLocal, le numérique au service des démarches environnementales de nos...
Kit AgirLocal, le numérique au service des démarches environnementales de nos...
 
Les Transformations du travail à l'Úre numérique - Fing
Les Transformations du travail à l'Úre numérique - Fing Les Transformations du travail à l'Úre numérique - Fing
Les Transformations du travail à l'Úre numérique - Fing
 
Plan d'action de la Fing en 2018
Plan d'action de la Fing en 2018Plan d'action de la Fing en 2018
Plan d'action de la Fing en 2018
 
Crise de l'emploi, de l'entreprise, du travail... la faute aux technologies ?
Crise de l'emploi, de l'entreprise, du travail... la faute aux technologies ?Crise de l'emploi, de l'entreprise, du travail... la faute aux technologies ?
Crise de l'emploi, de l'entreprise, du travail... la faute aux technologies ?
 
Cahier d'enjeux "Questions Numériques" Think Small
Cahier d'enjeux "Questions Numériques" Think SmallCahier d'enjeux "Questions Numériques" Think Small
Cahier d'enjeux "Questions Numériques" Think Small
 
Pour un rétro-design de l'attention
Pour un rétro-design de l'attentionPour un rétro-design de l'attention
Pour un rétro-design de l'attention
 
Présentation de la Musette numérique de l'actif (juillet 2017)
Présentation de la Musette numérique de l'actif (juillet 2017)Présentation de la Musette numérique de l'actif (juillet 2017)
Présentation de la Musette numérique de l'actif (juillet 2017)
 
Innovation facteur 4, journée Agenda du Futur le 04/07/17
Innovation facteur 4, journée Agenda du Futur le 04/07/17Innovation facteur 4, journée Agenda du Futur le 04/07/17
Innovation facteur 4, journée Agenda du Futur le 04/07/17
 
Pistes d'innovation Nos SystĂšmes (version de travail)
Pistes d'innovation Nos SystĂšmes (version de travail)Pistes d'innovation Nos SystĂšmes (version de travail)
Pistes d'innovation Nos SystĂšmes (version de travail)
 
Daniel Kaplan - TransitionsÂČ / "Agenda pour le Futur" - Open Conference, 23 m...
Daniel Kaplan - TransitionsÂČ / "Agenda pour le Futur" - Open Conference, 23 m...Daniel Kaplan - TransitionsÂČ / "Agenda pour le Futur" - Open Conference, 23 m...
Daniel Kaplan - TransitionsÂČ / "Agenda pour le Futur" - Open Conference, 23 m...
 
Pierre-Yves Longaretti - TransitionsÂČ / "Agenda pour le Futur" - Open Confere...
Pierre-Yves Longaretti - TransitionsÂČ / "Agenda pour le Futur" - Open Confere...Pierre-Yves Longaretti - TransitionsÂČ / "Agenda pour le Futur" - Open Confere...
Pierre-Yves Longaretti - TransitionsÂČ / "Agenda pour le Futur" - Open Confere...
 
Projet Open Source Ecology - TransitionsÂČ / "Agenda pour le Futur" - Open Con...
Projet Open Source Ecology - TransitionsÂČ / "Agenda pour le Futur" - Open Con...Projet Open Source Ecology - TransitionsÂČ / "Agenda pour le Futur" - Open Con...
Projet Open Source Ecology - TransitionsÂČ / "Agenda pour le Futur" - Open Con...
 

Atelier1- Groupe national 11 avril 0

  • 1. INFOLABDĂ©velopper une «culture de la donnĂ©e» au service des entreprises & des acteurs du territoire. ATELIER 1
  • 2.
  • 3. Groupe de travail national 11 avril 2013 - Atelier 1 La Campagne Infolab a Ă©tĂ© lancĂ©e le jeudi 11 avril Ă  l’oc- casion de la premiĂšre rencontre du groupe de travail national, portant sur le thĂšme « Culture de la donnĂ©e et mĂ©diations ». Acteurs associatifs (Libertic, Open Street Map, collectifs citoyens Open Data Tours, Poitiers, Les Petits-DĂ©brouillards, DĂ©cider Ensemble, La Fonderie
), membres de collectivitĂ©s territoriales (RĂ©gion PACA, CommunautĂ© urbaine de Bor- deaux, CG Gironde, CG Hauts-de-Seine, CG Manche, Mairies de Paris et de Rennes
) et grands comptes (Alcatel Lucent, La Poste, La Caisse des dĂ©pĂŽts, Gemalto
) Ă©taient rassemblĂ©s pour entamer une rĂ©flexion sur la culture de la donnĂ©e et ses diffĂ©rentes formes de mĂ©diation. Retour sur cette journĂ©e
 Keywords - INFOLAB, OPENDATA, MEDIATIONS, CULTURE. 06 2011 INVENTONS ENSEMBLE L’INFOLAB INTRODUCTION
  • 4. Groupe de travail national 11 avril 2013 - Atelier 1 I. II. III. IV. V. VI. FORGEONS UNE CULTURE DE LA DONNÉE ! Par Simon CHIGNARD RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE Par Loup CELLARD, Fing METTRE LES DONNÉES EN DÉBAT Par Amandine BRUGIÈRE, Fing COMMENT CONSTRUIRE UN GUIDE DES MÉDIATIONS Par Fabienne GUIBÉ, Fing LA MÉDIATION, UNE NOTION FLOUE, VICTIME DE SON SUCCÈS Par Faustine BOUGRO, Fing LA CULTURE DES DONNÉES EN ENTREPRISE Par Claire GALLON, LiberTIC INTRODUCTION SOMMAIRE CONTACT INVENTONS ENSEMBLE L’INFOLAB SOMMAINE
  • 5. Groupe de travail national 11 avril 2013 - Atelier 1 FORGEONS UNE CULTURE DE LA DONNÉE ! Par Simon CHIGNARD
  • 6. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB FORGEONS UNE CULTURE DE LA DONNÉE C’est en forgeant que l’on devient forgeron ». Le proverbe aurait pu figurer en sous-titre du premier atelier national Infolab. Il traduit l’idĂ©e que la comprĂ©hension des enjeux de la donnĂ©e passe aussi (avant tout ?) par notre capacitĂ© Ă  mettre les mains dans le cambouis. Nous avons donc beaucoup forgĂ© lors de cette aprĂšs-midi. La donnĂ©e (notre matiĂšre premiĂšre), nous l’avons manipulĂ©e, chauffĂ©e, tordue pour essayer d’en tirer quelques idĂ©es sur la culture de la donnĂ©e et sa (nĂ©ces- saire) mĂ©diation. Les sujets Ă©tudiĂ©s Ă©taient diffĂ©rents : les donnĂ©es d’entreprises, les sta- tistiques de l’emploi et de l’activitĂ© Ă©conomique, les prĂ©noms les plus populaires
 Mais au-delĂ  de cette apparente diversitĂ©, les questions se ressemblent : Comment traduire les questions en donnĂ©es ? Comment aborder avec un regard critique les donnĂ©es disponibles ? QUELLES COMPÉTENCES REQUISES POUR LES FAIRE PARLER ? C’est en forgeant que l’on devient forgeron. Mais que devient-on en manipulant de la donnĂ©e ? La question du rĂŽle des mĂ©diateurs est posĂ©e ici, de mĂȘme que celle de l’expertise. Les sachants d’un domaine (ceux qui maĂźtrisent un sujet ou une thĂ©matique) vont-ils ĂȘtre supplantĂ©s par les experts de la manipulation des donnĂ©es ? Au moment oĂč data-scien- tist devient un mĂ©tier sexy, cette mise en pratique aura pu dĂ©montrer que la donnĂ©e n’est pas rĂ©servĂ©e aux forts en maths
 AprĂšs le bruit et le chaleur de la forge, nous avons souhaitĂ© prendre un peu de recul, pour rĂ©-interroger la notion-mĂȘme de mĂ©diation (le forgeron est
  • 7. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB FORGEONS UNE CULTURE DE LA DONNÉE devenu praticien rĂ©flexif 
). Qu’est-ce que ce terme veut dire ? Qui sont les acteurs et les objets de la mĂ©diation ? Sarah Labelle nous a proposĂ© un Ă©clairage, de la mĂ©diation culturelle Ă  la sociologie de l’innovation, souli- gnant la diversitĂ© des objets et des processus de mĂ©diation existants et envisageables. L’échange qui a suivi aura mĂȘme permis d’imaginer un pos- sible “MusĂ©e de la donnĂ©e”, ses expositions permanentes et temporaires, ses ateliers de dĂ©couverte et de co-construction. La rencontre s’est conclue par la prĂ©sentation d’un premier inventaire des outils et des dispositifs d’animation et de mĂ©diation autour de la donnĂ©e. Un travail qui se pour- suivra au cours des prochains mois pour alimenter les expĂ©rimentations territoriales et le guide des mĂ©diations. “Practice makes perfect” disent nos voisins d’outre-manche : ce premier atelier n’est que la premiĂšre Ă©tape de notre parcours Infolab, nous aurons donc l’occasion de remettre le sujet de la culture de la donnĂ©e sur la table
 Simon CHIGNARD, Consultant Open Data, http://donneesouvertes.info
  • 8. Groupe de travail national 11 avril 2013 - Atelier 1 RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE Par Loup Cellard, Fing
  • 9. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE Afin de mieux comprendre le contexte et les limites de l’ouverture d’un jeu de donnĂ©es, le thĂšme de l’atelier proposĂ© par Simon Chignard était particuliĂšrement bien choisi : les prĂ©noms. Tout le monde en a un, tout le monde sait ce que cela reprĂ©sente, et c’est une notion centrĂ©e sur l’hu- main et l’identitĂ©, de quoi rassurer les data-sceptiques, et de quoi faire vibrer les data-dandys. L’entrĂ©e en matiĂšre dans le sujet s’est faite grĂące Ă  plusieurs articles de presse qui mettaient en Ă©vidence les modes de mĂ©diatisation du sujet : le prĂ©nom comme bien de mode, la recherche du prĂ©nom rare, les stĂ©rĂ©o- types Ă©ditoriaux vĂ©hiculĂ©s par la presse
 AprĂšs analyse de divers corpus de donnĂ©es sur les prĂ©noms (INSEE, data.gouv, fichier d’état civil
 jeu de donnĂ©es de Paris et Rennes), il est aisĂ© de dĂ©celer les biais de ces jeux qui limitent leurs utilisations possibles. En effet, les jeux de donnĂ©es ne sont pas identiques entre collectivitĂ©s territoriales, la comparaison entre territoires devient alors difficile : une normalisation serait bĂ©nĂ©fique, mais qui peut la porter ? QUI EST LE GARANT ? Il y a un effet boĂźte noire sur la constitution des jeux de donnĂ©es et un manque de normes  institutionnelles qui pourrait rĂ©gler ces problĂšmes. Il serait Ă©galement  intĂ©ressant de prĂ©ciser les limites de chaque jeux de donnĂ©es (ce qu’ils ne contiennent pas). Par exemple, dans les jeux de don- nĂ©es des prĂ©noms de l’INSEE, l’occurrence minimale (prĂ©nom rare) pour
  • 10. Groupe de travail national 11 avril 2013 - Atelier 1 qu’un prĂ©nom soit inscrit est de 3 (si un prĂ©nom X a Ă©tĂ© donnĂ© que 2 fois sur ce territoire il n’apparaĂźtra pas dans le fichier). Sur le portail de la ville de Paris, elle est de 5. Pourquoi ce choix et cette diffĂ©rence? Qui fixe la norme (ou Ă  dĂ©faut une pratique commune) ? EST-CE LE RÔLE D’ETALAB ? Bien souvent, les problĂšmes de rĂ©utilisation de donnĂ©es viennent du fait que l’on ignore le contexte de production de ces mĂȘmes donnĂ©es. Il nous manque des informations autour de la constitution des jeux : les mĂ©ta- donnĂ©es. Dans les donnĂ©es des prĂ©noms d’une ville, on ne sait si la date d’inscription dans le jeu de donnĂ©es est la date de naissance de l’enfant ou la date de son enregistrement d’état civil ? Les enfants nĂ©s autour du 31 dĂ©cembre sont certaines fois enregistrĂ©s sur l’annĂ©e suivante, dĂ©lai d’enregistrement oblige ! Les diffĂ©rences d’orthographe, de prononciation et de genre des prĂ©noms ne sont pas prises en compte dans la constitution des jeux de donnĂ©es. Lorsque l’on veut analyser le prĂ©nom Justin comme indicateur social, on ne sait s’il se prononce Ă  la française ou Ă  l’amĂ©ricaine, et si du coup il se rĂ©- fĂšre davantage Ă  Justin (de La Borderie), prĂ©nom Ă  connotation bourgeoise, ou Ă  Justin (Bieber), jeune chanteur de pop amĂ©ricaine reprĂ©sentatif d’une culture populaire transnationale. Les prĂ©noms sont des donnĂ©es relative- ment simples et on s’aperçoit qu’elles posent dĂ©jĂ  un certain nombre de problĂšmes: quel degrĂ© de complexitĂ© vont avoir des jeux de donnĂ©es de rĂ©sultats financiers ou de santĂ© publique ?! INVENTONS ENSEMBLE L’INFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE
  • 11. Groupe de travail national 11 avril 2013 - Atelier 1 AprĂšs cette analyse critique des donnĂ©es, nous avons identifiĂ© les princi- paux cas de rĂ©utilisation : les jeux de donnĂ©es des prĂ©noms peuvent ĂȘtre utilisĂ©s pour montrer la diversitĂ© des prĂ©noms (relativiser l’utilisation des prĂ©noms rares, montrer la diversitĂ© des prĂ©noms dans le temps), rĂ©vĂ©ler les modes dans l’utilisation de tel ou tel prĂ©nom (orthographe, influence d’un fait d’actualitĂ©, d’un personnage de fiction, d’une star) ou encore uti- liser le prĂ©nom comme indicateur social ou comme rĂ©vĂ©lateur en pĂ©riode de crise. EST-ON PLUS ORIGINAL DANS LE CHOIX DE SON PRÉNOM EN PÉRIODE DE CROISSANCE OU D’AUSTÉRITÉ ? TrĂšs pĂ©dagogique, cet atelier permet de comprendre les Ă©tapes clĂ©s de l’utilisation d’un jeu de donnĂ©es : sa rĂ©ception, l’analyse de ses potentia- litĂ©s, le dĂ©frichage Ă  l’intĂ©rieur du jeu, les possibilitĂ©s d’enrichissement et de rĂ©utilisation. Simon Chignard insiste Ă©galement sur l’importance des mĂ©tadonnĂ©es dans la publication des jeux de donnĂ©es : il faut davantage documenter le contexte de production des jeux. On comprend alors les bonnes questions Ă  se poser avant d’envisager toute production de sens avec un jeu de donnĂ©es : Qu’est ce qui est rĂ©el- lement prĂ©sent dans le fichier ? Comment a-t-il Ă©tĂ© constitué ? Le fichier reprĂ©sente-t-il l’ensemble du corpus Ă  Ă©tudier ? Loup CELLARD, Assistant Chef de Projet, Fing INVENTONS ENSEMBLE L’INFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNÉE
  • 12. Groupe de travail national 11 avril 2013 - Atelier 1 PREMIERS BÉBÉS 2013Source : http://fr.slideshare.net/schignard/infolab-les-prnoms-une-donne-populaire PAR LE TÉLÉGRAMME
  • 13. Groupe de travail national 11 avril 2013 - Atelier 1 METTRE LES DONNÉES EN DÉBAT Par Amandine BRUGIÈRE.
  • 14. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT Dans ce 2e atelier main dans le cambouis, Vincent Mandinaud de  l’ANACT  et HervĂ© Paris d’AlterCarto/CitĂ© Publique  ont prĂ©sentĂ© une mĂ©thode originale - et Ă©prouvĂ©e ! - de mise en discussion des donnĂ©es articulant des approches quantitatives et qualitatives des donnĂ©es. Pour bien comprendre la dĂ©marche, revenons sur les caractĂ©ristiques des ac- teurs en prĂ©sence.  L’ANACT (Agence Nationale pour l’AmĂ©lioration des Conditions de Travail) est un EPA sous tutelle du ministĂšre du travail, et les organisations pa- tronales et syndicales dites reprĂ©sentatives siĂšgent Ă  son conseil d’ad- ministration. L’ANACT forme un rĂ©seau, avec 26 ARACT (Associations RĂ©gionales pour l’AmĂ©lioration des Conditions de Travail) implantĂ©es dans chaque rĂ©gion de France. La vocation de ce rĂ©seau est d’aider les organisa- tions Ă  dĂ©velopper des projets innovants touchant au travail, dans le cadre d’un dialogue social constructif, pour amĂ©liorer Ă  la fois la situation des salariĂ©s et l’efficacitĂ© des entreprises. Aussi, ces derniĂšres annĂ©es, le rĂ©seau ANACT a dĂ©ployĂ© des outils de car- tographie statisitique et expĂ©rimentĂ© une mĂ©thodologie d’enquĂȘte sur les contextes de travail dans les territoires. MobilisĂ©s et Ă©prouvĂ©s par des acteurs territoriaux (ARACT, ComitĂ©s de Bassin d’Emploi; Maison de l’Em- ploi et de la Formation Professionelle, etc.), ces outils de rapprochement cartographique de donnĂ©es et ces methodes d’investigation leur ont per- mis d’alimenter la reflexion, d’affiner la problĂ©matisation des contextes d’action face aux mutations du travail dans les enterprises et les terri- toires. Le travail de mediation que rĂ©alisent ces groupes d’acteurs  table sur la mise en scĂšne et l’analyse de donnĂ©es de statistiques publiques, couplĂ©es, articulĂ©es Ă  des savoirs d’expĂ©riences, des connaissances de
  • 15. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT terrain. Le positionnement - presque Ă©thique - de l’agence est de ne pas livrer de corrĂ©lations statistiques toutes faites aux acteurs, mais de pro- poser des cadres de travail soutenant la capacitĂ© des acteurs (non experts des donnĂ©es) Ă  formuler de corrĂ©lations dĂ©libĂ©ratives, soutenues par des formes d’enquĂȘtes collaboratives, de partage d’expĂ©riences et d’expertise collective. Sur son chemin lyonnais, l’ANACT a croisĂ© le bureau d’étude  CitĂ© Pu- blique  (concepteur et dĂ©veloppeur de l’application web de cartographie statistique) et l’association  AlterCarto  : une association engagĂ©e dans les problĂ©matiques de dĂ©bat citoyen, prĂ©occupĂ©e par le dĂ©veloppement de technologies dĂ©mocratiques et plus spĂ©cialement de cartes rĂ©flexives. Cette rencontre a ouvert sur une collaboration fructueuse entre les orga- nismes et sur la co-Ă©laboration d’un projet nommé ATTLAS, reprenant la suite technologique Suite Cairo. ATTLAS se base sur la rĂ©utilisation des donnĂ©es publiques gĂ©oloca- lisĂ©es et propose une lecture nouvelle des contextes de travail dans les territoires, complĂ©mentaire aux approches sectorielles traditionnelles. La dĂ©marche d’investigation proposĂ©e aux partenaires, soutenue par l’uti- lisation de modules cartographiques dit « PageCarto », consiste en une plongĂ©e dans les problĂ©matiques des territoires, Ă©tayĂ©e de donnĂ©es, mĂ©- diĂ©e par des cartes, des graphiques et des commentaires.  Cette dĂ©marche articule trois types de compĂ©tences : - l’expertise mĂ©tier et terrain des clients ou partenaires; - l’expertise mĂ©tier du rĂ©seau ANACT sur la champ problĂ©matique du tra- vail et des changements technologiques et organisationnels; - l’expertise socio-technique et cartographique d’AlterCarto. 
  • 16. Groupe de travail national 11 avril 2013 - Atelier 1 ATTLASSource : http://www.anact.fr/web/services/attlas PAR ANACT
  • 17. Groupe de travail national 11 avril 2013 - Atelier 1 Les intervenants dĂ©finissent leur rĂŽle comme celui d’un appui Ă  la pro- blĂ©matisation, d’une expertise de facilitation concourant Ă  l’encapacitation des acteurs concernĂ©s sur les phĂ©nomĂšnes explorĂ©s. L’objectif est non pas de rĂ©soudre les problĂšmes des acteurs Ă  leur place, mais de mettre en place un cadre d’usages facilitant le partage des expĂ©riences, la mutuali- sation des ressources pour renouveler les capacitĂ©s d’agir sur les phĂ©no- mĂšnes. Une question que soulĂšve cet attelage de compĂ©tences concerne la spĂ©- cialisation thĂ©matique des experts de la donnĂ©e : peut-on jouer un rĂŽle de datascientist pour des tiers, sans comprendre les problĂ©matiques du domaine, les implicites du langage, les conflits d’acteurs, etc. ? LES MÉDIATIONS À LA DONNÉE DOIVENT-ELLES ÊTRE SPÉCIALISÉES PAR MÉTIER ? La dĂ©marche se construit en deux temps principaux. Le back office comprend : - la problĂ©matisation du sujet : de quoi parle-t-on ? Objectif : affiner les questions, dĂ©finir des problĂ©matiques communes ; - le choix des pĂ©rimĂštres : discussion autour des Ă©chelles, des cartes, des reprĂ©sentations (quelle gĂ©ographie des donnĂ©es pour parler d’un pays – sous-entitĂ© rĂ©gionale)  : les frontiĂšres administratives des donnĂ©es cachent parfois le vĂ©ritable Ă©talement gĂ©ographique des problĂ©matiques Ă©conomiques et sociales. - la dĂ©finition d’une stratĂ©gie de collecte de donnĂ©es (trouver les donnĂ©es disponibles rĂ©pondant Ă  la problĂ©matique soulevĂ©e, qu’elle soit publique INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
  • 18. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT gratuite et ouverte, ou publique et payante).  - la constitution d’un cahier de donnĂ©es ; - le bidouillage des donnĂ©es pour passer des tableaux aux cartes. Cette Ă©tape est longue, chronophage et, aux dires des instigateurs eux- mĂȘmes, la plus laborieuse. Les clients ou partenaires n’ont pas toujours le temps de rĂ©ellement s’y plonger. La tentation est forte de vouloir recevoir le prĂȘt-Ă -consommer, et de s’absoudre de la cuisine prĂ©alable. Pourtant cette Ă©tape une a une plus-value didactique forte : elle fonctionne comme une formation, qui permet l’acculturation des acteurs Ă  des formes induc- tives de raisonnement, Ă  la complexitĂ© de la reprĂ©sentation des phĂ©no- mĂšnes Ă©conomiques et sociaux, au caractĂšre construit des donnĂ©es qu’on cherche Ă  reprĂ©senter et mobiliser. La mise en discussion des cartes comprend : On est Ă  ce moment-lĂ  face au produit prĂȘt Ă  l’usage. Mais les choses ne se font pas toutes seules pour autant. La mise en discussion des cartes et des donnĂ©es s’opĂšre d’une part grĂące au rĂŽle de tiers que jouent l’ANACT et AlterCarto. D’autre part un principe prĂ©vaut pas de carte sans commen- taire. Toutes les donnĂ©es reprĂ©sentĂ©es font ainsi l’objet de discussions, de corrĂ©lations commentĂ©es, ce qu’on pourrait appeler l’hypertextualitĂ© des donnĂ©es et des cartes. Les modules « PageCarto » offrent une fonction de prise de notes dynamique, intĂ©grant les commentaires aux cartes et gĂ©nĂ©rant ensuite, si besoin, de nouvelles reprĂ©sentations plus adĂ©quates.  RMQ : Les donnĂ©es utilisĂ©es sont issues de diffĂ©rentes sources. Le recen- sement de la population et le fichier connaissance locale de l’appareil pro- ductif de l’INSEE sont jusqu’alors les sources principales pour constituer
  • 19. Groupe de travail national 11 avril 2013 - Atelier 1 les jeux de donnĂ©es rĂ©utilisĂ©es. Des donnĂ©es provenant de la DARES, de PĂŽle Emploi, ou encore de la CNAM-TS ont pu ĂȘtre mobilisĂ©es. Les donnĂ©es sont Ă  la fois remises Ă  disposition sous format tabloĂŻde facilitant le trai- tement machine et reprĂ©sentĂ©es sous formes de mĂ©tadonnĂ©es cartogra- phiques. Les cartes, les supports et les textes de commentaires sont sous licence GNU GPL.  CULTURE DE LA DONNÉE OU MÉDIATION ? La dĂ©marche mise en oeuvre participe Ă  dĂ©velopper une culture de la don- nĂ©e auprĂšs des acteurs impliquĂ©s. C’est un des constats qui ressortait de cet atelier. « DĂ©velopper une culture de la donnĂ©e au service des entre- prises et des territoires consiste bien Ă  relancer un processus de mĂ©diation, Ă  reconfigurer la relation entre producteurs et rĂ©utilisateurs et renouveler les usages » reconnaissait Vincent Mandinaud. MĂ©diation et culture de la donnĂ©e pourraient bien ĂȘtre indissociables
 « Jusqu’à prĂ©sent les spĂ©- cialistes de la donnĂ©e (statisticiens, acteurs publics, etc.) ont privatisĂ© les mĂ©diations  : la production, la collecte et l’analyse des donnĂ©es ne pas- saient que par eux. L’enjeu de l’Open Data aujourd’hui est donc autant un enjeu d’acculturation Ă  la donnĂ©e par un plus grand nombre, qu’un enjeu de dĂ©sappropriation par ceux qui, jusqu’à prĂ©sent, avait la main mise dessus », concluaient les intervenants. UNE MÉTHODE POSSIBLE POUR DES INFOLABS CITOYENS ?... INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
  • 20. Groupe de travail national 11 avril 2013 - Atelier 1 Cette approche de co-Ă©laboration et de discussion des diagnostics terri- toriaux avec les acteurs concernĂ©s faisait, pour notre petite Ă©quipe Info- lab, largement Ă©cho aux scĂ©narios – fictifs – dĂ©veloppĂ©s avec l’associa- tion DĂ©cider Ensemble, dans le cadre du rapport « Ouvertures des donnĂ©es publiques et participation » en 2012. Dans chacun des 3 scĂ©narios (CNDP / Plan Climat Energie / AmĂ©nagement urbain) en effet, un dispositif de type Infolab s’avĂ©rait nĂ©cessaire : pour rĂ©unir, partager et mettre en discussion les donnĂ©es. Le dispositif fonctionnait autour d’une rĂ©union de compĂ©- tences techniques et de traducteur/formateur/mĂ©diateur. Est-ce que la mĂ©thodologie dĂ©veloppĂ©e par l’ANACT, CitĂ© Publique et Al- terCarto pourrait fonctionner dans le cadre d’une concertation publique ? L’acculturation des acteurs (qu’ils soit professionnels ou citoyens) Ă  la manipulation de donnĂ©es est-elle possible sur un temps court ? Sur tout type de population ? Ou faudrait-il imaginer qu’un panel d’acteurs, choisi au hasard, participe Ă  un processus long Ă  l’instar des jurĂ©s d’assises ? En la matiĂšre, tout reste Ă  expĂ©rimenter
 ! A noter qu’à Lyon, toujours,  la municipalitĂ© forme dĂ©jĂ  les chargĂ©s de mis- sions de dĂ©veloppement local Ă  des modes de concertation appuyĂ©s par la mĂȘme technologie, et selon une approche mĂ©thodologique similaire, pour entredĂ©finir, avec les comitĂ©s de quartier, les zones prioritaires dans le cadre des Contrats Urbains de CohĂ©sion Sociale ; et pour mettre en place un observatoire de la santĂ© prĂ©figurant le futur contrat local de santĂ© entre la Ville et l’ARS. Pour en savoir plus sur ces initiatives : sven.grillet@mairie-lyon.fr Amandine BRUGIÈRE, ChargĂ©e de missions, Fing INVENTONS ENSEMBLE L’INFOLAB METTRE LES DONNÉES EN DÉBAT
  • 21. Groupe de travail national 11 avril 2013 - Atelier 1 COMMENT CONSTRUIRE UN GUIDE DES MÉDIATIONS Quels outils/mĂ©thodes/animations autour des donnĂ©es existe-t-il dĂ©jĂ  ? Par Fabienne GUIBÉ
  • 22. Groupe de travail national 11 avril 2013 - Atelier 1 La derniĂšre prĂ©sentation de la journĂ©e, menĂ©e par Amandine Bru- giĂšre (FING), portait sur l’analyse de la veille qu’a initiĂ©e, depuis 2 mois, l’équipe INFOLAB (voir sur Diigo le fil de veille, ainsi qu’ici le tableau par- tagĂ© oĂč sont rĂ©fĂ©rencĂ©s plus d’une centaine de dispositifs de mĂ©diation, qu’ils soient formats d’animation, outils, mĂ©thodes
L’objectif n’étant pas de capter l’exhaustivitĂ© mais la diversitĂ© des exemples). Il s’agissait de livrer une premiĂšre photographie de ce qui est directement accessible sur le web : Si on cherche aujourd’hui Ă  exploiter des donnĂ©es, quelles soient ouvertes, fermĂ©es, personnelles ou publiques, quels sont les outils, les mĂ©thodes, les formats d’animation documentĂ©s et acces- sibles sur le web ? QU’EST-CE QUI SE TROUVE À PORTÉE DE MAIN ? Cette analyse de la veille s’est structurĂ©e autour : - du type de mĂ©diation dĂ©veloppĂ©e. Est-ce que l’on est face Ă  des outils, des mĂ©thodologies, des formats d’animation, des services, des ressources documentaires, des serious game, des plateformes
?         - du type d’actions possibles. Qu’est-ce que cela permet de faire ? Sensibi- liser, explorer, imaginer, partager, analyser
? Les catĂ©gories qui ont Ă©tĂ© retenues ici ne sont pas des catĂ©gories stabili- sĂ©es. Le but de la prĂ©sentation de ce work-in-progress Ă©tait de faire rĂ©agir les participants. Ainsi n’hĂ©sitez pas Ă  complĂ©ter le tableau, Ă  le commen- ter, Ă  partager les ressources identifiĂ©es, Ă  nous contacter pour en discu- ter. Ce travail s’enrichira au fil des rencontres, grĂące Ă  vos contributions. INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 23. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION SENSIBILISER La sensibilisation aux enjeux de la donnĂ©e reste, visiblement, un domaine Ă  investir : peu d’exemples Ă©mergent, relativement aux autres catĂ©gories d’actions. Ceux trouvĂ©s montraient cependant une grande diversitĂ© de formes. Cela allait des ateliers rennais de sensibilisation des enfants Ă  la manipula- tion et la reprĂ©sentation de donnĂ©es, au serious game sur les donnĂ©es ou- vertes du budget de l’Etat, ou encore l’enquĂȘte Orange-lab-OWNI-FING « OĂč habitez-vous vraiment ? », sorte de quizz – Ă  base de donnĂ©es ouvertes - testant les connaissances territoriales des habitants. Les plateformes Openstreetmap ou OpenfoodFacts (dĂ©)montrant facilement la force du crowdsourcing ( la production collaborative de donnĂ©es). Un exemple particuliĂšrement pĂ©dagogique – mais s’adressant tout de mĂȘme Ă  un public d’initiĂ©s – est la School of Data de l’association OKFN. C’est une des seules initiatives proposant des ressources documentaires et mĂ©thodologiques. On le voit, ces formes de mĂ©diation dĂ©veloppent chacune des pĂ©dagogies trĂšs diffĂ©rentes, face Ă  la complexitĂ© des donnĂ©es. Elles n’hĂ©sitent pas Ă  investir le ludique et s’adressent Ă  tout type de public.
  • 24. Groupe de travail national 11 avril 2013 - Atelier 1 OPEN FOOD FACTSSource : http://www.openfoodfacts.org PAR STÉPHANE GIGANDET
  • 25. Groupe de travail national 11 avril 2013 - Atelier 1 IMAGINER ET PRODUIRE DES USAGES Avoir des donnĂ©es Ă  disposition est nĂ©cessaire mais pas suffisant. Encore faut-il avoir des idĂ©es de (rĂ©)utilisation des donnĂ©es, et souvent faut-il mĂȘme stimuler les rĂ©utilisateurs potentiels. Dans ce champ-lĂ , les exemples trouvĂ©s relĂšvent essentiellement de l’ani- mation : Concours ou appel Ă  projet, hackathon, dataconnexion, Data- apĂ©ro ou Data-Tuesday. On est dans le champ de l’incitation, de la stimu- lation, de la recherche de sĂ©rendipitĂ©, ou de l’innovation ouverte. Quatre caractĂ©ristiques communes apparaissent : - Ces formats d’animation s’adressent Ă  des publics relativement avertis : Innovateurs, start-upeurs, designers, dĂ©veloppeurs
              - Ce sont majoritairement des exercices collectifs : la crĂ©ativitĂ© dĂ©coule-t- elle du croisement de regard ? - Ils sont d’une durĂ©e relative. - Ils s’adaptent Ă  des donnĂ©es ouvertes comme « propriĂ©taires ».            A noter toutefois un outil de sĂ©rendipitĂ© : Creadata, dĂ©veloppĂ© par Bas- tien Kerspern proposant des idĂ©es de mash-up alĂ©atoires entre les jeux de donnĂ©es mis Ă  disposition par la ville de Nantes.   INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 26. Groupe de travail national 11 avril 2013 - Atelier 1 CREADATASource : http://www.creadata.fr PAR BASTIEN KERSPERN
  • 27. Groupe de travail national 11 avril 2013 - Atelier 1 CUISINER Une fois que les donnĂ©es et les idĂ©es sont lĂ , s’ouvre alors un champ d’ac- tions relativement techniques : RĂ©cupĂ©rer les donnĂ©es (EasyOpenData) les stocker, les nettoyer (Open Refine, DataWrangler), les anonymiser (norme ISO de pseudonymisation), les croiser (DataLift), etc. Ce champ-lĂ  foi- sonne d’outils destinĂ©s Ă  des publics trĂšs spĂ©cialistes. Beaucoup d’entre eux Ă©mergent du champ des donnĂ©es personnelles : du cĂŽtĂ© du VRM Vendor Relationship Manager (My Personal Vault), du quan- tified self – la mesure de soi (BodyMedia), ou des pratiques de dĂ©veloppe- ment durable (Green Button Data), pour ne citer que ces exemples-lĂ . La relation aux donnĂ©es peut mĂȘme ĂȘtre mĂ©diĂ©e par des objets (Withings).   INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 28. Groupe de travail national 11 avril 2013 - Atelier 1 GREEN BUTTONSource : http://www.greenbuttondata.org PAR WHITE HOUSE
  • 29. Groupe de travail national 11 avril 2013 - Atelier 1 PARTAGER Quant on cherche Ă  partager des donnĂ©es brutes, ou Ă  communiquer sur leur analyse, plusieurs solutions s’offrent Ă  nous : La plus connue d’entre elle est la datavisualisation. ÉnormĂ©ment de solutions techniques existent en la matiĂšre : Voir la trĂšs riche boĂźte Ă  outils d’ExpoViz (made in La Fonde- rie). Ces dataviz vont du graphique / diagramme classiques (Google Image Chart) Ă  des reprĂ©sentations plus sophistiquĂ©es (Treemap, graphe du web, cartographie). Tous ces outils nĂ©cessitent un haut niveau de compĂ©tences techniques. D’autres outils permettent de partager des donnĂ©es avec des tiers, en maĂźtrisant, autant que possible, les termes de l’échange. LĂ  encore le champ des donnĂ©es personnelles est riche (Mine!Project, Personal.com). Dans le champ des donnĂ©es de santĂ©, on trouve des plateformes de par- tage collectif de donnĂ©es (Curetogether, Asthmapolis). INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 30. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION GOOGLE IMAGE CHARTSource : http://www.imagecharteditor.appspot.com PAR GOOGLE
  • 31. Groupe de travail national 11 avril 2013 - Atelier 1 ANALYSER Dans le champ de l’analyse des donnĂ©es, ce qu’on identifie comme outils (Precog, Continuuity, StatMix, Coheris Liberty, Google Prediction API), pla- teformes de services (DataPublica, Qunb, Captain Dash) offrent la possibi- litĂ© de construire des modĂšles dĂ©cisionnels, voire des modĂšles prĂ©dictifs, via des interfaces finales, des tableaux de bord. La complexitĂ© des opĂ©ra- tions sous-jacentes liĂ©es au traitement des donnĂ©es n’est pas explicitĂ©e : Comment s’opĂšrent les corrĂ©lations entre jeux de donnĂ©es, quels sont les considĂ©rations, les choix qui prĂ©valent aux datavisualisations, aux ta- bleaux de bord ? Comment se font les modĂ©lisations, les simulations ? OĂč se trouve la part de dĂ©cision humaine dans les process ? Les pondĂ©rations dĂ©pendent-elles essentiellement des profils techniques ? A l’opposĂ©, dans le champ des sciences humaines, Ă©mergent des mĂ©tho- dologies – et outils – permettant de mettre les donnĂ©es en dĂ©bat : la mĂ©- thode dĂ©veloppĂ©e par l’ANACT/AlterCarto autour de la plateforme ATTLAS montrait comment les acteurs pouvaient monter en compĂ©tences et opĂ©- rer leur propre corrĂ©lation de donnĂ©es. La mĂ©thode de cartographie des controverses, dĂ©veloppĂ©e par Bruno Latour, va aussi dans ce sens. Face Ă  des phĂ©nomĂšnes sociaux (scientifiques, techniques) non stabilisĂ©s, les cartographies des controverses mettent en visibilitĂ© diffĂ©rents points de vue qui s’opposent, afin de favoriser l’objectivitĂ© dans les prises de dĂ©ci- sion qui peuvent dĂ©couler. INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 32. Groupe de travail national 11 avril 2013 - Atelier 1 CAPTAIN DASHSource : http://www.captaindash.com PAR GILLES BABINET & BRUNO WALTHER
  • 33. Groupe de travail national 11 avril 2013 - Atelier 1 ET MAINTENANT, QUE FAISONS-NOUS ? Ce travail de recensement et d’analyse des formes de mĂ©diation existantes (qu’elles soient humaines, sous forme d’outils et de mĂ©thodologies, de ressources documentaires ou de services
) ne fait que commencer. Il se poursuivra jusqu’à la rentrĂ©e 2013. Livrer ce premier niveau de lecture Ă©tait instructif rien qu’au regard : de la nature des ressources disponibles : plus outils que ressources docu- mentaires ou mĂ©thodologiques ou ludiques ; du niveau requis de compĂ©- tences pour leur utilisation : du geek au dĂ©veloppeur professionnel, majo- ritairement.   Les donnĂ©es sont encore largement affaire de spĂ©cialistes
 On le savait. Quasiment tout reste Ă  faire en matiĂšre de dĂ©mocratisation des donnĂ©es et Ă  tout niveau : sensibilisation, information, formation, accompagne- ment, services. Heureusement, la campagne Infolab ne fait que commencer ! Fabienne GUIBÉ, Chef de projet, Fing. INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 34. Groupe de travail national 11 avril 2013 - Atelier 1 MÉDIATION : UNE NOTION FLOUE VICTIME DE SON SUCCÈS Par Faustine BOUGRO
  • 35. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION AprĂšs ces temps d’exploration, Sarah Labelle (maĂźtre de confĂ©- rence en SIC, Paris 13) a mis en lumiĂšre une nouvelle entrĂ©e dans l’éco- systĂšme de la donnĂ©e, celle de la mĂ©diation, notion floue victime de son succĂšs. Cette ouverture s’est rĂ©vĂ©lĂ©e ĂȘtre l’objet d’enjeux, qui dĂ©termine- ront l’évolution d’une culture de la donnĂ©e face aux transformations qui rythment notre sociĂ©tĂ©. La donnĂ©e dite brute transforme sa valeur dĂšs lors qu’elle est rendue intel- ligible et visualisĂ©e. Aussi, toute mise en forme de donnĂ©es, visant Ă  favo- riser la comprĂ©hension, construit une mĂ©diation, et c’est justement parce que le pouvoir de l’image semble plus immĂ©diat que celui d’un corpus de texte, que cette mĂ©diation doit ĂȘtre rĂ©flĂ©chie. Effectivement, la rĂ©utilisa- tion de donnĂ©es brutes en vue d’un traitement intelligent, engage nĂ©ces- sairement des objectifs diffĂ©rents de ceux qui ont prĂ©sidĂ© Ă  la collecte. En cela, toute forme ou processus de mĂ©diation reflĂšte la place que l’on souhaite donner Ă  l’objet mĂ©diĂ© dans son environnement. De fait, la notion de mĂ©diation nous incite Ă  rĂ©flĂ©chir, Ă  travers nos conceptions du statut des donnĂ©es dans la sociĂ©tĂ©, aux formes et processus que nous souhai- tons mettre en place. Ce dernier champ a ainsi su Ă©veiller notre attention quant aux problĂ©matiques soulevĂ©es qui esquissent de futurs champs d’action pour l’Infolab. Le premier repĂšre constitutif de cet Ă©cosystĂšme est la position humaine relative Ă  l’utilisation des diffĂ©rents dispositifs et aux rĂ©percussions de ces derniers sur l’appropriation et la production de sens. Le deuxiĂšme repĂšre significatif est le scĂ©nario d’usage engageant la participation, Ă  savoir le contexte au sein duquel la mĂ©diation est pratiquĂ©e. Aussi, rĂ©flĂ©chir sur les modalitĂ©s de participation comme un processus so-
  • 36. Groupe de travail national 11 avril 2013 - Atelier 1 cio-technique, nous a amenĂ© Ă  observer de quelle maniĂšre les dispositifs de mĂ©diation façonnaient notre sensibilitĂ©, notre participation et quels modĂšles de pensĂ©e ils suggĂ©raient. Les dispositifs de mĂ©diation, prĂ©sen- tĂ©s par Amandine BrugiĂšre (Fing), peuvent ĂȘtre abordĂ©s comme diffĂ©- rentes techniques et outils pour crĂ©er la rencontre. L’usage Ă©tait selon les dispositifs plus ou moins encadrĂ© et donc plus ou moins spontanĂ©. Jusqu’à quel point peut-il fournir des cadres pour limiter les abus ? Quelles marges de libertĂ© la mĂ©diation confĂšrent-elles aux citoyens ? N’OUVRENT-ELLES PAS DE NOUVELLES CONFIGURATIONS ENTRE LES ACTEURS ? Á ce niveau, plutĂŽt que de rĂ©flĂ©chir la mĂ©diation comme un procĂ©dĂ© linĂ©aire allant du savoir Ă  l’objet, on la conçoit comme une Ă©conomie d’interac- tions au sein de laquelle les participants s’enrichissent mutuellement. Les dispositifs de mĂ©diation se doivent alors de conceptualiser une structure dynamique, mallĂ©able et participative composant un modĂšle rĂ©ceptif aux usages et aux imaginaires de diffĂ©rents individus et engageant ainsi une nouvelle forme de dialogue, qui s’enrichira au travers d’interactions nĂ©go- ciĂ©es. Il s’agit bien de produire de l’intĂ©rĂȘt gĂ©nĂ©ral tout en prĂ©servant les spĂ©cificitĂ©s individuelles. Penser la mĂ©diation, c’est Ă©galement prĂŽner une utilisation plus situĂ©e, une gestion plus contextuelle des problĂ©matiques, avec ce qu’elle implique dans la circulation d’information du mĂ©diateur vers son public et inversement. Si l’on Ă©voque beaucoup la pĂ©dagogie envers les citoyens dans les procĂ©- dures de participation, il apparaĂźt que pour rĂ©ussir cette combinaison, les INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 37. Groupe de travail national 11 avril 2013 - Atelier 1 acteur publics et privĂ©s doivent eux-mĂȘme ĂȘtre dĂ©tenteurs d’une Ă©duca- tion Ă  la reprĂ©sentation, Ă  l’analyse visuelle, Ă  la synthĂšse graphique pour que ces dispositifs hybrides soient pleinement prĂ©hensibles. De surcroit, la participation doit ĂȘtre dĂ©clenchĂ©e et motivĂ©e, pour dĂ©couvrir toute sa puissance. C’est pourquoi accorder la reprĂ©sentation de la donnĂ©e et la participation nĂ©cessite un cahier des charges Ă©clairĂ© et un travail attentif de l’expĂ©rience utilisateur. L’idĂ©e d’une plateforme musĂ©ale de la donnĂ©e, comme un territoire Ă  ex- plorer, au travers duquel chacun pourra bĂątir sa place, dĂ©veloppant son champs des possibles, a Ă©tĂ© introduite par Sarah Labelle  : « Comment pourrait-on mettre en avant des donnĂ©es stabilisĂ©es?  ». Elle nous l’ex- plique : « cette plate-forme permettrait d’offrir des expositions temporaires sur des sujets thĂ©matiques ; une collection fixe, ce que l’on pourrait consi- dĂ©rer comme un cadrage gĂ©nĂ©ral pour entrĂ©e dans la culture de la donnĂ©e ; des ateliers de manipulation rĂ©clamant les mains dans le cambouis ; des visites guidĂ©s d’entrepĂŽt de la donnĂ©e ; et surtout un espace collaboratif de co-construction autour de projets mobilisant la donnĂ©e ». Faustine BOUGRO, Designer, Fing INVENTONS ENSEMBLE L’INFOLAB COMMENT CONSTRUIRE UN GUIDE DE MÉDIATION
  • 38. Groupe de travail national 11 avril 2013 - Atelier 1 OCCUPY WALL STREETSource : http://www.clickklack.net PAR DARWIN YAMAMOTO
  • 39. Groupe de travail national 11 avril 2013 - Atelier 1 LA CULTURE DES DONNÉES EN ENTREPRISE Par Claire GALLON
  • 40. Groupe de travail national 11 avril 2013 - Atelier 1 INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE La gestion des donnĂ©es en entreprise ne concerne plus unique- ment les acteurs du web et les grands comptes. Toutes les entreprises crĂ©ent des donnĂ©es numĂ©riques : donnĂ©es financiĂšres, donnĂ©es sur la clientĂšle, donnĂ©es de localisation ou de production
 Et ces donnĂ©es font de plus en plus partie des valeurs commerciales. Aujourd’hui, les entreprises et notamment les petites entreprises qui n’ont pas encore dĂ©veloppĂ© de valorisation de leurs donnĂ©es doivent ap- prendre Ă  dĂ©velopper une culture de traitement en interne afin d’identifier et profiter de la valeur qui se cache notamment derriĂšre : - Les donnĂ©es de prĂ©sentation gĂ©nĂ©rale de l’entreprise : localisation, rĂ©fĂ©- rencement, finances... - La collecte de donnĂ©es sur les clients - Les donnĂ©es sur les offres, produits, services - Les donnĂ©es de qualitĂ©, satisfaction, et relation client - Les donnĂ©es dĂ©cisionnelles, prĂ©vision, prĂ©diction, analyse - Les donnĂ©es de temporalitĂ© dans l’entreprise : agendas, congĂ©s, saison- nalitĂ© - Les donnĂ©es d’impact social et environnemental, RSE - Les donnĂ©es des Ressources Humaines L’objet de l’atelier « DonnĂ©es des Entreprises » organisĂ© durant la premiĂšre rencontre Infolab et animĂ© par Charles Nepote (FING) Ă©tait de proposer des thĂšmes et exercices autour de l’intĂ©gration d’une culture de donnĂ©es en entreprise en questionnant la qualification et normalisation des don- nĂ©es en interne ainsi qu’en illustrant les Ă©changes de cas concrets.
  • 41. Groupe de travail national 11 avril 2013 - Atelier 1 LES PROBLÈMES DE STANDARDISATION DES DONNÉES Afin d’initier les participants Ă  la question de qualification des donnĂ©es, la liste des inscrits Ă  l’atelier Infolab extraite du logiciel de la Fing a Ă©tĂ© prĂ©sentĂ©e et soumise aux commentaires. Les participants Ă©taient invitĂ©s Ă  exprimer leurs retours et Ă©tonnements sur cette liste qui dĂ©taille les noms, prĂ©noms, adresse email, coordonnĂ©es, et ville des inscrits. Les premiers Ă©tonnements relĂšvent le caractĂšre hĂ©tĂ©roclite des rensei- gnements fournis dans la base de donnĂ©es et ce malgrĂ© la collecte via un formulaire-type unique. Parmi les problĂšmes de standardisation identifiĂ©s : Les problĂšmes de casse : des noms tantĂŽt en majuscules et tantĂŽt en minuscules. Ce qui questionne la clartĂ© de la prĂ©sentation en cas de publication. Les problĂšmes de champs : des adresses email renseignĂ©es dans le champs des noms de famille. On ne connaĂźt donc pas l’identitĂ© de la personne qui participera. Il y a des adresses email personnelles renseignĂ©es au lieu des adresses profession- nelles, on ne sait donc pas si la personne participe Ă  titre personnel ou s’il n’existe pas de mail d’entreprise. Les problĂšmes de doublons : un inscrit renseignĂ© Ă  deux reprises. INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
  • 42. Groupe de travail national 11 avril 2013 - Atelier 1 Ces doublons peuvent biaiser le nombre de participants inscrits, Ă  moins que l’auteur n’ait effectuĂ© une inscription pour une tierce personne dont on ne connaĂźt pas l’identitĂ©. Les problĂšmes d’exhaustivitĂ© : certains champs ne sont pas renseignĂ©s (organisation par exemple). Il manque des noms d’organisations et le champs « ville d’origine » a ra- rement Ă©tĂ© renseignĂ©. Il n’est d’ailleurs pas prĂ©cisĂ© s’il s’agit de la ville d’origine du participant, de la ville d’implantation de l’organisation, son siĂšge social ? Ces manquements limitent les bĂ©nĂ©fices d’usage de la liste d’inscription. Les problĂšmes d’identifiants : une mĂȘme structure renseignĂ©e avec son nom ou son acronyme. A dĂ©faut d’identifiant unique, les opĂ©rations de tri des participants par organisation ou d’identification du nombre d’organisations prĂ©sentes se rĂ©vĂšlent erronĂ©s. On pourrait comptabiliser plusieurs fois une mĂȘme structure sans mĂȘme relever la possibilitĂ© du doublon car il peut y avoir confusion sur l’identitĂ© de l’organisation. Rennes MĂ©tropole dĂ©signe l’or- ganisation plutĂŽt que la ville. Si ALVLF est le nom d’usage pour Alcatel- Lucent, peu de personnes les connaissent cependant sous cet acronyme. Il y a de vĂ©ritables enjeux autour des identifiants et une position de pou- voir pour leurs dĂ©tenteurs qui peuvent faire disparaĂźtre une identitĂ© ou la recouper. Si l’adresse e-mail d’un participant pourrait constituer un identi- fiant unique interne, elle pose Ă©galement problĂšme en cas de changement INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
  • 43. Groupe de travail national 11 avril 2013 - Atelier 1 de fournisseur d’accĂšs. Les problĂšmes de droits : l’usage des donnĂ©es doit ĂȘtre dĂ©fini dans un pĂ©rimĂštre prĂ©-Ă©tabli. La collecte de donnĂ©es personnelles tombe sous la loi Informatique et Li- bertĂ©s et impose de dĂ©poser une dĂ©claration d’usage rendant la base inex- ploitable dans des cas d’utilisations non-identifiĂ©s au prĂ©alable. Comment faire quand on ne sait pas systĂ©matiquement quels usages peuvent suivre ? Et quid de la diffĂ©renciation de l’adresse professionnelle et personnelle ? DES DÉMARCHES DE QUALIFICATION DES DONNÉES Avoir une liste qualifiĂ©e de participants Ă  un Ă©vĂ©nement est pourtant pri- mordial. Si quelqu’un n’est pas dans la liste d’un Ă©vĂ©nement alors qu’il essaye d’y entrer aprĂšs s’ĂȘtre inscrit, cela dĂ©montre un certain amateu- risme et impacte la relation client. DiffĂ©rentes procĂ©dures permettent pourtant d’optimiser et mieux quali- fier une base. Il serait ainsi possible de rajouter une case de reconnaissance des emails pour automatiser le renseignements des champs et Ă©viter aux participants de remplir Ă  nouveau le formulaire. SĂ©parer les champs noms et prĂ©noms permet de clarifier l’identitĂ©. La casse peut ĂȘtre normalisĂ©e automatiquement. Des infobulles ou informations complĂ©mentaires des champs permettraient de mieux prĂ©ciser les attentes de remplissage. Il est enfin possible de proposer une reconnaissance des structures par liste INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
  • 44. Groupe de travail national 11 avril 2013 - Atelier 1 existante pour s’assurer d’une dĂ©nomination unique des organisations, ou crĂ©er un champs « nom d’usage » en plus du nom de l’organisation. On peut encore rendre obligatoire le renseignement de tous les champs pour Ă©viter les absences de renseignements. Ces procĂ©dures requiĂšrent d’orga- niser une rĂ©flexion sur la qualification des donnĂ©es. On peut Ă©galement permettre aux participants de modifier leurs donnĂ©es a posteriori, Ă  l’image du projet Mesinfos. Dans un tableur, on peut dĂ©dou- blonner ou ajuster la casse automatique voire utiliser des outils plus puis- sants comme OpenRefine. Des outils de CMS existent aussi pour nettoyer les bases. S’ils nĂ©cessitent un investissement, ils permettent d’avoir une base toujours Ă  jour et qualifiĂ©e en normalisant et utilisant les nomen- clatures d’usage. Il existe des sociĂ©tĂ©s spĂ©cialisĂ©es dans la correction de fichiers (casse, doublons, conversion, etc.), tel Datalgo. Si la normalisation est essentielle Ă  l’exploitation des donnĂ©es, la culture de traitement qu’elle implique n’est pas Ă©quitablement rĂ©partie. Lorsque Tom Tom demande des donnĂ©es du territoire Aquitaine qu’il ne rĂ©utilise finalement pas car elles ne sont pas assez bien organisĂ©es, on constate que la qualitĂ© des donnĂ©es est asymĂ©trique et que la faible qualification reprĂ©sente une perte de valeur. Si des outils existent pour amĂ©liorer les donnĂ©es, tout ne se rĂ©soudra pas par les outils qui suivent les pratiques, les usages et la normalisation. Au W3C, il faut au moins deux ans pour valider une norme tandis que les donnĂ©es qui intĂšgrent une composante sociale Ă©voluent bien plus rapidement. INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
  • 45. Groupe de travail national 11 avril 2013 - Atelier 1 VERS UNE CULTURE DES DONNÉES La question de normalisation est complexe et diffĂ©rente selon la typolo- gie des donnĂ©es : gĂ©ographiques, personnelles, textuelles, etc. Elle diffĂšre Ă©galement dans le temps : les enseignants ont longtemps appris Ă  ne pas mettre d’accent sur les majuscules car il n’y en avait pas sur les machines Ă  Ă©crire. Comment proposer des solutions Ă  la normalisation et suivre leur Ă©volution ? Faut-il former les employĂ©s ? Il semble a priori difficile de faire en sorte que le problĂšme du rĂ©utilisateur de la base (qui a besoin d’une base spĂ©cifiquement qualifiĂ©e) devienne le problĂšme du producteur de la base surtout quand celle-ci rĂ©pond dĂ©jĂ  Ă  ses besoins. Pourtant au sein des structures, de mĂȘme jeux de donnĂ©es sont maintenus par plusieurs services pour diffĂ©rents usages. Que ces dif- fĂ©rents secteurs rĂ©alisent la nĂ©cessitĂ© de la normalisation est hautement pertinent. La normalisation fait penser Ă  la grammaire, qui est faite pour communi- quer avec les autres. On a appris Ă  Ă©crire son nom avec une majuscule, ces rĂšgles sont culturelles. Bien souvent, on ne respecte pas les standards car on ne sait pas Ă  quoi ils servent et ce qu’ils facilitent. Expliquer la raison de chaque collecte des donnĂ©es peut ĂȘtre un premier pas. Il serait possible d’imaginer des formations Ă  la standardisation et des animations propo- sant de crĂ©er un jeu oĂč l’on amplifie les erreurs pour rendre l’enjeu de la normalisation comprĂ©hensible. INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
  • 46. Groupe de travail national 11 avril 2013 - Atelier 1 LA MAITRISE DE SES DONNÉES, COMME DE SON IMAGE DE MARQUE Les participant de l’atelier Infolab ont Ă©tĂ© invitĂ©s Ă  Ă©tudier la diffĂ©rence de rĂ©fĂ©rencement en ligne de plusieurs organisations. En utilisant le moteur de recherche de Google, ils ont questionnĂ© les diffĂ©rences de prĂ©senta- tion des structures suite aux requĂȘtes FING, Alcatel Lucent, Gemalto ou Orange. Pour la FING il y a uniquement la prĂ©sentation du site et de ses rubriques. Pour Alcatel on retrouve un plan d’accĂšs et un lien vers l’article de Wikipe- dia. Pour Gemalto, les coordonnĂ©es sont Ă©galement indiquĂ©es tandis que la requĂȘte pour Orange nous indique les trois agences les plus proches. On constate que le niveau d’information et la trouvabilitĂ© d’une organi- sation peut montrer de grandes disparitĂ©s. Or la qualitĂ© des rĂ©sultats dĂ©pend largement des informations et donnĂ©es de l’organisation trou- vĂ©es sur internet : donnĂ©es fournies par l’entreprise mais aussi donnĂ©es issues d’autres personnes. L’exemple ci-dessus illustre la dĂ©pendance Ă  un moteur de recherche. Comment avoir de meilleures donnĂ©es pour un meilleur rĂ©fĂ©rencement ? Le projet Google Knowledge Graph vise Ă  relier des informations entre elles grĂące Ă  des relations comme sur DBpedia. ComplĂ©ter ses donnĂ©es dans Dbpedia ou d’autres sources, devient donc une forme d’enjeu marketing. Suivre les dĂ©marches de schema.org Bing, Yahoo, Google, qui ont des impacts en terme de rĂ©fĂ©rencement des sites web devient indispensable. Le quasi monopole de Google sur la recherche en ligne impose de suivre INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
  • 47. Groupe de travail national 11 avril 2013 - Atelier 1 de prĂšs ses mĂ©thodes de rĂ©fĂ©rencement et ses stratĂ©gies afin d’assurer sa propre visibilitĂ© en ligne. En Aquitaine, un chĂąteau a Ă©tĂ© dĂ©classĂ© des listes de rĂ©fĂ©rencement car il lui manquait des points de notoriĂ©tĂ© web, bien que ces indicateurs soient diffĂ©rents selon le lieu de requĂȘte. S’agissant de prĂ©sentation gĂ©nĂ©rale de l’entreprise, les donnĂ©es des si- gnatures des emails sont aussi une maniĂšre de se prĂ©senter et de prĂ©- senter son organisation. Certains utilisent des fichiers Vcard (.vcf) qui sont de vĂ©ritables fichiers de donnĂ©es. D’autres se contentent d’une signature rĂ©digĂ©e dans le corps et automatiquement ajoutĂ©e Ă  chaque email. Ces signatures dans le corps des emails peuvent ĂȘtre automatiquement ana- lysĂ©es, extraites et transformĂ©es en donnĂ©es, par des services comme Writethatname qui peuvent enrichir automatiquement les donnĂ©es d’un CRM. Demain il pourait ĂȘtre capable de publier de l’information en ligne comme les organigrammes des entreprises. Ce rapide tour d’horizon de la qualification des donnĂ©es en entreprises dĂ©- montre que l’appropriation d’une culture de donnĂ©es en interne est d’au- tant plus nĂ©cessaire au sein du secteur privĂ©. L’exploitation de ces don- nĂ©es pour mieux gĂ©rer, optimiser et valoriser ses ressources reprĂ©sente un avantage concurrentiel non-nĂ©gligeable dans une situation Ă©conomique tendue. Comment standardiser ses donnĂ©es ? Comment former et implĂ©- menter des mĂ©thodes de normalisation ? Autant de questions que les Infolabs se proposent d’explorer. Claire GALLON, LiberTIC INVENTONS ENSEMBLE L’INFOLAB LA CULTURE DES DONNÉES EN ENTREPRISE
  • 48. Groupe de travail national 11 avril 2013 - Atelier 1 Amandine BRUGIÈRE, ChargĂ©e de mission, FING Email : abrugiere@fing.org Faustine BOUGRO, Designer, FING Email : fbougro@fing.org Fabienne GUIBÉ, Chef de projet, FING Email : fguibe@fing.org Loup CELLARD, Assistant Chef de Projet, FING Email : lcellard@fing.org Charles NEPOTE, Directeur de programme d’action, FING Email : cnepote@fing.org Vincent MANDINAUD, Chef de projet ATTLAS Email : v.mandinaud@anact.fr HervĂ© PARIS, Chef de projet AlterCarto/CitĂ© Publique Email : cite.publique@wanadoo.fr Sarah LABELLE, MaĂźtre de confĂ©rence en SIC, Paris 13 Email : sarah.labelle@sic.univ-paris13.fr Simon CHIGNARD, Consultant Open Data Email : simonchignard@me.com Claire GALLON, Co-fondatrice et administratrice, LiberTIC Email : claire.gallon@gmail.com Pour plus d’informations : http://www.reseaufing.org INVENTONS ENSEMBLE L’INFOLAB CONTACT
  • 49. INVENTONS ENSEMBLE L’INFOLAB LES PARTENAIRES LES PARTENAIRES DE LA CAMPAGNE INFOLAB
  • 50. Groupe de travail national 11 avril 2013 - Atelier 1