Mais conteĂșdo relacionado Semelhante a Atelier1- Groupe national 11 avril 0 (20) Atelier1- Groupe national 11 avril 03. Groupe de travail national 11 avril 2013 - Atelier 1
La Campagne Infolab a Ă©tĂ© lancĂ©e le jeudi 11 avril Ă lâoc-
casion de la premiĂšre rencontre du groupe de travail national, portant
sur le thÚme « Culture de la donnée et médiations ». Acteurs associatifs
(Libertic, Open Street Map, collectifs citoyens Open Data Tours, Poitiers,
Les Petits-DĂ©brouillards, DĂ©cider Ensemble, La FonderieâŠ), membres de
collectivités territoriales (Région PACA, Communauté urbaine de Bor-
deaux, CG Gironde, CG Hauts-de-Seine, CG Manche, Mairies de Paris et
de RennesâŠ) et grands comptes (Alcatel Lucent, La Poste, La Caisse des
dĂ©pĂŽts, GemaltoâŠ) Ă©taient rassemblĂ©s pour entamer une rĂ©flexion sur la
culture de la donnée et ses différentes formes de médiation. Retour sur
cette journĂ©eâŠ
Keywords - INFOLAB, OPENDATA, MEDIATIONS, CULTURE.
06 2011
INVENTONS ENSEMBLE LâINFOLAB INTRODUCTION
4. Groupe de travail national 11 avril 2013 - Atelier 1
I.
II.
III.
IV.
V.
VI.
FORGEONS UNE CULTURE DE LA DONNĂE !
Par Simon CHIGNARD
RENDRE POPULAIRE LE TRAVAIL DE LA DONNĂE
Par Loup CELLARD, Fing
METTRE LES DONNĂES EN DĂBAT
Par Amandine BRUGIĂRE, Fing
COMMENT CONSTRUIRE UN GUIDE DES MĂDIATIONS
Par Fabienne GUIBĂ, Fing
LA MĂDIATION, UNE NOTION FLOUE, VICTIME DE SON SUCCĂS
Par Faustine BOUGRO, Fing
LA CULTURE DES DONNĂES EN ENTREPRISE
Par Claire GALLON, LiberTIC
INTRODUCTION
SOMMAIRE
CONTACT
INVENTONS ENSEMBLE LâINFOLAB SOMMAINE
5. Groupe de travail national 11 avril 2013 - Atelier 1
FORGEONS UNE CULTURE DE LA DONNĂE !
Par Simon CHIGNARD
6. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB FORGEONS UNE CULTURE DE LA DONNĂE
Câest en forgeant que lâon devient forgeron ». Le proverbe aurait
pu figurer en sous-titre du premier atelier national Infolab. Il traduit lâidĂ©e
que la compréhension des enjeux de la donnée passe aussi (avant tout ?)
par notre capacité à mettre les mains dans le cambouis.
Nous avons donc beaucoup forgé lors de cette aprÚs-midi. La donnée
(notre matiĂšre premiĂšre), nous lâavons manipulĂ©e, chauffĂ©e, tordue pour
essayer dâen tirer quelques idĂ©es sur la culture de la donnĂ©e et sa (nĂ©ces-
saire) médiation.
Les sujets Ă©tudiĂ©s Ă©taient diffĂ©rents : les donnĂ©es dâentreprises, les sta-
tistiques de lâemploi et de lâactivitĂ© Ă©conomique, les prĂ©noms les plus
populaires⊠Mais au-delà de cette apparente diversité, les questions se
ressemblent : Comment traduire les questions en données ? Comment
aborder avec un regard critique les données disponibles ?
QUELLES COMPĂTENCES REQUISES POUR LES FAIRE PARLER ?
Câest en forgeant que lâon devient forgeron. Mais que devient-on en
manipulant de la donnée ? La question du rÎle des médiateurs est posée
ici, de mĂȘme que celle de lâexpertise. Les sachants dâun domaine (ceux
qui maĂźtrisent un sujet ou une thĂ©matique) vont-ils ĂȘtre supplantĂ©s par
les experts de la manipulation des donnĂ©es ? Au moment oĂč data-scien-
tist devient un métier sexy, cette mise en pratique aura pu démontrer
que la donnĂ©e nâest pas rĂ©servĂ©e aux forts en mathsâŠ
AprÚs le bruit et le chaleur de la forge, nous avons souhaité prendre un peu
de recul, pour rĂ©-interroger la notion-mĂȘme de mĂ©diation (le forgeron est
7. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB FORGEONS UNE CULTURE DE LA DONNĂE
devenu praticien rĂ©flexif âŠ). Quâest-ce que ce terme veut dire ? Qui sont
les acteurs et les objets de la médiation ? Sarah Labelle nous a proposé un
Ă©clairage, de la mĂ©diation culturelle Ă la sociologie de lâinnovation, souli-
gnant la diversité des objets et des processus de médiation existants et
envisageables. LâĂ©change qui a suivi aura mĂȘme permis dâimaginer un pos-
sible âMusĂ©e de la donnĂ©eâ, ses expositions permanentes et temporaires,
ses ateliers de dĂ©couverte et de co-construction. La rencontre sâest conclue
par la prĂ©sentation dâun premier inventaire des outils et des dispositifs
dâanimation et de mĂ©diation autour de la donnĂ©e. Un travail qui se pour-
suivra au cours des prochains mois pour alimenter les expérimentations
territoriales et le guide des mĂ©diations. âPractice makes perfectâ disent
nos voisins dâoutre-manche : ce premier atelier nâest que la premiĂšre Ă©tape
de notre parcours Infolab, nous aurons donc lâoccasion de remettre le sujet
de la culture de la donnĂ©e sur la tableâŠ
Simon CHIGNARD, Consultant Open Data, http://donneesouvertes.info
8. Groupe de travail national 11 avril 2013 - Atelier 1
RENDRE POPULAIRE LE TRAVAIL DE LA DONNĂE
Par Loup Cellard, Fing
9. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNĂE
Afin de mieux comprendre le contexte et les limites de lâouverture
dâun jeu de donnĂ©es, le thĂšme de lâatelier proposĂ© par Simon Chignard était
particuliÚrement bien choisi : les prénoms. Tout le monde en a un, tout le
monde sait ce que cela reprĂ©sente, et câest une notion centrĂ©e sur lâhu-
main et lâidentitĂ©, de quoi rassurer les data-sceptiques, et de quoi faire
vibrer les data-dandys.
LâentrĂ©e en matiĂšre dans le sujet sâest faite grĂące Ă plusieurs articles de
presse qui mettaient en évidence les modes de médiatisation du sujet :
le prénom comme bien de mode, la recherche du prénom rare, les stéréo-
types éditoriaux véhiculés par la presse⊠AprÚs analyse de divers corpus
de donnĂ©es sur les prĂ©noms (INSEE, data.gouv, fichier dâĂ©tat civil⊠jeu de
données de Paris et Rennes), il est aisé de déceler les biais de ces jeux qui
limitent leurs utilisations possibles.
En effet, les jeux de données ne sont pas identiques entre collectivités
territoriales, la comparaison entre territoires devient alors difficile : une
normalisation serait bénéfique, mais qui peut la porter ?
QUI EST LE GARANT ?
Il y a un effet boßte noire sur la constitution des jeux de données et un
manque de normes institutionnelles qui pourrait régler ces problÚmes.
Il serait également  intéressant de préciser les limites de chaque jeux de
donnĂ©es (ce quâils ne contiennent pas). Par exemple, dans les jeux de don-
nĂ©es des prĂ©noms de lâINSEE, lâoccurrence minimale (prĂ©nom rare) pour
10. Groupe de travail national 11 avril 2013 - Atelier 1
quâun prĂ©nom soit inscrit est de 3 (si un prĂ©nom X a Ă©tĂ© donnĂ© que 2 fois
sur ce territoire il nâapparaĂźtra pas dans le fichier). Sur le portail de la ville
de Paris, elle est de 5. Pourquoi ce choix et cette différence? Qui fixe la
norme (ou à défaut une pratique commune) ?
EST-CE LE RĂLE DâETALAB ?
Bien souvent, les problÚmes de réutilisation de données viennent du fait
que lâon ignore le contexte de production de ces mĂȘmes donnĂ©es. Il nous
manque des informations autour de la constitution des jeux : les méta-
donnĂ©es. Dans les donnĂ©es des prĂ©noms dâune ville, on ne sait si la date
dâinscription dans le jeu de donnĂ©es est la date de naissance de lâenfant
ou la date de son enregistrement dâĂ©tat civil ? Les enfants nĂ©s autour du
31 dĂ©cembre sont certaines fois enregistrĂ©s sur lâannĂ©e suivante, dĂ©lai
dâenregistrement oblige !
Les diffĂ©rences dâorthographe, de prononciation et de genre des prĂ©noms
ne sont pas prises en compte dans la constitution des jeux de données.
Lorsque lâon veut analyser le prĂ©nom Justin comme indicateur social, on ne
sait sâil se prononce Ă la française ou Ă lâamĂ©ricaine, et si du coup il se rĂ©-
fÚre davantage à Justin (de La Borderie), prénom à connotation bourgeoise,
ou Ă Justin (Bieber), jeune chanteur de pop amĂ©ricaine reprĂ©sentatif dâune
culture populaire transnationale. Les prénoms sont des données relative-
ment simples et on sâaperçoit quâelles posent dĂ©jĂ un certain nombre de
problÚmes: quel degré de complexité vont avoir des jeux de données de
résultats financiers ou de santé publique ?!
INVENTONS ENSEMBLE LâINFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNĂE
11. Groupe de travail national 11 avril 2013 - Atelier 1
AprÚs cette analyse critique des données, nous avons identifié les princi-
paux cas de rĂ©utilisation : les jeux de donnĂ©es des prĂ©noms peuvent ĂȘtre
utilisĂ©s pour montrer la diversitĂ© des prĂ©noms (relativiser lâutilisation des
prénoms rares, montrer la diversité des prénoms dans le temps), révéler
les modes dans lâutilisation de tel ou tel prĂ©nom (orthographe, influence
dâun fait dâactualitĂ©, dâun personnage de fiction, dâune star) ou encore uti-
liser le prénom comme indicateur social ou comme révélateur en période
de crise.
EST-ON PLUS ORIGINAL DANS LE CHOIX DE SON PRĂNOM
EN PĂRIODE DE CROISSANCE OU DâAUSTĂRITĂ ?
TrÚs pédagogique, cet atelier permet de comprendre les étapes clés de
lâutilisation dâun jeu de donnĂ©es : sa rĂ©ception, lâanalyse de ses potentia-
litĂ©s, le dĂ©frichage Ă lâintĂ©rieur du jeu, les possibilitĂ©s dâenrichissement et
de rĂ©utilisation. Simon Chignard insiste Ă©galement sur lâimportance des
métadonnées dans la publication des jeux de données : il faut davantage
documenter le contexte de production des jeux.
On comprend alors les bonnes questions Ă se poser avant dâenvisager
toute production de sens avec un jeu de donnĂ©es : Quâest ce qui est rĂ©el-
lement présent dans le fichier ? Comment a-t-il été constitué ? Le fichier
reprĂ©sente-t-il lâensemble du corpus Ă Ă©tudier ?
Loup CELLARD, Assistant Chef de Projet, Fing
INVENTONS ENSEMBLE LâINFOLAB RENDRE POPULAIRE LE TRAVAIL DE LA DONNĂE
12. Groupe de travail national 11 avril 2013 - Atelier 1
PREMIERS BĂBĂS 2013Source : http://fr.slideshare.net/schignard/infolab-les-prnoms-une-donne-populaire
PAR LE TĂLĂGRAMME
13. Groupe de travail national 11 avril 2013 - Atelier 1
METTRE LES DONNĂES EN DĂBAT
Par Amandine BRUGIĂRE.
14. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB METTRE LES DONNĂES EN DĂBAT
Dans ce 2e atelier main dans le cambouis, Vincent Mandinaud
de lâANACT et HervĂ© Paris dâAlterCarto/CitĂ© Publique ont prĂ©sentĂ© une
méthode originale - et éprouvée ! - de mise en discussion des données
articulant des approches quantitatives et qualitatives des données. Pour
bien comprendre la démarche, revenons sur les caractéristiques des ac-
teurs en prĂ©sence.Â
LâANACT (Agence Nationale pour lâAmĂ©lioration des Conditions de Travail)
est un EPA sous tutelle du ministĂšre du travail, et les organisations pa-
tronales et syndicales dites reprĂ©sentatives siĂšgent Ă son conseil dâad-
ministration. LâANACT forme un rĂ©seau, avec 26 ARACT (Associations
RĂ©gionales pour lâAmĂ©lioration des Conditions de Travail) implantĂ©es dans
chaque rĂ©gion de France. La vocation de ce rĂ©seau est dâaider les organisa-
tions à développer des projets innovants touchant au travail, dans le cadre
dâun dialogue social constructif, pour amĂ©liorer Ă la fois la situation des
salariĂ©s et lâefficacitĂ© des entreprises.
Aussi, ces derniÚres années, le réseau ANACT a déployé des outils de car-
tographie statisitique et expĂ©rimentĂ© une mĂ©thodologie dâenquĂȘte sur
les contextes de travail dans les territoires. Mobilisés et éprouvés par des
acteurs territoriaux (ARACT, ComitĂ©s de Bassin dâEmploi; Maison de lâEm-
ploi et de la Formation Professionelle, etc.), ces outils de rapprochement
cartographique de donnĂ©es et ces methodes dâinvestigation leur ont per-
mis dâalimenter la reflexion, dâaffiner la problĂ©matisation des contextes
dâaction face aux mutations du travail dans les enterprises et les terri-
toires. Le travail de mediation que rĂ©alisent ces groupes dâacteurs  table
sur la mise en scĂšne et lâanalyse de donnĂ©es de statistiques publiques,
couplĂ©es, articulĂ©es Ă des savoirs dâexpĂ©riences, des connaissances de
15. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB METTRE LES DONNĂES EN DĂBAT
terrain. Le positionnement - presque Ă©thique - de lâagence est de ne pas
livrer de corrélations statistiques toutes faites aux acteurs, mais de pro-
poser des cadres de travail soutenant la capacité des acteurs (non experts
des données) à formuler de corrélations délibératives, soutenues par des
formes dâenquĂȘtes collaboratives, de partage dâexpĂ©riences et dâexpertise
collective.
Sur son chemin lyonnais, lâANACT a croisĂ© le bureau dâĂ©tude CitĂ© Pu-
blique (concepteur et dĂ©veloppeur de lâapplication web de cartographie
statistique) et lâassociation AlterCarto : une association engagĂ©e dans
les problématiques de débat citoyen, préoccupée par le développement
de technologies démocratiques et plus spécialement de cartes réflexives.
Cette rencontre a ouvert sur une collaboration fructueuse entre les orga-
nismes et sur la co-Ă©laboration dâun projet nommĂ©Â ATTLAS, reprenant la
suite technologique Suite Cairo.
ATTLAS se base sur la réutilisation des données publiques géoloca-
lisées et propose une lecture nouvelle des contextes de travail dans les
territoires, complémentaire aux approches sectorielles traditionnelles. La
dĂ©marche dâinvestigation proposĂ©e aux partenaires, soutenue par lâuti-
lisation de modules cartographiques dit « PageCarto », consiste en une
plongée dans les problématiques des territoires, étayée de données, mé-
diĂ©e par des cartes, des graphiques et des commentaires.Â
Cette démarche articule trois types de compétences :
- lâexpertise mĂ©tier et terrain des clients ou partenaires;
- lâexpertise mĂ©tier du rĂ©seau ANACT sur la champ problĂ©matique du tra-
vail et des changements technologiques et organisationnels;
- lâexpertise socio-technique et cartographique dâAlterCarto.Â
16. Groupe de travail national 11 avril 2013 - Atelier 1
ATTLASSource : http://www.anact.fr/web/services/attlas
PAR ANACT
17. Groupe de travail national 11 avril 2013 - Atelier 1
Les intervenants dĂ©finissent leur rĂŽle comme celui dâun appui Ă la pro-
blĂ©matisation, dâune expertise de facilitation concourant Ă lâencapacitation
des acteurs concernĂ©s sur les phĂ©nomĂšnes explorĂ©s. Lâobjectif est non pas
de résoudre les problÚmes des acteurs à leur place, mais de mettre en
place un cadre dâusages facilitant le partage des expĂ©riences, la mutuali-
sation des ressources pour renouveler les capacitĂ©s dâagir sur les phĂ©no-
mĂšnes.
Une question que soulÚve cet attelage de compétences concerne la spé-
cialisation thématique des experts de la donnée : peut-on jouer un rÎle
de datascientist pour des tiers, sans comprendre les problématiques du
domaine, les implicites du langage, les conflits dâacteurs, etc. ?
LES MĂDIATIONS Ă LA DONNĂE DOIVENT-ELLES ĂTRE
SPĂCIALISĂES PAR MĂTIER ?
La démarche se construit en deux temps principaux.
Le back office comprend :
- la problématisation du sujet : de quoi parle-t-on ? Objectif : affiner les
questions, définir des problématiques communes ;
- le choix des périmÚtres : discussion autour des échelles, des cartes, des
reprĂ©sentations (quelle gĂ©ographie des donnĂ©es pour parler dâun pays
â sous-entitĂ© rĂ©gionale) : les frontiĂšres administratives des donnĂ©es
cachent parfois le véritable étalement géographique des problématiques
Ă©conomiques et sociales.
- la dĂ©finition dâune stratĂ©gie de collecte de donnĂ©es (trouver les donnĂ©es
disponibles rĂ©pondant Ă la problĂ©matique soulevĂ©e, quâelle soit publique
INVENTONS ENSEMBLE LâINFOLAB METTRE LES DONNĂES EN DĂBAT
18. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB METTRE LES DONNĂES EN DĂBAT
gratuite et ouverte, ou publique et payante).Â
- la constitution dâun cahier de donnĂ©es ;
- le bidouillage des données pour passer des tableaux aux cartes.
Cette Ă©tape est longue, chronophage et, aux dires des instigateurs eux-
mĂȘmes, la plus laborieuse. Les clients ou partenaires nâont pas toujours le
temps de rĂ©ellement sây plonger. La tentation est forte de vouloir recevoir
le prĂȘt-Ă -consommer, et de sâabsoudre de la cuisine prĂ©alable. Pourtant
cette étape une a une plus-value didactique forte : elle fonctionne comme
une formation, qui permet lâacculturation des acteurs Ă des formes induc-
tives de raisonnement, à la complexité de la représentation des phéno-
mĂšnes Ă©conomiques et sociaux, au caractĂšre construit des donnĂ©es quâon
cherche à représenter et mobiliser.
La mise en discussion des cartes comprend :
On est Ă ce moment-lĂ face au produit prĂȘt Ă lâusage. Mais les choses ne
se font pas toutes seules pour autant. La mise en discussion des cartes et
des donnĂ©es sâopĂšre dâune part grĂące au rĂŽle de tiers que jouent lâANACT
et AlterCarto. Dâautre part un principe prĂ©vaut pas de carte sans commen-
taire. Toutes les donnĂ©es reprĂ©sentĂ©es font ainsi lâobjet de discussions, de
corrĂ©lations commentĂ©es, ce quâon pourrait appeler lâhypertextualitĂ© des
données et des cartes. Les modules « PageCarto » offrent une fonction
de prise de notes dynamique, intégrant les commentaires aux cartes et
gĂ©nĂ©rant ensuite, si besoin, de nouvelles reprĂ©sentations plus adĂ©quates.Â
RMQ : Les données utilisées sont issues de différentes sources. Le recen-
sement de la population et le fichier connaissance locale de lâappareil pro-
ductif de lâINSEE sont jusquâalors les sources principales pour constituer
19. Groupe de travail national 11 avril 2013 - Atelier 1
les jeux de données réutilisées. Des données provenant de la DARES, de
PĂŽle Emploi, ou encore de la CNAM-TS ont pu ĂȘtre mobilisĂ©es. Les donnĂ©es
sont Ă la fois remises Ă disposition sous format tabloĂŻde facilitant le trai-
tement machine et représentées sous formes de métadonnées cartogra-
phiques. Les cartes, les supports et les textes de commentaires sont sous
licence GNU GPL.Â
CULTURE DE LA DONNĂE OU MĂDIATION ?
La démarche mise en oeuvre participe à développer une culture de la don-
nĂ©e auprĂšs des acteurs impliquĂ©s. Câest un des constats qui ressortait
de cet atelier. « Développer une culture de la donnée au service des entre-
prises et des territoires consiste bien à relancer un processus de médiation,
à reconfigurer la relation entre producteurs et réutilisateurs et renouveler
les usages » reconnaissait Vincent Mandinaud. Médiation et culture de
la donnĂ©e pourraient bien ĂȘtre indissociables⊠« JusquâĂ prĂ©sent les spĂ©-
cialistes de la donnée (statisticiens, acteurs publics, etc.) ont privatisé les
mĂ©diations : la production, la collecte et lâanalyse des donnĂ©es ne pas-
saient que par eux. Lâenjeu de lâOpen Data aujourdâhui est donc autant un
enjeu dâacculturation Ă la donnĂ©e par un plus grand nombre, quâun enjeu de
dĂ©sappropriation par ceux qui, jusquâĂ prĂ©sent, avait la main mise dessus »,
concluaient les intervenants.
UNE MĂTHODE POSSIBLE POUR DES INFOLABS CITOYENS ?...
INVENTONS ENSEMBLE LâINFOLAB METTRE LES DONNĂES EN DĂBAT
20. Groupe de travail national 11 avril 2013 - Atelier 1
Cette approche de co-Ă©laboration et de discussion des diagnostics terri-
toriaux avec les acteurs concernés faisait, pour notre petite équipe Info-
lab, largement Ă©cho aux scĂ©narios â fictifs â dĂ©veloppĂ©s avec lâassocia-
tion Décider Ensemble, dans le cadre du rapport « Ouvertures des données
publiques et participation » en 2012. Dans chacun des 3 scénarios (CNDP /
Plan Climat Energie / Aménagement urbain) en effet, un dispositif de type
Infolab sâavĂ©rait nĂ©cessaire : pour rĂ©unir, partager et mettre en discussion
les donnĂ©es. Le dispositif fonctionnait autour dâune rĂ©union de compĂ©-
tences techniques et de traducteur/formateur/médiateur.
Est-ce que la mĂ©thodologie dĂ©veloppĂ©e par lâANACT, CitĂ© Publique et Al-
terCarto pourrait fonctionner dans le cadre dâune concertation publique ?
Lâacculturation des acteurs (quâils soit professionnels ou citoyens) Ă la
manipulation de données est-elle possible sur un temps court ? Sur tout
type de population ? Ou faudrait-il imaginer quâun panel dâacteurs, choisi
au hasard, participe Ă un processus long Ă lâinstar des jurĂ©s dâassises ? En
la matiĂšre, tout reste Ă expĂ©rimenterâŠÂ !
A noter quâĂ Lyon, toujours,  la municipalitĂ© forme dĂ©jĂ les chargĂ©s de mis-
sions de développement local à des modes de concertation appuyés par
la mĂȘme technologie, et selon une approche mĂ©thodologique similaire,
pour entredéfinir, avec les comités de quartier, les zones prioritaires dans
le cadre des Contrats Urbains de Cohésion Sociale ; et pour mettre en place
un observatoire de la santé préfigurant le futur contrat local de santé
entre la Ville et lâARS.
Pour en savoir plus sur ces initiatives : sven.grillet@mairie-lyon.fr
Amandine BRUGIĂRE, ChargĂ©e de missions, Fing
INVENTONS ENSEMBLE LâINFOLAB METTRE LES DONNĂES EN DĂBAT
21. Groupe de travail national 11 avril 2013 - Atelier 1
COMMENT CONSTRUIRE UN GUIDE DES MĂDIATIONS
Quels outils/méthodes/animations autour des données existe-t-il déjà ?
Par Fabienne GUIBĂ
22. Groupe de travail national 11 avril 2013 - Atelier 1
La derniÚre présentation de la journée, menée par Amandine Bru-
giĂšre (FING), portait sur lâanalyse de la veille quâa initiĂ©e, depuis 2 mois,
lâĂ©quipe INFOLAB (voir sur Diigo le fil de veille, ainsi quâici le tableau par-
tagĂ© oĂč sont rĂ©fĂ©rencĂ©s plus dâune centaine de dispositifs de mĂ©diation,
quâils soient formats dâanimation, outils, mĂ©thodesâŠLâobjectif nâĂ©tant pas
de capter lâexhaustivitĂ© mais la diversitĂ© des exemples).
Il sâagissait de livrer une premiĂšre photographie de ce qui est directement
accessible sur le web : Si on cherche aujourdâhui Ă exploiter des donnĂ©es,
quelles soient ouvertes, fermées, personnelles ou publiques, quels sont
les outils, les mĂ©thodes, les formats dâanimation documentĂ©s et acces-
sibles sur le web ?
QUâEST-CE QUI SE TROUVE Ă PORTĂE DE MAIN ?
Cette analyse de la veille sâest structurĂ©e autour :
- du type de mĂ©diation dĂ©veloppĂ©e. Est-ce que lâon est face Ă des outils,
des mĂ©thodologies, des formats dâanimation, des services, des ressources
documentaires, des serious game, des plateformesâŠ?      Â
- du type dâactions possibles. Quâest-ce que cela permet de faire ? Sensibi-
liser, explorer, imaginer, partager, analyser�
Les catégories qui ont été retenues ici ne sont pas des catégories stabili-
sées. Le but de la présentation de ce work-in-progress était de faire réagir
les participants. Ainsi nâhĂ©sitez pas Ă complĂ©ter le tableau, Ă le commen-
ter, à partager les ressources identifiées, à nous contacter pour en discu-
ter. Ce travail sâenrichira au fil des rencontres, grĂące Ă vos contributions.
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
23. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
SENSIBILISER
La sensibilisation aux enjeux de la donnée reste, visiblement, un domaine
Ă investir : peu dâexemples Ă©mergent, relativement aux autres catĂ©gories
dâactions.
Ceux trouvés montraient cependant une grande diversité de formes. Cela
allait des ateliers rennais de sensibilisation des enfants Ă la manipula-
tion et la représentation de données, au serious game sur les données ou-
vertes du budget de lâEtat, ou encore lâenquĂȘte Orange-lab-OWNI-FING «
OĂč habitez-vous vraiment ? », sorte de quizz â Ă base de donnĂ©es ouvertes
- testant les connaissances territoriales des habitants. Les plateformes
Openstreetmap ou OpenfoodFacts (dé)montrant facilement la force du
crowdsourcing ( la production collaborative de données).
Un exemple particuliĂšrement pĂ©dagogique â mais sâadressant tout de
mĂȘme Ă un public dâinitiĂ©s â est la School of Data de lâassociation OKFN.
Câest une des seules initiatives proposant des ressources documentaires
et méthodologiques.
On le voit, ces formes de médiation développent chacune des pédagogies
trĂšs diffĂ©rentes, face Ă la complexitĂ© des donnĂ©es. Elles nâhĂ©sitent pas Ă
investir le ludique et sâadressent Ă tout type de public.
24. Groupe de travail national 11 avril 2013 - Atelier 1
OPEN FOOD FACTSSource : http://www.openfoodfacts.org
PAR STĂPHANE GIGANDET
25. Groupe de travail national 11 avril 2013 - Atelier 1
IMAGINER ET PRODUIRE DES USAGES
Avoir des données à disposition est nécessaire mais pas suffisant. Encore
faut-il avoir des idées de (ré)utilisation des données, et souvent faut-il
mĂȘme stimuler les rĂ©utilisateurs potentiels.
Dans ce champ-lĂ , les exemples trouvĂ©s relĂšvent essentiellement de lâani-
mation : Concours ou appel Ă projet, hackathon, dataconnexion, Data-
apĂ©ro ou Data-Tuesday. On est dans le champ de lâincitation, de la stimu-
lation, de la recherche de sĂ©rendipitĂ©, ou de lâinnovation ouverte.
Quatre caractéristiques communes apparaissent :
- Ces formats dâanimation sâadressent Ă des publics relativement avertis :
Innovateurs, start-upeurs, designers, dĂ©veloppeurs⊠         Â
- Ce sont majoritairement des exercices collectifs : la créativité découle-t-
elle du croisement de regard ?
- Ils sont dâune durĂ©e relative.
- Ils sâadaptent Ă des donnĂ©es ouvertes comme « propriĂ©taires ».       Â
Â
A noter toutefois un outil de sérendipité : Creadata, développé par Bas-
tien Kerspern proposant des idées de mash-up aléatoires entre les jeux de
données mis à disposition par la ville de Nantes.
Â
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
26. Groupe de travail national 11 avril 2013 - Atelier 1
CREADATASource : http://www.creadata.fr
PAR BASTIEN KERSPERN
27. Groupe de travail national 11 avril 2013 - Atelier 1
CUISINER
Une fois que les donnĂ©es et les idĂ©es sont lĂ , sâouvre alors un champ dâac-
tions relativement techniques : Récupérer les données (EasyOpenData) les
stocker, les nettoyer (Open Refine, DataWrangler), les anonymiser (norme
ISO de pseudonymisation), les croiser (DataLift), etc. Ce champ-lĂ foi-
sonne dâoutils destinĂ©s Ă des publics trĂšs spĂ©cialistes.
Beaucoup dâentre eux Ă©mergent du champ des donnĂ©es personnelles : du
cÎté du VRM Vendor Relationship Manager (My Personal Vault), du quan-
tified self â la mesure de soi (BodyMedia), ou des pratiques de dĂ©veloppe-
ment durable (Green Button Data), pour ne citer que ces exemples-lĂ . La
relation aux donnĂ©es peut mĂȘme ĂȘtre mĂ©diĂ©e par des objets (Withings).
Â
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
28. Groupe de travail national 11 avril 2013 - Atelier 1
GREEN BUTTONSource : http://www.greenbuttondata.org
PAR WHITE HOUSE
29. Groupe de travail national 11 avril 2013 - Atelier 1
PARTAGER
Quant on cherche à partager des données brutes, ou à communiquer sur
leur analyse, plusieurs solutions sâoffrent Ă nous : La plus connue dâentre
elle est la datavisualisation. ĂnormĂ©ment de solutions techniques existent
en la matiĂšre : Voir la trĂšs riche boĂźte Ă outils dâExpoViz (made in La Fonde-
rie). Ces dataviz vont du graphique / diagramme classiques (Google Image
Chart) à des représentations plus sophistiquées (Treemap, graphe du web,
cartographie). Tous ces outils nécessitent un haut niveau de compétences
techniques.
Dâautres outils permettent de partager des donnĂ©es avec des tiers, en
maĂźtrisant, autant que possible, les termes de lâĂ©change. LĂ encore le
champ des données personnelles est riche (Mine!Project, Personal.com).
Dans le champ des données de santé, on trouve des plateformes de par-
tage collectif de données (Curetogether, Asthmapolis).
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
30. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
GOOGLE IMAGE CHARTSource : http://www.imagecharteditor.appspot.com
PAR GOOGLE
31. Groupe de travail national 11 avril 2013 - Atelier 1
ANALYSER
Dans le champ de lâanalyse des donnĂ©es, ce quâon identifie comme outils
(Precog, Continuuity, StatMix, Coheris Liberty, Google Prediction API), pla-
teformes de services (DataPublica, Qunb, Captain Dash) offrent la possibi-
lité de construire des modÚles décisionnels, voire des modÚles prédictifs,
via des interfaces finales, des tableaux de bord. La complexité des opéra-
tions sous-jacentes liĂ©es au traitement des donnĂ©es nâest pas explicitĂ©e
: Comment sâopĂšrent les corrĂ©lations entre jeux de donnĂ©es, quels sont
les considérations, les choix qui prévalent aux datavisualisations, aux ta-
bleaux de bord ? Comment se font les modĂ©lisations, les simulations ? OĂč
se trouve la part de décision humaine dans les process ? Les pondérations
dépendent-elles essentiellement des profils techniques ?
A lâopposĂ©, dans le champ des sciences humaines, Ă©mergent des mĂ©tho-
dologies â et outils â permettant de mettre les donnĂ©es en dĂ©bat : la mĂ©-
thode dĂ©veloppĂ©e par lâANACT/AlterCarto autour de la plateforme ATTLAS
montrait comment les acteurs pouvaient monter en compétences et opé-
rer leur propre corrélation de données. La méthode de cartographie des
controverses, développée par Bruno Latour, va aussi dans ce sens. Face
à des phénomÚnes sociaux (scientifiques, techniques) non stabilisés, les
cartographies des controverses mettent en visibilité différents points de
vue qui sâopposent, afin de favoriser lâobjectivitĂ© dans les prises de dĂ©ci-
sion qui peuvent découler.
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
32. Groupe de travail national 11 avril 2013 - Atelier 1
CAPTAIN DASHSource : http://www.captaindash.com
PAR GILLES BABINET & BRUNO WALTHER
33. Groupe de travail national 11 avril 2013 - Atelier 1
ET MAINTENANT, QUE FAISONS-NOUS ?
Ce travail de recensement et dâanalyse des formes de mĂ©diation existantes
(quâelles soient humaines, sous forme dâoutils et de mĂ©thodologies, de
ressources documentaires ou de servicesâŠ) ne fait que commencer. Il se
poursuivra jusquâĂ la rentrĂ©e 2013.
Livrer ce premier niveau de lecture Ă©tait instructif rien quâau regard :
de la nature des ressources disponibles : plus outils que ressources docu-
mentaires ou méthodologiques ou ludiques ; du niveau requis de compé-
tences pour leur utilisation : du geek au développeur professionnel, majo-
ritairement. Â
Les données sont encore largement affaire de spécialistes⊠On le savait.
Quasiment tout reste à faire en matiÚre de démocratisation des données
et Ă tout niveau : sensibilisation, information, formation, accompagne-
ment, services.
Heureusement, la campagne Infolab ne fait que commencer !
Fabienne GUIBĂ, Chef de projet, Fing.
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
34. Groupe de travail national 11 avril 2013 - Atelier 1
MĂDIATION : UNE NOTION FLOUE VICTIME DE SON SUCCĂS
Par Faustine BOUGRO
35. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
AprĂšs ces temps dâexploration, Sarah Labelle (maĂźtre de confĂ©-
rence en SIC, Paris 13) a mis en lumiĂšre une nouvelle entrĂ©e dans lâĂ©co-
systÚme de la donnée, celle de la médiation, notion floue victime de son
succĂšs. Cette ouverture sâest rĂ©vĂ©lĂ©e ĂȘtre lâobjet dâenjeux, qui dĂ©termine-
ront lâĂ©volution dâune culture de la donnĂ©e face aux transformations qui
rythment notre société.
La donnĂ©e dite brute transforme sa valeur dĂšs lors quâelle est rendue intel-
ligible et visualisée. Aussi, toute mise en forme de données, visant à favo-
riser la comprĂ©hension, construit une mĂ©diation, et câest justement parce
que le pouvoir de lâimage semble plus immĂ©diat que celui dâun corpus de
texte, que cette mĂ©diation doit ĂȘtre rĂ©flĂ©chie. Effectivement, la rĂ©utilisa-
tion de donnĂ©es brutes en vue dâun traitement intelligent, engage nĂ©ces-
sairement des objectifs différents de ceux qui ont présidé à la collecte.
En cela, toute forme ou processus de mĂ©diation reflĂšte la place que lâon
souhaite donner Ă lâobjet mĂ©diĂ© dans son environnement. De fait, la notion
de médiation nous incite à réfléchir, à travers nos conceptions du statut
des données dans la société, aux formes et processus que nous souhai-
tons mettre en place. Ce dernier champ a ainsi su Ă©veiller notre attention
quant aux problématiques soulevées qui esquissent de futurs champs
dâaction pour lâInfolab.
Le premier repĂšre constitutif de cet Ă©cosystĂšme est la position humaine
relative Ă lâutilisation des diffĂ©rents dispositifs et aux rĂ©percussions de ces
derniers sur lâappropriation et la production de sens. Le deuxiĂšme repĂšre
significatif est le scĂ©nario dâusage engageant la participation, Ă savoir le
contexte au sein duquel la médiation est pratiquée.
Aussi, réfléchir sur les modalités de participation comme un processus so-
36. Groupe de travail national 11 avril 2013 - Atelier 1
cio-technique, nous a amené à observer de quelle maniÚre les dispositifs
de médiation façonnaient notre sensibilité, notre participation et quels
modÚles de pensée ils suggéraient. Les dispositifs de médiation, présen-
tĂ©s par Amandine BrugiĂšre (Fing), peuvent ĂȘtre abordĂ©s comme diffĂ©-
rentes techniques et outils pour crĂ©er la rencontre. Lâusage Ă©tait selon les
dispositifs plus ou moins encadrĂ© et donc plus ou moins spontanĂ©. JusquâĂ
quel point peut-il fournir des cadres pour limiter les abus ? Quelles marges
de liberté la médiation confÚrent-elles aux citoyens ?
NâOUVRENT-ELLES PAS DE NOUVELLES CONFIGURATIONS
ENTRE LES ACTEURS ?
à ce niveau, plutÎt que de réfléchir la médiation comme un procédé linéaire
allant du savoir Ă lâobjet, on la conçoit comme une Ă©conomie dâinterac-
tions au sein de laquelle les participants sâenrichissent mutuellement. Les
dispositifs de médiation se doivent alors de conceptualiser une structure
dynamique, malléable et participative composant un modÚle réceptif aux
usages et aux imaginaires de différents individus et engageant ainsi une
nouvelle forme de dialogue, qui sâenrichira au travers dâinteractions nĂ©go-
ciĂ©es. Il sâagit bien de produire de lâintĂ©rĂȘt gĂ©nĂ©ral tout en prĂ©servant les
spĂ©cificitĂ©s individuelles. Penser la mĂ©diation, câest Ă©galement prĂŽner une
utilisation plus située, une gestion plus contextuelle des problématiques,
avec ce quâelle implique dans la circulation dâinformation du mĂ©diateur
vers son public et inversement.
Si lâon Ă©voque beaucoup la pĂ©dagogie envers les citoyens dans les procĂ©-
dures de participation, il apparaßt que pour réussir cette combinaison, les
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
37. Groupe de travail national 11 avril 2013 - Atelier 1
acteur publics et privĂ©s doivent eux-mĂȘme ĂȘtre dĂ©tenteurs dâune Ă©duca-
tion Ă la reprĂ©sentation, Ă lâanalyse visuelle, Ă la synthĂšse graphique pour
que ces dispositifs hybrides soient pleinement préhensibles. De surcroit,
la participation doit ĂȘtre dĂ©clenchĂ©e et motivĂ©e, pour dĂ©couvrir toute sa
puissance. Câest pourquoi accorder la reprĂ©sentation de la donnĂ©e et la
participation nécessite un cahier des charges éclairé et un travail attentif
de lâexpĂ©rience utilisateur.
LâidĂ©e dâune plateforme musĂ©ale de la donnĂ©e, comme un territoire Ă ex-
plorer, au travers duquel chacun pourra bùtir sa place, développant son
champs des possibles, a été introduite par Sarah Labelle  : « Comment
pourrait-on mettre en avant des donnĂ©es stabilisĂ©es? ». Elle nous lâex-
plique : « cette plate-forme permettrait dâoffrir des expositions temporaires
sur des sujets thĂ©matiques ; une collection fixe, ce que lâon pourrait consi-
dérer comme un cadrage général pour entrée dans la culture de la donnée ;
des ateliers de manipulation réclamant les mains dans le cambouis ; des
visites guidĂ©s dâentrepĂŽt de la donnĂ©e ; et surtout un espace collaboratif de
co-construction autour de projets mobilisant la donnée ».
Faustine BOUGRO, Designer, Fing
INVENTONS ENSEMBLE LâINFOLAB COMMENT CONSTRUIRE UN GUIDE DE MĂDIATION
38. Groupe de travail national 11 avril 2013 - Atelier 1
OCCUPY WALL STREETSource : http://www.clickklack.net
PAR DARWIN YAMAMOTO
39. Groupe de travail national 11 avril 2013 - Atelier 1
LA CULTURE DES DONNĂES EN ENTREPRISE
Par Claire GALLON
40. Groupe de travail national 11 avril 2013 - Atelier 1
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
La gestion des données en entreprise ne concerne plus unique-
ment les acteurs du web et les grands comptes. Toutes les entreprises
créent des données numériques : données financiÚres, données sur la
clientÚle, données de localisation ou de production⊠Et ces données font
de plus en plus partie des valeurs commerciales.
Aujourdâhui, les entreprises et notamment les petites entreprises qui
nâont pas encore dĂ©veloppĂ© de valorisation de leurs donnĂ©es doivent ap-
prendre Ă dĂ©velopper une culture de traitement en interne afin dâidentifier
et profiter de la valeur qui se cache notamment derriĂšre :
- Les donnĂ©es de prĂ©sentation gĂ©nĂ©rale de lâentreprise : localisation, rĂ©fĂ©-
rencement, finances...
- La collecte de données sur les clients
- Les données sur les offres, produits, services
- Les données de qualité, satisfaction, et relation client
- Les données décisionnelles, prévision, prédiction, analyse
- Les donnĂ©es de temporalitĂ© dans lâentreprise : agendas, congĂ©s, saison-
nalité
- Les donnĂ©es dâimpact social et environnemental, RSE
- Les données des Ressources Humaines
Lâobjet de lâatelier « DonnĂ©es des Entreprises » organisĂ© durant la premiĂšre
rencontre Infolab et animé par Charles Nepote (FING) était de proposer
des thĂšmes et exercices autour de lâintĂ©gration dâune culture de donnĂ©es
en entreprise en questionnant la qualification et normalisation des don-
nĂ©es en interne ainsi quâen illustrant les Ă©changes de cas concrets.
41. Groupe de travail national 11 avril 2013 - Atelier 1
LES PROBLĂMES DE STANDARDISATION DES DONNĂES
Afin dâinitier les participants Ă la question de qualification des donnĂ©es,
la liste des inscrits Ă lâatelier Infolab extraite du logiciel de la Fing a Ă©tĂ©
présentée et soumise aux commentaires. Les participants étaient invités
à exprimer leurs retours et étonnements sur cette liste qui détaille les
noms, prénoms, adresse email, coordonnées, et ville des inscrits.
Les premiers étonnements relÚvent le caractÚre hétéroclite des rensei-
gnements fournis dans la base de données et ce malgré la collecte via un
formulaire-type unique.
Parmi les problÚmes de standardisation identifiés :
Les problĂšmes de casse : des noms tantĂŽt en majuscules et tantĂŽt en
minuscules.
Ce qui questionne la clarté de la présentation en cas de publication.
Les problÚmes de champs : des adresses email renseignées dans le
champs des noms de famille.
On ne connaĂźt donc pas lâidentitĂ© de la personne qui participera. Il y a des
adresses email personnelles renseignées au lieu des adresses profession-
nelles, on ne sait donc pas si la personne participe Ă titre personnel ou sâil
nâexiste pas de mail dâentreprise.
Les problÚmes de doublons : un inscrit renseigné à deux reprises.
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
42. Groupe de travail national 11 avril 2013 - Atelier 1
Ces doublons peuvent biaiser le nombre de participants inscrits, Ă moins
que lâauteur nâait effectuĂ© une inscription pour une tierce personne dont
on ne connaĂźt pas lâidentitĂ©.
Les problĂšmes dâexhaustivitĂ© : certains champs ne sont pas renseignĂ©s
(organisation par exemple).
Il manque des noms dâorganisations et le champs « ville dâorigine » a ra-
rement Ă©tĂ© renseignĂ©. Il nâest dâailleurs pas prĂ©cisĂ© sâil sâagit de la ville
dâorigine du participant, de la ville dâimplantation de lâorganisation, son
siĂšge social ? Ces manquements limitent les bĂ©nĂ©fices dâusage de la liste
dâinscription.
Les problĂšmes dâidentifiants : une mĂȘme structure renseignĂ©e avec son
nom ou son acronyme.
A dĂ©faut dâidentifiant unique, les opĂ©rations de tri des participants par
organisation ou dâidentification du nombre dâorganisations prĂ©sentes
se rĂ©vĂšlent erronĂ©s. On pourrait comptabiliser plusieurs fois une mĂȘme
structure sans mĂȘme relever la possibilitĂ© du doublon car il peut y avoir
confusion sur lâidentitĂ© de lâorganisation. Rennes MĂ©tropole dĂ©signe lâor-
ganisation plutĂŽt que la ville. Si ALVLF est le nom dâusage pour Alcatel-
Lucent, peu de personnes les connaissent cependant sous cet acronyme.
Il y a de véritables enjeux autour des identifiants et une position de pou-
voir pour leurs détenteurs qui peuvent faire disparaßtre une identité ou la
recouper. Si lâadresse e-mail dâun participant pourrait constituer un identi-
fiant unique interne, elle pose Ă©galement problĂšme en cas de changement
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
43. Groupe de travail national 11 avril 2013 - Atelier 1
de fournisseur dâaccĂšs.
Les problĂšmes de droits : lâusage des donnĂ©es doit ĂȘtre dĂ©fini dans un
périmÚtre pré-établi.
La collecte de données personnelles tombe sous la loi Informatique et Li-
bertĂ©s et impose de dĂ©poser une dĂ©claration dâusage rendant la base inex-
ploitable dans des cas dâutilisations non-identifiĂ©s au prĂ©alable. Comment
faire quand on ne sait pas systématiquement quels usages peuvent suivre
? Et quid de la diffĂ©renciation de lâadresse professionnelle et personnelle ?
DES DĂMARCHES DE QUALIFICATION DES DONNĂES
Avoir une liste qualifiée de participants à un événement est pourtant pri-
mordial. Si quelquâun nâest pas dans la liste dâun Ă©vĂ©nement alors quâil
essaye dây entrer aprĂšs sâĂȘtre inscrit, cela dĂ©montre un certain amateu-
risme et impacte la relation client.
DiffĂ©rentes procĂ©dures permettent pourtant dâoptimiser et mieux quali-
fier une base. Il serait ainsi possible de rajouter une case de reconnaissance
des emails pour automatiser le renseignements des champs et Ă©viter aux
participants de remplir Ă nouveau le formulaire. SĂ©parer les champs noms
et prĂ©noms permet de clarifier lâidentitĂ©. La casse peut ĂȘtre normalisĂ©e
automatiquement. Des infobulles ou informations complémentaires des
champs permettraient de mieux préciser les attentes de remplissage. Il
est enfin possible de proposer une reconnaissance des structures par liste
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
44. Groupe de travail national 11 avril 2013 - Atelier 1
existante pour sâassurer dâune dĂ©nomination unique des organisations, ou
crĂ©er un champs « nom dâusage » en plus du nom de lâorganisation. On
peut encore rendre obligatoire le renseignement de tous les champs pour
Ă©viter les absences de renseignements. Ces procĂ©dures requiĂšrent dâorga-
niser une réflexion sur la qualification des données.
On peut également permettre aux participants de modifier leurs données
a posteriori, Ă lâimage du projet Mesinfos. Dans un tableur, on peut dĂ©dou-
blonner ou ajuster la casse automatique voire utiliser des outils plus puis-
sants comme OpenRefine. Des outils de CMS existent aussi pour nettoyer
les bases. Sâils nĂ©cessitent un investissement, ils permettent dâavoir une
base toujours à jour et qualifiée en normalisant et utilisant les nomen-
clatures dâusage. Il existe des sociĂ©tĂ©s spĂ©cialisĂ©es dans la correction de
fichiers (casse, doublons, conversion, etc.), tel Datalgo.
Si la normalisation est essentielle Ă lâexploitation des donnĂ©es, la culture
de traitement quâelle implique nâest pas Ă©quitablement rĂ©partie. Lorsque
Tom Tom demande des donnĂ©es du territoire Aquitaine quâil ne rĂ©utilise
finalement pas car elles ne sont pas assez bien organisées, on constate
que la qualité des données est asymétrique et que la faible qualification
représente une perte de valeur. Si des outils existent pour améliorer les
données, tout ne se résoudra pas par les outils qui suivent les pratiques,
les usages et la normalisation. Au W3C, il faut au moins deux ans pour
valider une norme tandis que les données qui intÚgrent une composante
sociale Ă©voluent bien plus rapidement.
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
45. Groupe de travail national 11 avril 2013 - Atelier 1
VERS UNE CULTURE DES DONNĂES
La question de normalisation est complexe et différente selon la typolo-
gie des données : géographiques, personnelles, textuelles, etc. Elle diffÚre
Ă©galement dans le temps : les enseignants ont longtemps appris Ă ne pas
mettre dâaccent sur les majuscules car il nây en avait pas sur les machines
Ă Ă©crire. Comment proposer des solutions Ă la normalisation et suivre leur
évolution ? Faut-il former les employés ?
Il semble a priori difficile de faire en sorte que le problÚme du réutilisateur
de la base (qui a besoin dâune base spĂ©cifiquement qualifiĂ©e) devienne le
problĂšme du producteur de la base surtout quand celle-ci rĂ©pond dĂ©jĂ Ă
ses besoins. Pourtant au sein des structures, de mĂȘme jeux de donnĂ©es
sont maintenus par plusieurs services pour différents usages. Que ces dif-
férents secteurs réalisent la nécessité de la normalisation est hautement
pertinent.
La normalisation fait penser Ă la grammaire, qui est faite pour communi-
quer avec les autres. On a appris Ă Ă©crire son nom avec une majuscule, ces
rĂšgles sont culturelles. Bien souvent, on ne respecte pas les standards car
on ne sait pas Ă quoi ils servent et ce quâils facilitent. Expliquer la raison
de chaque collecte des donnĂ©es peut ĂȘtre un premier pas. Il serait possible
dâimaginer des formations Ă la standardisation et des animations propo-
sant de crĂ©er un jeu oĂč lâon amplifie les erreurs pour rendre lâenjeu de la
normalisation compréhensible.
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
46. Groupe de travail national 11 avril 2013 - Atelier 1
LA MAITRISE DE SES DONNĂES, COMME DE SON IMAGE DE MARQUE
Les participant de lâatelier Infolab ont Ă©tĂ© invitĂ©s Ă Ă©tudier la diffĂ©rence de
référencement en ligne de plusieurs organisations. En utilisant le moteur
de recherche de Google, ils ont questionné les différences de présenta-
tion des structures suite aux requĂȘtes FING, Alcatel Lucent, Gemalto ou
Orange.
Pour la FING il y a uniquement la présentation du site et de ses rubriques.
Pour Alcatel on retrouve un plan dâaccĂšs et un lien vers lâarticle de Wikipe-
dia. Pour Gemalto, les coordonnées sont également indiquées tandis que
la requĂȘte pour Orange nous indique les trois agences les plus proches.
On constate que le niveau dâinformation et la trouvabilitĂ© dâune organi-
sation peut montrer de grandes disparités. Or la qualité des résultats
dĂ©pend largement des informations et donnĂ©es de lâorganisation trou-
vĂ©es sur internet : donnĂ©es fournies par lâentreprise mais aussi donnĂ©es
issues dâautres personnes. Lâexemple ci-dessus illustre la dĂ©pendance Ă
un moteur de recherche. Comment avoir de meilleures données pour un
meilleur référencement ? Le projet Google Knowledge Graph vise à relier
des informations entre elles grĂące Ă des relations comme sur DBpedia.
ComplĂ©ter ses donnĂ©es dans Dbpedia ou dâautres sources, devient donc
une forme dâenjeu marketing. Suivre les dĂ©marches de schema.org Bing,
Yahoo, Google, qui ont des impacts en terme de référencement des sites
web devient indispensable.
Le quasi monopole de Google sur la recherche en ligne impose de suivre
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
47. Groupe de travail national 11 avril 2013 - Atelier 1
de prĂšs ses mĂ©thodes de rĂ©fĂ©rencement et ses stratĂ©gies afin dâassurer
sa propre visibilité en ligne. En Aquitaine, un chùteau a été déclassé des
listes de référencement car il lui manquait des points de notoriété web,
bien que ces indicateurs soient diffĂ©rents selon le lieu de requĂȘte.
Sâagissant de prĂ©sentation gĂ©nĂ©rale de lâentreprise, les donnĂ©es des si-
gnatures des emails sont aussi une maniÚre de se présenter et de pré-
senter son organisation. Certains utilisent des fichiers Vcard (.vcf) qui sont
de vĂ©ritables fichiers de donnĂ©es. Dâautres se contentent dâune signature
rédigée dans le corps et automatiquement ajoutée à chaque email. Ces
signatures dans le corps des emails peuvent ĂȘtre automatiquement ana-
lysées, extraites et transformées en données, par des services comme
Writethatname qui peuvent enrichir automatiquement les donnĂ©es dâun
CRM. Demain il pourait ĂȘtre capable de publier de lâinformation en ligne
comme les organigrammes des entreprises.
Ce rapide tour dâhorizon de la qualification des donnĂ©es en entreprises dĂ©-
montre que lâappropriation dâune culture de donnĂ©es en interne est dâau-
tant plus nĂ©cessaire au sein du secteur privĂ©. Lâexploitation de ces don-
nées pour mieux gérer, optimiser et valoriser ses ressources représente un
avantage concurrentiel non-négligeable dans une situation économique
tendue. Comment standardiser ses données ? Comment former et implé-
menter des méthodes de normalisation ? Autant de questions que les
Infolabs se proposent dâexplorer.
Claire GALLON, LiberTIC
INVENTONS ENSEMBLE LâINFOLAB LA CULTURE DES DONNĂES EN ENTREPRISE
48. Groupe de travail national 11 avril 2013 - Atelier 1
Amandine BRUGIĂRE, ChargĂ©e de mission, FING
Email : abrugiere@fing.org
Faustine BOUGRO, Designer, FING
Email : fbougro@fing.org
Fabienne GUIBĂ, Chef de projet, FING
Email : fguibe@fing.org
Loup CELLARD, Assistant Chef de Projet, FING
Email : lcellard@fing.org
Charles NEPOTE, Directeur de programme dâaction, FING
Email : cnepote@fing.org
Vincent MANDINAUD, Chef de projet ATTLAS
Email : v.mandinaud@anact.fr
Hervé PARIS, Chef de projet AlterCarto/Cité Publique
Email : cite.publique@wanadoo.fr
Sarah LABELLE, Maßtre de conférence en SIC, Paris 13
Email : sarah.labelle@sic.univ-paris13.fr
Simon CHIGNARD, Consultant Open Data
Email : simonchignard@me.com
Claire GALLON, Co-fondatrice et administratrice, LiberTIC
Email : claire.gallon@gmail.com
Pour plus dâinformations : http://www.reseaufing.org
INVENTONS ENSEMBLE LâINFOLAB CONTACT