2. Réunion d’information sur le data sprint des archives
1. “data sprint des archives” ?
où, quoi, qui, comment, pourquoi
planning, licences de réutilisation
1. exemples de visualisation de données
2.focus sur les données collectées
exemples
critères (structuration des données)
1. questions
3. Tour de table
Source : BanQ, Conrad Poirier [Public domain or Public domain], via Wikimedia Commons
4. “Data sprint des archives” ?
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
● Pourquoi ?
Souhait du comité scientifique d’organiser un
événement participatif
● Quoi ?
Choix du format de l’événement : un data sprint
étalé dans le temps
Collecte de données > réutilisation et développement de
dispositifs et dataviz par des équipes > restitution
5. “Data sprint des archives” ?
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
● Planning
● Comment
Des équipes, à distance voire locales // des outils collaboratifs en ligne
> Place des archivistes ? expliquer les données, nettoyer/normaliser les fichiers,
découvrir, apprendre et échanger
mars 2015 :
début de la
réflexion
juin 2015 :
choix du format, appel à
participation (archives)
mars 2016 :
FORUM
après ?
SAV et
débrief
juillet-déc. 2015 :
collecte des données
janvier-mars 2016 :
conception et dév.
des dispositifs
nov. 2015 :
réunion d’information
déc. 2015 :
appel à participation
(non archives)
6. “Data sprint des archives” ?
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
● Les licences des données collectées
Au choix :
- durée du forum (mais les dispositifs ne seront pas pérennes)
- ouverture des données (dispositifs pérennes et ouverts après le forum,
contenu open data / licences CC / ouvertes), avec accompagnement de
l’équipe data sprint (y compris après le forum)
Sur l’ouverture des données :
- impact très important en matière de communication très important
(visibilité, relais Etalab, etc.)
- tutoriel : L’open data culturel (MCC, 2013) : http://dai.ly/xyqrun
- tutoriel : Les licences Creative Commons (MCC, 2013) :
http://dai.ly/x1tg4gv
Exemples d’ouverture de données : AD71, AD78, AM Toulouse, téléversements
d’images sur Commons des AN, de la BAnQ, NARA, musées européens, etc.
7. 1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
Exemples de visualisation de données
ou comment obtenir, à partir d’un “simple” fichier XLS ou XML, toute sorte de chose...
8. Exemples de visualisation de données
Archives de la Manche (Pinterest)
Gallica (Pinterest)
Archives de Boulogne-Billancourt
9. Exemples de visualisation de données
Archives des Yvelines, liste des machines à
vapeur (données non exhaustives et non corrigées)
Voir carte de chaleur animée (heatmap)
Fichier XLS
CartoDB
10. Statistiques sur la structuration de fichiers XML et l’utilisation
des balises EAD
> les données comme aide à la décision
Exemples de visualisation de données
11. Avant-Après avec juxtapose.js http://goo.gl/yh0i00
Lieu de naissance et de mort à partir de fichiers XML-EAC
Visualisation des traités & accords de la France de 1500-1900 par lieux de signature conservés aux
#archives du Ministère des Affaires étrangères et européennes
Exemples de visualisation de données
12. Visualisation des expositions dans les musées français (1900-1950)
Fichier TXT initial
Exposition Fragonard au Petit
Palais, paris, du 21/02/1902 au
12/05/1902
“Plaisirs d’ornements”, Musée
des Beaux-Art de Lille, Lille,
janvier 1904
Fichier CSV_1
Titre_expo Lieu_musee Lieu_Ville Date_debut Date_fin
Exposition
Fragonard
Petit Palais paris 21/02/1902 12/05/1902
“Plaisirs
d’ornements
”
Musée des
Beaux-Art
de Lille
Lille janvier 1904
SPLIT + REGEX
OpenRefine
Titre_expo Lieu_musee Lieu_Ville Année Geoloc
Exposition
Fragonard
Petit Palais Paris 1902 51.45643;-
124789
Plaisirs
d’ornemen
ts
Musée des
Beaux-Art
de Lille
Lille 1904 31.45643;-
024789
OpenRefine
Nettoyage +
REGEX + API
13. Dataviz des relations autour de la #Galerie Bonnier grâce à
<cpfRelation> des notices XML-EAC
Réseaux des élèves-architectes (en bleu) par ateliers (en rouge) lors de l’enseignement aux
Beaux-Arts de Paris
Exemples de visualisation de données
14. Focus sur les données collectées
données structurées : fichier XML,
fichier Excel normalisé, etc.
vs
données non structurées
(beaucoup plus difficilement
utilisables) : fichier Word,
listes non normalisées
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
Fichier Sénateurs Second Empire
15. Focus sur les données collectées
On recherche encore : des statistiques (de type Google Analytics), des
données XML EAC, des images libres de droit, etc.
1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
Participants actuels Thèmes
AD10, AD26, AD31, AD35, AD50,
AD51, AD62, AD71, AD78, AD89,
AD95, AM Toulouse, AM Dijon, AM
Beaune, AM Orléans, AM Rennes,
Sénat, Inserm, Mémoire des Hommes,
La Parisienne de Photographie, INHA,
…
+ données disponibles sur les
portails open data
guerre et vie militaire, économie et
travail (machines à vapeur, syndicats,
grèves, factures), personnes (cartes
postales, bases nominatives),
monuments (MH, architectes), lieux
(cartes postales, plans,
monographies), héraldique,
associations, surveillance
Données de gestion (stats de service),
statistiques sites Internet)
16. 1. “Data sprint des
archives” ?
2. Exemples de
visualisation de données
3. Focus sur les données
collectées
4. Questions
A vos questions !
Question Mark Graffiti (Flickr) , CC BY 2.0
contact : forumdesarchivistes@archivistes.org
Maïwenn Bourdic - Antoine Courtin