Compte de rendu de sessions du 80ème congrès mondial des bibliothèques IFLA 2014 : le dépôt légal des ebooks, la fouille de données (Text&Data Mining), les posters scientifiques, l'IdeasBox (médiathèque mobile pour camps de réfugiés)
1. Session 87 --- Digital preservation of e-books: Best practice in libraries
Session 96 --- Poster session
Session 119 — Research in the big data era
2. Définition du livre numérique
Ouvrage édité et diffusé sous forme numérique, destiné à être lu sur un écran
Note : 1. Le livre numérique peut être un ouvrage composé directement sous forme numérique ou numérisé à partir d'imprimés ou de manuscrits 2. Le livre numérique peut être lu à l'aide de supports électroniques très divers 3. On trouve aussi le terme « livre électronique », qui n'est pas recommandé en ce sens.
4, Équivalent étranger : e-book, electronic book
Source : JORF n°0081 du 4 avril 2012 page 6130 texte n° 118 « Vocabulaire de l'édition
et du livre (liste de termes, expressions et définitions adoptés) » (NOR: CTNX1206650K)
Le livre numérique peut être composé directement sous forme électronique ou bien numérisé à partir d’imprimés ou de manuscrits. S’il est une version électronique d’un ouvrage imprimé, il est qualifié d’homothétique et entre dans le cadre de la Loi n° 2011-590 du 26 mai 2011 relative au prix du livre numérique.
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
3. SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES - INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
•Le dépôt légal couvre tout les ouvrages de langue allemande publiés depuis 1913, qu’ils soient numérisés ou nativement produits sous forme numérique
•1262593 ressources ont été collectées en 2014, dont 755000 ebooks et thèses en ligne
•Le processus est entièrement automatisé mais les bibliothécaires interviennent en entrée (choix des catalogues moissonnés…) et sortie de système (contrôle des métadonnées) L’automatisation du workflow nécessite que certaines caractéristiques techniques soient correctement remplies :
•les métadonnées et les objets doivent être collectés ensemble
•le format des métadonnées doit être standard (ONix for Book 2.1, MARC XML, XMETADISS+, tout comme celui des fichiers informatiques (PFD, EPUB, MP3, JPEG, ZIP, etc.)
•des accords doivent être passés avec chaque éditeur
•les DRM sont refusés (comme à la BnF)
Allemagne : processus automatisé de collecte des livres électroniques dans le cadre du dépôt légal
4. SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
•Après dépôt par les éditeurs sur un répertoire ftp du livre électronique, le fichier de métadonnées sous ONIX est converti de l’XML vers l’INTERMARC : l’ONIX permet la création automatique de liens vers les différentes formats d’une même oeuvre (version imprimable, etc.)
•Contrairement aux métadonnées, les fichiers d’ebook ne sont jamais convertis : ils sont validés par Epubcheck, un outil développé par l’International Digital Publication Forum (IDPF)
•Ils doivent ensuite être préparés à rejoindre SPAR (Scalable Preservation and Access Repository), le répertoire digital de Gallica, qui traite notamment l’identifiant persistant ARC de l’ebook
•les fichiers qui contiennent des éléments Flash ou Javascript, potentiellement viraux, sont placés dans un espace sécurisé.
France : Schéma d’intégration des ebooks dans Gallica
5. SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
Japon : le dépôt légal des ebook à la bibliothèque de la Diète En 2012, la loi NDL donne à la National Diet Library le droit d'enregistrer "les publications en ligne" issues du secteur privé.
•Les éditeurs privés sont alors tenus de communiquer à la NDL leur publications numériques (contenu de sites web, livres numériques, publications électroniques, etc.)
•Ils doivent permettre le cas échéant la collecte des fichiers numériques sur l'Internet; mais la NDL ne peut recueillir que les publications en ligne gratuites et non protégées par la gestion des droits numériques (DRM) Cette loi est difficile à appliquer car les éditeurs ne collaborent pas.
•seules 18000 publications issues du secteur marchand ont été intégrées au dépôt légal.
•Pour contourner cet écueil, la NDL a passé avec des éditeurs majeurs des accords de coopération temporairement d’une durée de 3 ans...
6. SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
la Bibliothèque nationale et universitaire de Zagreb est tenue de recueillir et de conserver dans le cadre du dépôt légal (Law Library, 1997) toutes les publications électroniques (y compris les ressources en ligne). Le développement de l'infrastructure de bibliothèque numérique a donc débuté en 2004 avec l’archivage du web (Croatian Web Archives) et s'est poursuivi avec la mise en place de systèmes spécialisés de gestion des périodiques numérisés (2009), des thèses (2010) et des e-books (2012). La commercialisation de livres numériques en langue nationale n’est apparue qu’en 2010 :
•Depuis cette date, 330 ebooks ont été commercialisés par quatre éditeurs. Mais la protection par DRM est largement minoritaire.
• Il y aurait en effet plus de 1800 ebooks gratuits en langue croate, produits pour la plupart en auto-édition.
•Tous les types de publications monographiques disponibles sous forme numérique (livres numériques et numérisés, livres audionumériques) sont archivés dans un système de bibliothèque numérique (D-book).
Croatie : le dépôt légal des ebooks, élément de constitution d’une identité culturelle nationale
7. •la Bibliothèque nationale de Chine (NLC) prend la responsabilité de la collecte des publications nationales et étrangères pour mieux préserver le patrimoine culturel de l’humanité dans son ensemble…
•Le National Digital Library Project a ainsi archivé plus de quatre millions de volumes.
•La bibliothèque respecterait les règles internationales de copyright lorsqu’elle importe des livres électroniques commerciaux : l'ensemble des ressources peut être donc être consulté dans et hors la bibliothèque, sous réserve d’inscription sur son site web...
Description du projet :
http://www.dlib.org/dlib/may10/dawei/05dawei.html
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
Chine : le dépôt légal des ebooks inclus les publications étrangères
8. SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES - NFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
Indonésie : numérisation de manuscrits
La bibliothèque nationale d’Indonésie (Museum and National Library of Indonesia) est une agence gouvernementale chargée de la préservation du patrimoine écrit.
•Il n’y a pas de dépôt légal des ebooks
•Le programme de numérisation est valorisé sur www.indonesiaheritage.org)
•La numérisation doit tenir compte de contrainte de coût, de faisabilité technique et d’usages potentiels
9. Conclusion :
•Il reste difficile pour la plupart des bibliothèques nationales de mettre en place un système de dépôt légal des livres numériques commerciaux, en raison d’une moindre collaboration des éditeurs.
•Les processus techniques de moissonnage des fichiers sont relativement similaires
•Le processus est entièrement automatisé mais les bibliothécaires interviennent en entrée (choix des catalogues moissonnées…) et sortie de système (contrôle des métadonnées).
•La formation continue des personnels est un facteur important de réussite.
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
10. Big data
•Le terme Bigdata (en français « mégadonnées » parfois appelées « données massives » désignent des ensembles de données si volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information.
•Ces données sont brutes, semi-structurées voire non structurées provenant du web (Web Mining), au format texte (Text Mining) et images (Image Mining).
•Ces données peuvent être publiques (Open Data, Web des données), géographiques (adresses IP), ou relever de la propriété des consommateurs (Profils 360°).
Text & Data Mining (TDM)
•La fouille de textes ou «extraction de connaissances » est un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité.
•La première étape, l'analyse, consiste à reconnaître les mots, les phrases, leurs rôles grammaticaux, leurs relations et leur sens. Cette première étape est commune à tous les traitements.
•La seconde étape, l'interprétation de l'analyse, permet de sélectionner des éléments du texte pertients parmi d'autres.
•Exemples d'applications : création automatique de résumé de texte
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
11. SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
la réutilisation des données est un facteur intrinsèque au TDM : d'où système juridique #wlic2014 #bigdata
Généralement les données ne sont protégées par copyright contrairement à la publication #wlic2014
Le copyright intervient à partir du moment l'information brute est analysée (ex. les métadonnées en catalogage) #wlic2014 #bigdata
au USA le « Fair use » exception réglementaire pour l'utilisation du TDM dans le cadre de le Recherche #wlic2014
En France les licences autorisent la TDM uniquement sur les publications auxquelles l'université est abonnée #wlic2014
12. La keynote de Susan Reilly (Liber) http://library.ifla.org/id/eprint/1007 #bigdata
"TDM saves lives" en médecine, le TDM permet de rapprocher des données issues de la biologie #wlic2014 #bigdata
Selon S. Reilly, l'exception de copyright pour le TDM aux USA n'est pas claire. Situation à ne pas transposer en UE #wlic2014 #bigfaya
Dans le cadre de Licences for Europe, la Commission a proposé d’autoriser le TDM par le biais des licences des bases de données #wlic2014 #bigdata
Pour Liber, le régime des licences adaptées par les fournisseurs pour le TDM n'est pas acceptable #wlic2014 #bigdata
Pour Liber, il faut un régime d'exception au droit d'auteur pour le TDM. C'est une garantie de liberté pour la recherche #wlic2014 #bigdata
Pour des questions plus précises sur le TDM et le droit d'auteur, contacter Susan Reilly sur @LIBEReurope #wlic2014 #bigdata
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
13. La keynote de Sarah Jones (Digital Curation Center) http://library.ifla.org/id/eprint/958 #wlic2014
Le PGD (plan de gestion des données) est un outil web permettant de répondre aux demandes des chercheurs pour le TDM #wlic2014 #bigdata
Ce PGD multilingue est développé par le DCC. Il vient en complément des outils de découverte, d'analyse, de stockage des données #wlic2014
Le registre des données de recherche (REF) est un outil statistique à destination des financeurs
Outils gratuits pour le catalogage des données : Datafinder tools (Oxford), c4D, CKAF. #wlic2014
Un outil libre de découverte , le RDRDS; le traitement des métadonnées étant un exercice difficile, le DCC améliore cet outil #wlic2014
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
La gestion des données de recherche est facilitée par la définition d’un plan de gestion de données (PGD) ou Data Management Plan (DMP), document formel explicitant la façon dont on obtient et analyse vous les données. Il décrit dans le détail les méthodes et processus de création, de fourniture, de maintenance, de conservation et de protection des données (des modèles de PGD sont téléchargeables ici)
14. Plan de gestion des données (Research Data Management )
Outils gratuits pour le catalogage des données : Datafinder tools (Oxford), c4D, CKAF et Un outil libre de découverte , le RDRDS; le traitement des métadonnées
Collaborative Assessment of Research Data Infrastructure and Objectives (CARDIO) : outil pour l’évaluation collaborative des données de recherche
Data Asset Framework (DAF) : outil pour gérer les données de l'activité des chercheurs ( bases utilisées; prévisionnel de recherche)
Registre des données de recherche (REF) : outil statistique à destination des financeurs
Outil de gestion des risques de conservation dans un dépôt numérique
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
Niveau stratégique
Les Outils du DDC pour le TDM
15. IDEASBOX : MÉDIATHÈQUE MOBILE POUR SITUATION DE CRISE
l’Ideas Box fournit aux réfugiés des outils essentiels pour mieux se reconstruire. Elle leur permet d’accéder à Internet, aux livres, à des ressources pédagogiques et multimédia…
1 médiathèque dans 4 boites
17. IDEASBOX : MÉDIATHÈQUE MOBILE POUR SITUATION DE CRISE
Le cybercafé
Espace multimédia et coffre de rangement pour les tablettes tactiles
18. IDEASBOX : MÉDIATHÈQUE MOBILE POUR SITUATION DE CRISE
Le coin jeux
Espace télévision et jeux de société
19. ESPACE EXPOSANTS : LA MÉDIATHÈQUE DU FUTUR
Nouveau mobilier :
Distributeur de livres et fauteuils de lecture
20. SESSION 96 — POSTER SESSION
Le poster de recherche scientifique
Le poster est utilisé pour présenter des études et des résultats scientifiques lors de colloques professionnels Il est généralement en anglais structuré selon la démonstration souhaitée et illustré de photos, schémas ou graphiques. Les titres du poster utilisent souvent les mots suivants : résumé, introduction, objectif, hypothèse, méthode, résultat (présenté sous forme de tableaux, de schémas ou d'images), conclusion, discussion, référence.
Plus de 200 posters étaient exposés dans le hall du Palais des congrès
Au delà de la valeur scientifique des présentations, les participants ont rivalisé d’imagination pour faire passer leur message.
21. SESSION 96 — POSTER SESSION
Le poster virtuellement tactile
Le poster du Danish Think Tank sur la bibliothèque du futur http://fremtidensbiblioteker.dk/in-english/
Le DTT est un établissement financé par le privé et le public pour aider les établissements danois à construire leur bibliothèque numérique.
Le poster présente une image intéressante, liée au numérique tactile : une main démultipliée
22. SESSION 96 — POSTER SESSION
Le poster avec tracts
Le poster de l’association des directeurs de CFCB :
http://assodircrfcb.files.wordpress.com/2014/04/flyer-a5-francais.pdf
Il est disponible en quatre langues (anglais, français, italien, espagnol)
23. SESSION 96 — POSTER 88
DIGITIZATION: COLLABORATIVE PROJECT DYNAMICS
Le poster le plus gracieux
Le poster de la BIU Cujas sur le programme de numérisation réalisé en partenariat avec le Cines et la BnF
24. SESSION 96 — POSTER 196
FADBEN: SUPPORTING AN INFORMATION- DOCUMENTATION CURRICULUM
Le poster avec marque-pages
Le poster de la FADBEN (Fédération des enseignants documentalistes de l'Éducation Nationale) était l’un des rares posters à oser être rédigé en français.
Il se caractérise par son dépouillement (un QR code renvoi vers le site de l’association) et l’ajout de marque-pages.
(D’autres posters étaient accompagnés de cartes de visites, de blocs de post-it gratuits, etc.)
25. SESSION 96 — POSTER 212
CYCLING FOR LIBRARIES - CYCLO-BIBLIO
Le poster avec cartes postales Le poster de l’association Cycling for libraries, une conférence internationale à vélo pour les bibliothécaires, est accompagné d’un gilet de cycliste et de cartes postales.
•Cyclo-biblio mêle les rencontres professionnelles, les visites de bibliothèques et la randonnée à vélo.
•Cyclo-biblio soutient également des valeurs environnementales et un mode de vie écologique.
26. SESSION 96 — POSTER 69
THE MEDIA LIBRARY, A PLACE TO ENJOY
Le poster glamour
Le poster de la médiathèque Aimé Césaire de Clermont-Ferrand développe le concept de troisième lieu à l’extrême en promouvant l’image de la bibliothèque comme lieu de rencontres amoureuses…
http://www.dailymotion.com/video/xxh9cc_la- nouvelle-mediatheque-de-blanzat_news
27. SESSION 96 — POSTER 204
NEREUS: THE FUTURE OF SOCIAL SCIENCES LIBRARIES
Le poster mystérieux
Le poster de l’association du consortium européen Nereus (www.nereus4economics.info) a attiré tous les regards.
Cette association vise à développer le numérique dans les bibliothèques de sciences sociales. Elle a pris le parti de présenter un poster Steampunk (rétrofuturiste)
28. SESSION 96 — POSTER 156
THE LIBRARY OF NAUTILUS: ACCUMULATING THE KNOWLEDGE OF THE OCEAN
Le poster pour enfants
The Ocean Science Library (OSL) est une bibliothèque universitaire coréenne spécialisée dans les sciences liés au monde maritime Elle est rattaché au Korea Institute of Ocean Science & Technology. La bibliothèque fait oeuvre de pédagogie en publiant des livres pour enfants : le poster joue sur le décalage entre le sérieux du sujet et la présentation graphique ludique.
29. SESSION 96 — POSTER 16
ALIA (AUSTRALIAN LIBRARY AND INFORMATION ASSOCIATION): FUTURE OF THE PROFESSION
Le poster gagnant Le prix The "Best IFLA Poster 2014« a été décerné à l’association ALIA. Le poster décrit l’évolution du métier de bibliothécaire sous une forme simple et efficace voir humoristique
•Un trésor national (le koala) sur votre liseuse
•Un abonnement à la bibliothèque pour chaque enfant dès sa naissance
•Une meilleure implication dans la vie économique
Notas do Editor
Si la situation de collecte peut apparaitre contrastée en raisons des particularismes locaux (la bibliothèque nationale d’Indonésie se concentre ainsi sur la préservation de son patrimoine via www.indonesiaheritage.org), il reste difficile pour la plupart des bibliothèques nationales de mettre en place un système de dépôt légal des livres numériques commerciaux, en raison d’une moindre collaboration des éditeurs.
Avec cette nouvelle architecture du dépôt légal des objets numériques, le rôle du bibliothécaires évolue fortement. Pour accompagner ce changement, la BnF a mis en place un programme de formation interne sous forme d’ateliers numériques : les formats de fichiers, le catalogage des livres numériques, etc. Le projet bénéficie également de l’expérience acquise par la BnF dans la constitution de la bibliothèque numérique Gallica, et aussi des pratiques d’archivage perennes du service de tiers archivage, BnF Archivage numérique.