Formation sur les approches d'activation de la découvrabilité pour les contenus culturels incluant 12 mesures à adopter tout en ayant recours aux communs numériques.
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
1. Enjeux et pratiques en matière de
découvrabilité des contenus culturels
BY Jean-Robert Bisaillon
formation présentée en ligne le 30 avril 2021 dans le cadre d’une collaboration avec ISOC Québec
http://bit.ly/ISOCdecouv2021
2. Menu du jour
1. Définition, contexte et problématique générale (15 minutes - 7
diapositives)
2. Observations pratiques (15 minutes - 10 diapositives)
a. ISNI, VIAF et les identifiants uniques
b. Outils de capture des métadonnées “métiers”
c. Données ouvertes et liées : Fondation Wikimedia, Wikidata,
Wikipedia
3. Jalons de la découvrabilité (20 minutes - 15 diapositives)
4. Questions-réponses (10 minutes)
3. Ministère de la Culture et des Communications (2021),
Guide des bonnes pratiques : découvrabilité et données en culture,
ISBN 978-2-550-89124-6 https://bit.ly/BonnesPratiquesDonnees (consulté le 27
avril 2021)
● Optimiser son site Internet - Utiliser des microdonnées structurées (Schema.org)
● Optimiser sa présence en ligne sur les espaces tiers et les médias sociaux
● Faire usage des communs Wikimedia
● Faire usage des identifiants uniques
● Exploiter les données d’usage
● Mutualiser les données et les opérations
○ Gouvernance
○ Interopérabilité
○ Nettoyage
4. Définition, contexte et problématique générale
Internet constitue une révolution parce que pour la première fois de l’histoire, il
permet aux humains de se constituer des actifs de savoirs partagés par les
moyens des télécommunications. Internet est un outil bi-directionnel et
contrairement au téléphone, il laisse des traces...
(voir Cardon, 2015, À quoi rêvent les algorithmes, Nos vies à l’heure des Big
Data, p. 18-19, 33-38).
5.
6. À qui appartient Internet?
Internet est un réseau technique régi par de nombreuses structures et règles de
gouvernance, par exemple l’ICANN et son groupe des parties prenantes non-
commerciales (NCSG) ou encore l’IETF et son régime de RFC (Requests for
Comments). La plupart des lieux décisionnels sont ouverts à la participation. En
théorie, Internet appartient à toutes celles et tous ceux qui s’y impliquent.
Jusqu’ici ceux qui s’y impliquent le plus sont Google, Amazon, Facebook et
Apple.
En complémentarité et parfois par opposition, existent les communs numériques.
7. Dominique Cardon est professeur de sociologie à
Sciences Po à Paris. Il y dirige le Medialab.
Culture Numérique est paru en 2019 et retrace
toute la généalogie d’Internet. C’est un ouvrage
de synthèse de première qualité pour mieux
comprendre le nouveau monde numérique. Nous
nous en inspirons pour cette formation car il est
indispensable que nous nous forgions une
culture numérique.
8. Découvrabilité
Selon l’Observatoire de la culture et des communications du Québec (2017) : La
découvrabilité est la capacité d’un contenu culturel de se laisser découvrir aisément
par le consommateur qui le recherche et de se faire proposer au consommateur qui
n’en connaissait pas l’existence.
Pour le LATICCE (2019), la découvrabilité est un système émergeant d’un ensemble
de processus qui structurent et déterminent la possibilité et la capacité des publics de
découvrir des produits en ligne diversifiés, particulièrement des produits de niche.
Pour metaD, la découvrabilité c’est la science des interactions prescriptives humain-
machine. Ses dispositifs encadrent l’accès au savoir numérisé : interfaces et pages
Web, interfaces vocales, bases de données, bases de connaissances, outils et
algorithmes de recherche, de recommandation, etc. Pour nous, la découvrabilité, ce
n’est pas du marketing et de la publicité : c’est de la cybernétique!
9. Le plan de découvrabilité du Fonds BELL (2017)
● les campagnes publicitaires sur les médias sociaux
● la gestion et la modération de communautés en ligne
● la création d’aguiches (teasers) numériques, de bandes-annonces
numériques ou autres contenus vidéo;
● la production d’événements en direct
● l’achat média en ligne et l’achat de mots clés reliés via une campagne SEO
● l’abonnement à des logiciels d’analyse
● les services d’un spécialiste/stratège et/ou analyste des données et ou de
l’indexation
● les coûts reliés à des stratégies utilisant des influenceurs
● toutes autres activités qui répondent à ce qu’est la découvrabilité numérique
11. Observations pratiques | identifiants uniques
ISNI, VIAF et leurs sources https://isni.org/isni/0000000110273481
Wikidata accepte plus de 5000 types d’identifiants uniques
https://m.wikidata.org/w/index.php?title=Special:ListProperties/external-
id&limit=500&offset=5650
12. Observations pratiques | métadonnées “métiers”
Outils de capture des métadonnées “métiers”
MétaMusique https://metamusique.ca/referentiel
MarionNET.ca
https://docs.google.com/spreadsheets/d/1ohLWYw0nj8qx4pn_m4MK_Z0ArHcrYq
SJWwSr_p9Lw_U/edit?usp=sharing
13. Observations pratiques | Wikimedia et ses principes
fondateurs
● Wikidata est une base de données ouverte et liée
● Wikimedia est un reposoir de médias libres de droits
● Wikipédia est une encyclopédie collaborative qui exige des textes sourcés et
neutres
● La fondation Wikimedia propose des contenus en accès libre
● Wikimedia est un projet collaboratif qui obéit à des règles de savoir-vivre
● Recherchez le consensus et agissez de bonne foi - apprenez à interagir avec
la communauté
● Explorez, essayez, il est impossible d’endommager Wikipédia…
14. Observations pratiques | Wikimedia
GLAMS : Galleries, Libraries, Archives and Museums
https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:GLAM
Projets : coordonner les efforts de la communauté en regroupant les contributeurs autour de
thématiques https://fr.wikipedia.org/wiki/Projet:Accueil |
https://www.wikidata.org/wiki/Wikidata:WikiProject_Performing_arts
Campagnes de contribution : Outreach Dashboard - Collège La Cité - Cours identité culturelle
https://outreachdashboard.wmflabs.org/courses/Coll%C3%A8ge_La_Cit%C3%A9/La_Cit%C3%A9
_-_Identit%C3%A9_culturelle_-_Hiver_2021
WDQS et SPARQL https://w.wiki/3ACa #Auteurs-compositeurs-interprètes canadiens avec photo
17. Jalons de la découvrabilité, des données ouvertes et liées
1. Établir des consensus sectoriels sur les termes et métadonnées des métiers, la
sémantique usuelle - définir des scénarios d'usage et des parcours utilisateur
pour y parvenir
Il s’agit ici du pré-requis qui nous semble essentiel pour tout projet, c'est-à-dire de
préparer les milieux et d’animer les conversations qui pourraient permettre la validation
d’un modèle documentaire commun, d’un socle minimal de métadonnées pour un
secteur à modéliser, pour lequel un schéma de données doit être mis en place.
Pour guider cet exercice, il faut le centrer sur une première finalité et le développement
d’un produit minimum viable, la mise à plat de scénarios d'usage et de parcours
utilisateur. La réflexion sur le modèle d’affaires est aussi déterminante.
18. Jalons de la découvrabilité, des données ouvertes et liées
2. Traduire les termes métiers vers des ontologies normées exprimées en langage
machine
Un certain nombre d’ontologies tendent actuellement vers une forme de
convergence. Divers secteurs artistiques ou documentaires y travaillent et il est
possible de s'aligner sur leurs travaux : Wikidata, Schema,.org, FRBR et LRMoo,
CIDOC-CRM. Le travail de traduction à réaliser devient relativement clair.
19. Jalons de la découvrabilité, des données ouvertes et liées
3. Associer les termes métiers à des concepts décrits en ligne de façon pérenne
par des URI hiérarchiques (interprétables par les humains) ou opaques (créés
pour les machines)
Voici un exemple de ce jalon, la définition d’une peinture dans Wikidata et dans
Schema. Les liens ici partagés constituent ces URI pointant vers une définition. Il
importe de s'aligner sur de telles définitions, d’adopter des normes internationales
et multi-lingues.
https://www.wikidata.org/wiki/Q3305213 / https://schema.org/Painting
20. Jalons de la découvrabilité, des données ouvertes et liées
4. Associer les ressources consignées dans les bases de données à des
identifiants uniques stables
Il est essentiel d’associer les artefacts, les événements, les créatrices et
créateurs, les personnes physiques et morales engagées dans une chaîne de
valeur économique, à des identifiants stables (ISNI, ULAN, ISRC, ISBN, etc.).
Toutes ces ressources ne possèdent pas encore leur identifiant dédié, pensons
notamment aux œuvres d’art ou aux événements des arts de la scène.
21. Jalons de la découvrabilité, des données ouvertes et liées
5. Arrimer ensemble divers thésaurus et ontologies composées de triplets sujet-
propriété-objet
Ce jalon est une évolution du jalon 2. Il implique que les termes métiers traduits
précédemment soient associés à des propriétés ou prédicats et à des éléments et
classes d’éléments du web sémantique, afin de les rendre interprétables par les
machines et procédés informatiques. C’est un jalon qui relève des sciences de
l’information et qui peut s'incarner dans un prototype sur Wikidata.
22. Jalons de la découvrabilité, des données ouvertes et liées
6. Préparer et faire signer les cessions de droits pour les artefacts et médias à
publier
Le mise en valeur d'œuvres implique habituellement de pouvoir exposer
publiquement une image de celles-ci ou donner accès à un extrait. Une mise à
disposition dans un commun de type Wikimedia Commons est à envisager. Dans
quelque cas de figure que ce soit, un document de cession stipulant l’attribution
de l’œuvre et les droits associés à son utilisation devrait être prévu. Ce type de
mise à disposition sera balisé par une licence libre de type Creative Commons.
23. Jalons de la découvrabilité, des données ouvertes et liées
7. Déposer des données dans les communs numériques comme Wikidata et
Wikimedia Commons
Ce jalon est une évolution du jalon 6. Le recours à un dépôt dans les communs
numériques peut constituer une initiative de prototypage relativement simple à
mettre en place. Ce jalon permet aussi une ré-utilisation des éléments créés dans
Wikidata à la fois pour assurer une sauvegarde du travail de documentation
effectué, qu’une mise à disposition pour des applications tierces selon les
principes du web des données ouvertes et liées. C'est un processus non-destructif
et collaboratif.
24. Jalons de la découvrabilité, des données ouvertes et liées
8. Publier des données dans des bases en graphes offrant des points d'accès
SPARQL
Ce jalon est une extension du jalon 7. Le langage de requête SPARQL permet l’accès
aux données ouvertes. Le jalon consiste à mettre en place une réplique privée ou
dédiée d’une base documentaire selon les principes du web des données ouvertes et
liées. C’est un choix motivé par une politique d’ouverture des données qui ne convient
pas nécessairement à tous les projets, toutes les organisations. Toutefois il est
possible de moduler cette ouverture des données, de ne pas exposer
systématiquement toutes ses données de façon ouverte et réutilisable. Il est possible
de consulter des répertoires de bases de données ouvertes et liées en cliquant sur les
liens suivants : https://lod-cloud.net/ | https://www.w3.org/wiki/SparqlEndpoints .
25. Jalons de la découvrabilité, des données ouvertes et liées
9. Lier entre elles des bases de données, automatiser leur synchronisation
Il est possible d'agréger des données de sources multiples (requête fédérée) pour
ensuite les exposer publiquement en ligne. Si cette avenue est choisie, il faut
aussi mettre en place une automation des processus d’agrégation, de compilation,
afin de maintenir à jour les données mises à disposition.
26. Jalons de la découvrabilité, des données ouvertes et liées
10. Publier des données sur des portails, des interfaces consultables ou
interrogeables par l'humain
Nous devons choisir selon quels modèles, sous quelles conditions les données
seront publiées. Citons ici l'exemple des “Infobox” Wikipédia ou Google Search,
balises programmées agrégeant un résumé du sujet de la recherche. Une fiche
comme celles proposées par exemple, par la vitrine des collections du Musée
national des beaux-arts du Québec (MNBAQ), puise ses données à différentes
sources pour les exposer aux internautes sous forme de page web :
https://collections.mnbaq.org/fr/oeuvre/600025089
27. Jalons de la découvrabilité, des données ouvertes et liées
11. Ajouter des microdonnées lisibles par les machines dans les interfaces et les
pages Web
Il est possible d’accroître la visibilité, la découvrabilité de pages web comme
celles du MNBAQ en utilisant diverses méthodes de référencement. L’usage de
microdonnées, notamment celles proposées par le consortium Schema.org est
fortement recommandé. Il est possible de consulter les microdonnées d’une page
Web avec l’outil OpenLink Structured Data Sniffer (OSDS).
28. Jalons de la découvrabilité, des données ouvertes et liées
12. Assurer la gouvernance collective de données provenant de sources diverses et
agrégées
Il est implicite que la collaboration autour de la publication de données provenant
d’efforts et de sources différents, complémentaires doit être encadrée par des ententes
ou des processus de gouvernance dynamiques, continus. De nombreux juristes et
groupes de réflexion se penchent actuellement sur ces types d’enjeux, mentionnons,
entre autres, l'initiative de “Mutualisation des ressources en culture dans un contexte
numérique” de Culture pour tous.
Il est important de moduler les profils et les permissions d’accès associés aux divers
jeux de données.
29. Les plus beaux projets de mutualisation des données existants ont encore des
efforts considérables à engager : que l'on parle du projet Wikidata des arts de la
scène de CAPACOA, de la vitrine en ligne des collections du Musée national des
beaux arts du Québec ou encore des projets du Réseau canadien d'information
sur le patrimoine, tous ont plus de trois ans d'efforts engagés et poursuivent leur
développement avec acharnement. Il en va de même pour les projets industriels
de mutualisation comme MétaMusique, Scène Pro ou La Culture Crée.