SlideShare uma empresa Scribd logo
1 de 31
Enjeux et pratiques en matière de
découvrabilité des contenus culturels
BY Jean-Robert Bisaillon
formation présentée en ligne le 30 avril 2021 dans le cadre d’une collaboration avec ISOC Québec
http://bit.ly/ISOCdecouv2021
Menu du jour
1. Définition, contexte et problématique générale (15 minutes - 7
diapositives)
2. Observations pratiques (15 minutes - 10 diapositives)
a. ISNI, VIAF et les identifiants uniques
b. Outils de capture des métadonnées “métiers”
c. Données ouvertes et liées : Fondation Wikimedia, Wikidata,
Wikipedia
3. Jalons de la découvrabilité (20 minutes - 15 diapositives)
4. Questions-réponses (10 minutes)
Ministère de la Culture et des Communications (2021),
Guide des bonnes pratiques : découvrabilité et données en culture,
ISBN 978-2-550-89124-6 https://bit.ly/BonnesPratiquesDonnees (consulté le 27
avril 2021)
● Optimiser son site Internet - Utiliser des microdonnées structurées (Schema.org)
● Optimiser sa présence en ligne sur les espaces tiers et les médias sociaux
● Faire usage des communs Wikimedia
● Faire usage des identifiants uniques
● Exploiter les données d’usage
● Mutualiser les données et les opérations
○ Gouvernance
○ Interopérabilité
○ Nettoyage
Définition, contexte et problématique générale
Internet constitue une révolution parce que pour la première fois de l’histoire, il
permet aux humains de se constituer des actifs de savoirs partagés par les
moyens des télécommunications. Internet est un outil bi-directionnel et
contrairement au téléphone, il laisse des traces...
(voir Cardon, 2015, À quoi rêvent les algorithmes, Nos vies à l’heure des Big
Data, p. 18-19, 33-38).
À qui appartient Internet?
Internet est un réseau technique régi par de nombreuses structures et règles de
gouvernance, par exemple l’ICANN et son groupe des parties prenantes non-
commerciales (NCSG) ou encore l’IETF et son régime de RFC (Requests for
Comments). La plupart des lieux décisionnels sont ouverts à la participation. En
théorie, Internet appartient à toutes celles et tous ceux qui s’y impliquent.
Jusqu’ici ceux qui s’y impliquent le plus sont Google, Amazon, Facebook et
Apple.
En complémentarité et parfois par opposition, existent les communs numériques.
Dominique Cardon est professeur de sociologie à
Sciences Po à Paris. Il y dirige le Medialab.
Culture Numérique est paru en 2019 et retrace
toute la généalogie d’Internet. C’est un ouvrage
de synthèse de première qualité pour mieux
comprendre le nouveau monde numérique. Nous
nous en inspirons pour cette formation car il est
indispensable que nous nous forgions une
culture numérique.
Découvrabilité
Selon l’Observatoire de la culture et des communications du Québec (2017) : La
découvrabilité est la capacité d’un contenu culturel de se laisser découvrir aisément
par le consommateur qui le recherche et de se faire proposer au consommateur qui
n’en connaissait pas l’existence.
Pour le LATICCE (2019), la découvrabilité est un système émergeant d’un ensemble
de processus qui structurent et déterminent la possibilité et la capacité des publics de
découvrir des produits en ligne diversifiés, particulièrement des produits de niche.
Pour metaD, la découvrabilité c’est la science des interactions prescriptives humain-
machine. Ses dispositifs encadrent l’accès au savoir numérisé : interfaces et pages
Web, interfaces vocales, bases de données, bases de connaissances, outils et
algorithmes de recherche, de recommandation, etc. Pour nous, la découvrabilité, ce
n’est pas du marketing et de la publicité : c’est de la cybernétique!
Le plan de découvrabilité du Fonds BELL (2017)
● les campagnes publicitaires sur les médias sociaux
● la gestion et la modération de communautés en ligne
● la création d’aguiches (teasers) numériques, de bandes-annonces
numériques ou autres contenus vidéo;
● la production d’événements en direct
● l’achat média en ligne et l’achat de mots clés reliés via une campagne SEO
● l’abonnement à des logiciels d’analyse
● les services d’un spécialiste/stratège et/ou analyste des données et ou de
l’indexation
● les coûts reliés à des stratégies utilisant des influenceurs
● toutes autres activités qui répondent à ce qu’est la découvrabilité numérique
Observations pratiques
Observations pratiques | identifiants uniques
ISNI, VIAF et leurs sources https://isni.org/isni/0000000110273481
Wikidata accepte plus de 5000 types d’identifiants uniques
https://m.wikidata.org/w/index.php?title=Special:ListProperties/external-
id&limit=500&offset=5650
Observations pratiques | métadonnées “métiers”
Outils de capture des métadonnées “métiers”
MétaMusique https://metamusique.ca/referentiel
MarionNET.ca
https://docs.google.com/spreadsheets/d/1ohLWYw0nj8qx4pn_m4MK_Z0ArHcrYq
SJWwSr_p9Lw_U/edit?usp=sharing
Observations pratiques | Wikimedia et ses principes
fondateurs
● Wikidata est une base de données ouverte et liée
● Wikimedia est un reposoir de médias libres de droits
● Wikipédia est une encyclopédie collaborative qui exige des textes sourcés et
neutres
● La fondation Wikimedia propose des contenus en accès libre
● Wikimedia est un projet collaboratif qui obéit à des règles de savoir-vivre
● Recherchez le consensus et agissez de bonne foi - apprenez à interagir avec
la communauté
● Explorez, essayez, il est impossible d’endommager Wikipédia…
Observations pratiques | Wikimedia
GLAMS : Galleries, Libraries, Archives and Museums
https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:GLAM
Projets : coordonner les efforts de la communauté en regroupant les contributeurs autour de
thématiques https://fr.wikipedia.org/wiki/Projet:Accueil |
https://www.wikidata.org/wiki/Wikidata:WikiProject_Performing_arts
Campagnes de contribution : Outreach Dashboard - Collège La Cité - Cours identité culturelle
https://outreachdashboard.wmflabs.org/courses/Coll%C3%A8ge_La_Cit%C3%A9/La_Cit%C3%A9
_-_Identit%C3%A9_culturelle_-_Hiver_2021
WDQS et SPARQL https://w.wiki/3ACa #Auteurs-compositeurs-interprètes canadiens avec photo
Observations
pratiques |
Web des
données liées
https://lod-cloud.net/ https://lod-
cloud.net/dataset/wikidata
Jalons de la découvrabilité
Jalons de la découvrabilité, des données ouvertes et liées
1. Établir des consensus sectoriels sur les termes et métadonnées des métiers, la
sémantique usuelle - définir des scénarios d'usage et des parcours utilisateur
pour y parvenir
Il s’agit ici du pré-requis qui nous semble essentiel pour tout projet, c'est-à-dire de
préparer les milieux et d’animer les conversations qui pourraient permettre la validation
d’un modèle documentaire commun, d’un socle minimal de métadonnées pour un
secteur à modéliser, pour lequel un schéma de données doit être mis en place.
Pour guider cet exercice, il faut le centrer sur une première finalité et le développement
d’un produit minimum viable, la mise à plat de scénarios d'usage et de parcours
utilisateur. La réflexion sur le modèle d’affaires est aussi déterminante.
Jalons de la découvrabilité, des données ouvertes et liées
2. Traduire les termes métiers vers des ontologies normées exprimées en langage
machine
Un certain nombre d’ontologies tendent actuellement vers une forme de
convergence. Divers secteurs artistiques ou documentaires y travaillent et il est
possible de s'aligner sur leurs travaux : Wikidata, Schema,.org, FRBR et LRMoo,
CIDOC-CRM. Le travail de traduction à réaliser devient relativement clair.
Jalons de la découvrabilité, des données ouvertes et liées
3. Associer les termes métiers à des concepts décrits en ligne de façon pérenne
par des URI hiérarchiques (interprétables par les humains) ou opaques (créés
pour les machines)
Voici un exemple de ce jalon, la définition d’une peinture dans Wikidata et dans
Schema. Les liens ici partagés constituent ces URI pointant vers une définition. Il
importe de s'aligner sur de telles définitions, d’adopter des normes internationales
et multi-lingues.
https://www.wikidata.org/wiki/Q3305213 / https://schema.org/Painting
Jalons de la découvrabilité, des données ouvertes et liées
4. Associer les ressources consignées dans les bases de données à des
identifiants uniques stables
Il est essentiel d’associer les artefacts, les événements, les créatrices et
créateurs, les personnes physiques et morales engagées dans une chaîne de
valeur économique, à des identifiants stables (ISNI, ULAN, ISRC, ISBN, etc.).
Toutes ces ressources ne possèdent pas encore leur identifiant dédié, pensons
notamment aux œuvres d’art ou aux événements des arts de la scène.
Jalons de la découvrabilité, des données ouvertes et liées
5. Arrimer ensemble divers thésaurus et ontologies composées de triplets sujet-
propriété-objet
Ce jalon est une évolution du jalon 2. Il implique que les termes métiers traduits
précédemment soient associés à des propriétés ou prédicats et à des éléments et
classes d’éléments du web sémantique, afin de les rendre interprétables par les
machines et procédés informatiques. C’est un jalon qui relève des sciences de
l’information et qui peut s'incarner dans un prototype sur Wikidata.
Jalons de la découvrabilité, des données ouvertes et liées
6. Préparer et faire signer les cessions de droits pour les artefacts et médias à
publier
Le mise en valeur d'œuvres implique habituellement de pouvoir exposer
publiquement une image de celles-ci ou donner accès à un extrait. Une mise à
disposition dans un commun de type Wikimedia Commons est à envisager. Dans
quelque cas de figure que ce soit, un document de cession stipulant l’attribution
de l’œuvre et les droits associés à son utilisation devrait être prévu. Ce type de
mise à disposition sera balisé par une licence libre de type Creative Commons.
Jalons de la découvrabilité, des données ouvertes et liées
7. Déposer des données dans les communs numériques comme Wikidata et
Wikimedia Commons
Ce jalon est une évolution du jalon 6. Le recours à un dépôt dans les communs
numériques peut constituer une initiative de prototypage relativement simple à
mettre en place. Ce jalon permet aussi une ré-utilisation des éléments créés dans
Wikidata à la fois pour assurer une sauvegarde du travail de documentation
effectué, qu’une mise à disposition pour des applications tierces selon les
principes du web des données ouvertes et liées. C'est un processus non-destructif
et collaboratif.
Jalons de la découvrabilité, des données ouvertes et liées
8. Publier des données dans des bases en graphes offrant des points d'accès
SPARQL
Ce jalon est une extension du jalon 7. Le langage de requête SPARQL permet l’accès
aux données ouvertes. Le jalon consiste à mettre en place une réplique privée ou
dédiée d’une base documentaire selon les principes du web des données ouvertes et
liées. C’est un choix motivé par une politique d’ouverture des données qui ne convient
pas nécessairement à tous les projets, toutes les organisations. Toutefois il est
possible de moduler cette ouverture des données, de ne pas exposer
systématiquement toutes ses données de façon ouverte et réutilisable. Il est possible
de consulter des répertoires de bases de données ouvertes et liées en cliquant sur les
liens suivants : https://lod-cloud.net/ | https://www.w3.org/wiki/SparqlEndpoints .
Jalons de la découvrabilité, des données ouvertes et liées
9. Lier entre elles des bases de données, automatiser leur synchronisation
Il est possible d'agréger des données de sources multiples (requête fédérée) pour
ensuite les exposer publiquement en ligne. Si cette avenue est choisie, il faut
aussi mettre en place une automation des processus d’agrégation, de compilation,
afin de maintenir à jour les données mises à disposition.
Jalons de la découvrabilité, des données ouvertes et liées
10. Publier des données sur des portails, des interfaces consultables ou
interrogeables par l'humain
Nous devons choisir selon quels modèles, sous quelles conditions les données
seront publiées. Citons ici l'exemple des “Infobox” Wikipédia ou Google Search,
balises programmées agrégeant un résumé du sujet de la recherche. Une fiche
comme celles proposées par exemple, par la vitrine des collections du Musée
national des beaux-arts du Québec (MNBAQ), puise ses données à différentes
sources pour les exposer aux internautes sous forme de page web :
https://collections.mnbaq.org/fr/oeuvre/600025089
Jalons de la découvrabilité, des données ouvertes et liées
11. Ajouter des microdonnées lisibles par les machines dans les interfaces et les
pages Web
Il est possible d’accroître la visibilité, la découvrabilité de pages web comme
celles du MNBAQ en utilisant diverses méthodes de référencement. L’usage de
microdonnées, notamment celles proposées par le consortium Schema.org est
fortement recommandé. Il est possible de consulter les microdonnées d’une page
Web avec l’outil OpenLink Structured Data Sniffer (OSDS).
Jalons de la découvrabilité, des données ouvertes et liées
12. Assurer la gouvernance collective de données provenant de sources diverses et
agrégées
Il est implicite que la collaboration autour de la publication de données provenant
d’efforts et de sources différents, complémentaires doit être encadrée par des ententes
ou des processus de gouvernance dynamiques, continus. De nombreux juristes et
groupes de réflexion se penchent actuellement sur ces types d’enjeux, mentionnons,
entre autres, l'initiative de “Mutualisation des ressources en culture dans un contexte
numérique” de Culture pour tous.
Il est important de moduler les profils et les permissions d’accès associés aux divers
jeux de données.
Les plus beaux projets de mutualisation des données existants ont encore des
efforts considérables à engager : que l'on parle du projet Wikidata des arts de la
scène de CAPACOA, de la vitrine en ligne des collections du Musée national des
beaux arts du Québec ou encore des projets du Réseau canadien d'information
sur le patrimoine, tous ont plus de trois ans d'efforts engagés et poursuivent leur
développement avec acharnement. Il en va de même pour les projets industriels
de mutualisation comme MétaMusique, Scène Pro ou La Culture Crée.
Jean-Robert Bisaillon
Co-directeur du LATICCE
Fondateur de metaD.media
jr@iconoclaste.ca
MERCI !!!
http://bit.ly/ISOCdecouv2021
Science des données et industries créatives
metad.media | (514) 219-9994

Mais conteúdo relacionado

Mais procurados

Formation Centres Sociaux Web2 Et Wp
Formation Centres Sociaux Web2 Et WpFormation Centres Sociaux Web2 Et Wp
Formation Centres Sociaux Web2 Et Wp
Centres Sociaux
 
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Stéphane Possamai
 

Mais procurados (6)

Mis documation2013
Mis documation2013Mis documation2013
Mis documation2013
 
Retour d’expérience des processus de codesign du Living Lab de Communautique
Retour d’expérience des processus de codesign du Living Lab de CommunautiqueRetour d’expérience des processus de codesign du Living Lab de Communautique
Retour d’expérience des processus de codesign du Living Lab de Communautique
 
6smposium lausanne v3
6smposium lausanne v36smposium lausanne v3
6smposium lausanne v3
 
Formation Centres Sociaux Web2 Et Wp
Formation Centres Sociaux Web2 Et WpFormation Centres Sociaux Web2 Et Wp
Formation Centres Sociaux Web2 Et Wp
 
2.0 Services et Usage
2.0 Services et Usage2.0 Services et Usage
2.0 Services et Usage
 
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
 

Semelhante a Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media

De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
olivier
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumerique
ABES
 
Journée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journéeJournée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journée
Documentation Rouen
 

Semelhante a Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media (20)

identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademique
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
 
Animer un portail documentaire - E-sidoc
Animer un portail documentaire - E-sidocAnimer un portail documentaire - E-sidoc
Animer un portail documentaire - E-sidoc
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumerique
 
Cnfpt formationmediationnumerique
Cnfpt formationmediationnumeriqueCnfpt formationmediationnumerique
Cnfpt formationmediationnumerique
 
Veille
VeilleVeille
Veille
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du public
 
L'Atelier de cartographie
L'Atelier de cartographieL'Atelier de cartographie
L'Atelier de cartographie
 
Animer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidocAnimer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidoc
 
Documentaliste dans un environnement numérique
Documentaliste dans un environnement numériqueDocumentaliste dans un environnement numérique
Documentaliste dans un environnement numérique
 
ESIEE intervention sur le theme du web 2.0 - 2010
ESIEE intervention sur le theme du web 2.0 - 2010ESIEE intervention sur le theme du web 2.0 - 2010
ESIEE intervention sur le theme du web 2.0 - 2010
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
Journée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journéeJournée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journée
 
Web Doc Adbs 6juillet2007
Web Doc Adbs 6juillet2007Web Doc Adbs 6juillet2007
Web Doc Adbs 6juillet2007
 
Veille et social bookmarking
Veille et social bookmarkingVeille et social bookmarking
Veille et social bookmarking
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Animer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidocAnimer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidoc
 
Animer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidocAnimer un portail documentaire : E-sidoc
Animer un portail documentaire : E-sidoc
 
Gestion de projet agile
Gestion de projet agileGestion de projet agile
Gestion de projet agile
 

Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media

  • 1. Enjeux et pratiques en matière de découvrabilité des contenus culturels BY Jean-Robert Bisaillon formation présentée en ligne le 30 avril 2021 dans le cadre d’une collaboration avec ISOC Québec http://bit.ly/ISOCdecouv2021
  • 2. Menu du jour 1. Définition, contexte et problématique générale (15 minutes - 7 diapositives) 2. Observations pratiques (15 minutes - 10 diapositives) a. ISNI, VIAF et les identifiants uniques b. Outils de capture des métadonnées “métiers” c. Données ouvertes et liées : Fondation Wikimedia, Wikidata, Wikipedia 3. Jalons de la découvrabilité (20 minutes - 15 diapositives) 4. Questions-réponses (10 minutes)
  • 3. Ministère de la Culture et des Communications (2021), Guide des bonnes pratiques : découvrabilité et données en culture, ISBN 978-2-550-89124-6 https://bit.ly/BonnesPratiquesDonnees (consulté le 27 avril 2021) ● Optimiser son site Internet - Utiliser des microdonnées structurées (Schema.org) ● Optimiser sa présence en ligne sur les espaces tiers et les médias sociaux ● Faire usage des communs Wikimedia ● Faire usage des identifiants uniques ● Exploiter les données d’usage ● Mutualiser les données et les opérations ○ Gouvernance ○ Interopérabilité ○ Nettoyage
  • 4. Définition, contexte et problématique générale Internet constitue une révolution parce que pour la première fois de l’histoire, il permet aux humains de se constituer des actifs de savoirs partagés par les moyens des télécommunications. Internet est un outil bi-directionnel et contrairement au téléphone, il laisse des traces... (voir Cardon, 2015, À quoi rêvent les algorithmes, Nos vies à l’heure des Big Data, p. 18-19, 33-38).
  • 5.
  • 6. À qui appartient Internet? Internet est un réseau technique régi par de nombreuses structures et règles de gouvernance, par exemple l’ICANN et son groupe des parties prenantes non- commerciales (NCSG) ou encore l’IETF et son régime de RFC (Requests for Comments). La plupart des lieux décisionnels sont ouverts à la participation. En théorie, Internet appartient à toutes celles et tous ceux qui s’y impliquent. Jusqu’ici ceux qui s’y impliquent le plus sont Google, Amazon, Facebook et Apple. En complémentarité et parfois par opposition, existent les communs numériques.
  • 7. Dominique Cardon est professeur de sociologie à Sciences Po à Paris. Il y dirige le Medialab. Culture Numérique est paru en 2019 et retrace toute la généalogie d’Internet. C’est un ouvrage de synthèse de première qualité pour mieux comprendre le nouveau monde numérique. Nous nous en inspirons pour cette formation car il est indispensable que nous nous forgions une culture numérique.
  • 8. Découvrabilité Selon l’Observatoire de la culture et des communications du Québec (2017) : La découvrabilité est la capacité d’un contenu culturel de se laisser découvrir aisément par le consommateur qui le recherche et de se faire proposer au consommateur qui n’en connaissait pas l’existence. Pour le LATICCE (2019), la découvrabilité est un système émergeant d’un ensemble de processus qui structurent et déterminent la possibilité et la capacité des publics de découvrir des produits en ligne diversifiés, particulièrement des produits de niche. Pour metaD, la découvrabilité c’est la science des interactions prescriptives humain- machine. Ses dispositifs encadrent l’accès au savoir numérisé : interfaces et pages Web, interfaces vocales, bases de données, bases de connaissances, outils et algorithmes de recherche, de recommandation, etc. Pour nous, la découvrabilité, ce n’est pas du marketing et de la publicité : c’est de la cybernétique!
  • 9. Le plan de découvrabilité du Fonds BELL (2017) ● les campagnes publicitaires sur les médias sociaux ● la gestion et la modération de communautés en ligne ● la création d’aguiches (teasers) numériques, de bandes-annonces numériques ou autres contenus vidéo; ● la production d’événements en direct ● l’achat média en ligne et l’achat de mots clés reliés via une campagne SEO ● l’abonnement à des logiciels d’analyse ● les services d’un spécialiste/stratège et/ou analyste des données et ou de l’indexation ● les coûts reliés à des stratégies utilisant des influenceurs ● toutes autres activités qui répondent à ce qu’est la découvrabilité numérique
  • 11. Observations pratiques | identifiants uniques ISNI, VIAF et leurs sources https://isni.org/isni/0000000110273481 Wikidata accepte plus de 5000 types d’identifiants uniques https://m.wikidata.org/w/index.php?title=Special:ListProperties/external- id&limit=500&offset=5650
  • 12. Observations pratiques | métadonnées “métiers” Outils de capture des métadonnées “métiers” MétaMusique https://metamusique.ca/referentiel MarionNET.ca https://docs.google.com/spreadsheets/d/1ohLWYw0nj8qx4pn_m4MK_Z0ArHcrYq SJWwSr_p9Lw_U/edit?usp=sharing
  • 13. Observations pratiques | Wikimedia et ses principes fondateurs ● Wikidata est une base de données ouverte et liée ● Wikimedia est un reposoir de médias libres de droits ● Wikipédia est une encyclopédie collaborative qui exige des textes sourcés et neutres ● La fondation Wikimedia propose des contenus en accès libre ● Wikimedia est un projet collaboratif qui obéit à des règles de savoir-vivre ● Recherchez le consensus et agissez de bonne foi - apprenez à interagir avec la communauté ● Explorez, essayez, il est impossible d’endommager Wikipédia…
  • 14. Observations pratiques | Wikimedia GLAMS : Galleries, Libraries, Archives and Museums https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:GLAM Projets : coordonner les efforts de la communauté en regroupant les contributeurs autour de thématiques https://fr.wikipedia.org/wiki/Projet:Accueil | https://www.wikidata.org/wiki/Wikidata:WikiProject_Performing_arts Campagnes de contribution : Outreach Dashboard - Collège La Cité - Cours identité culturelle https://outreachdashboard.wmflabs.org/courses/Coll%C3%A8ge_La_Cit%C3%A9/La_Cit%C3%A9 _-_Identit%C3%A9_culturelle_-_Hiver_2021 WDQS et SPARQL https://w.wiki/3ACa #Auteurs-compositeurs-interprètes canadiens avec photo
  • 15. Observations pratiques | Web des données liées https://lod-cloud.net/ https://lod- cloud.net/dataset/wikidata
  • 16. Jalons de la découvrabilité
  • 17. Jalons de la découvrabilité, des données ouvertes et liées 1. Établir des consensus sectoriels sur les termes et métadonnées des métiers, la sémantique usuelle - définir des scénarios d'usage et des parcours utilisateur pour y parvenir Il s’agit ici du pré-requis qui nous semble essentiel pour tout projet, c'est-à-dire de préparer les milieux et d’animer les conversations qui pourraient permettre la validation d’un modèle documentaire commun, d’un socle minimal de métadonnées pour un secteur à modéliser, pour lequel un schéma de données doit être mis en place. Pour guider cet exercice, il faut le centrer sur une première finalité et le développement d’un produit minimum viable, la mise à plat de scénarios d'usage et de parcours utilisateur. La réflexion sur le modèle d’affaires est aussi déterminante.
  • 18. Jalons de la découvrabilité, des données ouvertes et liées 2. Traduire les termes métiers vers des ontologies normées exprimées en langage machine Un certain nombre d’ontologies tendent actuellement vers une forme de convergence. Divers secteurs artistiques ou documentaires y travaillent et il est possible de s'aligner sur leurs travaux : Wikidata, Schema,.org, FRBR et LRMoo, CIDOC-CRM. Le travail de traduction à réaliser devient relativement clair.
  • 19. Jalons de la découvrabilité, des données ouvertes et liées 3. Associer les termes métiers à des concepts décrits en ligne de façon pérenne par des URI hiérarchiques (interprétables par les humains) ou opaques (créés pour les machines) Voici un exemple de ce jalon, la définition d’une peinture dans Wikidata et dans Schema. Les liens ici partagés constituent ces URI pointant vers une définition. Il importe de s'aligner sur de telles définitions, d’adopter des normes internationales et multi-lingues. https://www.wikidata.org/wiki/Q3305213 / https://schema.org/Painting
  • 20. Jalons de la découvrabilité, des données ouvertes et liées 4. Associer les ressources consignées dans les bases de données à des identifiants uniques stables Il est essentiel d’associer les artefacts, les événements, les créatrices et créateurs, les personnes physiques et morales engagées dans une chaîne de valeur économique, à des identifiants stables (ISNI, ULAN, ISRC, ISBN, etc.). Toutes ces ressources ne possèdent pas encore leur identifiant dédié, pensons notamment aux œuvres d’art ou aux événements des arts de la scène.
  • 21. Jalons de la découvrabilité, des données ouvertes et liées 5. Arrimer ensemble divers thésaurus et ontologies composées de triplets sujet- propriété-objet Ce jalon est une évolution du jalon 2. Il implique que les termes métiers traduits précédemment soient associés à des propriétés ou prédicats et à des éléments et classes d’éléments du web sémantique, afin de les rendre interprétables par les machines et procédés informatiques. C’est un jalon qui relève des sciences de l’information et qui peut s'incarner dans un prototype sur Wikidata.
  • 22. Jalons de la découvrabilité, des données ouvertes et liées 6. Préparer et faire signer les cessions de droits pour les artefacts et médias à publier Le mise en valeur d'œuvres implique habituellement de pouvoir exposer publiquement une image de celles-ci ou donner accès à un extrait. Une mise à disposition dans un commun de type Wikimedia Commons est à envisager. Dans quelque cas de figure que ce soit, un document de cession stipulant l’attribution de l’œuvre et les droits associés à son utilisation devrait être prévu. Ce type de mise à disposition sera balisé par une licence libre de type Creative Commons.
  • 23. Jalons de la découvrabilité, des données ouvertes et liées 7. Déposer des données dans les communs numériques comme Wikidata et Wikimedia Commons Ce jalon est une évolution du jalon 6. Le recours à un dépôt dans les communs numériques peut constituer une initiative de prototypage relativement simple à mettre en place. Ce jalon permet aussi une ré-utilisation des éléments créés dans Wikidata à la fois pour assurer une sauvegarde du travail de documentation effectué, qu’une mise à disposition pour des applications tierces selon les principes du web des données ouvertes et liées. C'est un processus non-destructif et collaboratif.
  • 24. Jalons de la découvrabilité, des données ouvertes et liées 8. Publier des données dans des bases en graphes offrant des points d'accès SPARQL Ce jalon est une extension du jalon 7. Le langage de requête SPARQL permet l’accès aux données ouvertes. Le jalon consiste à mettre en place une réplique privée ou dédiée d’une base documentaire selon les principes du web des données ouvertes et liées. C’est un choix motivé par une politique d’ouverture des données qui ne convient pas nécessairement à tous les projets, toutes les organisations. Toutefois il est possible de moduler cette ouverture des données, de ne pas exposer systématiquement toutes ses données de façon ouverte et réutilisable. Il est possible de consulter des répertoires de bases de données ouvertes et liées en cliquant sur les liens suivants : https://lod-cloud.net/ | https://www.w3.org/wiki/SparqlEndpoints .
  • 25. Jalons de la découvrabilité, des données ouvertes et liées 9. Lier entre elles des bases de données, automatiser leur synchronisation Il est possible d'agréger des données de sources multiples (requête fédérée) pour ensuite les exposer publiquement en ligne. Si cette avenue est choisie, il faut aussi mettre en place une automation des processus d’agrégation, de compilation, afin de maintenir à jour les données mises à disposition.
  • 26. Jalons de la découvrabilité, des données ouvertes et liées 10. Publier des données sur des portails, des interfaces consultables ou interrogeables par l'humain Nous devons choisir selon quels modèles, sous quelles conditions les données seront publiées. Citons ici l'exemple des “Infobox” Wikipédia ou Google Search, balises programmées agrégeant un résumé du sujet de la recherche. Une fiche comme celles proposées par exemple, par la vitrine des collections du Musée national des beaux-arts du Québec (MNBAQ), puise ses données à différentes sources pour les exposer aux internautes sous forme de page web : https://collections.mnbaq.org/fr/oeuvre/600025089
  • 27. Jalons de la découvrabilité, des données ouvertes et liées 11. Ajouter des microdonnées lisibles par les machines dans les interfaces et les pages Web Il est possible d’accroître la visibilité, la découvrabilité de pages web comme celles du MNBAQ en utilisant diverses méthodes de référencement. L’usage de microdonnées, notamment celles proposées par le consortium Schema.org est fortement recommandé. Il est possible de consulter les microdonnées d’une page Web avec l’outil OpenLink Structured Data Sniffer (OSDS).
  • 28. Jalons de la découvrabilité, des données ouvertes et liées 12. Assurer la gouvernance collective de données provenant de sources diverses et agrégées Il est implicite que la collaboration autour de la publication de données provenant d’efforts et de sources différents, complémentaires doit être encadrée par des ententes ou des processus de gouvernance dynamiques, continus. De nombreux juristes et groupes de réflexion se penchent actuellement sur ces types d’enjeux, mentionnons, entre autres, l'initiative de “Mutualisation des ressources en culture dans un contexte numérique” de Culture pour tous. Il est important de moduler les profils et les permissions d’accès associés aux divers jeux de données.
  • 29. Les plus beaux projets de mutualisation des données existants ont encore des efforts considérables à engager : que l'on parle du projet Wikidata des arts de la scène de CAPACOA, de la vitrine en ligne des collections du Musée national des beaux arts du Québec ou encore des projets du Réseau canadien d'information sur le patrimoine, tous ont plus de trois ans d'efforts engagés et poursuivent leur développement avec acharnement. Il en va de même pour les projets industriels de mutualisation comme MétaMusique, Scène Pro ou La Culture Crée.
  • 30. Jean-Robert Bisaillon Co-directeur du LATICCE Fondateur de metaD.media jr@iconoclaste.ca MERCI !!! http://bit.ly/ISOCdecouv2021
  • 31. Science des données et industries créatives metad.media | (514) 219-9994