1. Dispositifs d'Information et de Communication à l'Ère Numérique (DICEN)
Séminaire Folksonomies et Tagging
vendredi 26 mars 2010 - CNAM-Paris
Machine tags de Flickr et
folksonomies organisées
Patrick Peccatte
www.softexperience.com
blog.tuquoque.com
Laboratoire d'histoire visuelle contemporaine (Lhivic)
culturevisuelle.org/dejavu/
2. Sommaire
Rappels sur Flickr et les tags
Fonctions Rechercher et Explorer sur les tags
Définition des machine tags et (non)-relation avec RDF
Premiers exemples de machine tags
Fonctions Rechercher et Explorer sur les machine tags
Applications simples
Applications "plus évoluées"
API de Flickr et machine tags
Avantages et inconvénients des machine tags
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
3. Présentation succincte de Flickr
Flickr est un site web de partage de photos et de vidéos
Appartient à Yahoo!
Annonce 4,4 milliards de photos
(en fait probablement de l'ordre de 3 milliards)
Chaque photo peut être décrite par un titre, une
description, des tags (75 maximum par photo), des
commentaires, des notes associées à des zones de la
photo
Organisation des photos par albums et classeurs
Groupes d'utilisateurs réunis sur des thématiques très
variées
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
4. Le titulaire d'un compte Flickr a la possibilité de
contrôler qui peut ajouter des tags sur ses photos
http://www.flickr.com/account/prefs/photoprivacy/?from=privacy
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
5. Possibilité de rechercher uniquement sur les tags
http://www.flickr.com/search/?m=tags
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
7. Possibilité d'explorer les tags
http://www.flickr.com/photos/tags/tiger/
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
8. Possibilité d'explorer les tags - clusters
http://www.flickr.com/photos/tags/tiger/clusters/
Les clusters sont des regroupements automatiques des tags
qui interviennent le plus souvent dans une exploration
9. Tags et machine tags
L'usage massif des tags sur Flickr est souvent
reconnu comme "emblématique" des folksonomies du
Web 2.0
Ces folksonomies peuvent être organisées grâce aux
machine tags
Les machine tags (en français tags de
programmation) sont des tags tout à fait standards :
✔ ils peuvent être écrits à la main ou à l'aide de l'API
de Flickr
✔ seule différence par rapport aux tags habituels :
ils suivent une syntaxe particulière
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
10. Machine tags
Un machine tag est un triple tag, c'est-à-dire un tag
de la forme :
namespace:predicate=value
où :
✔ namespace est un espace de nom quelconque
(grosso modo, un sujet ou une classe)
✔ predicate est un prédicat (ou champ, ou propriété)
qui appartient à la classe ou au sujet défini(e) par
l'espace de nom
✔ value est une valeur ; comme pour les tags Flickr
habituels, les guillemets sont requis si la valeur
comporte un espace
(terminologie de Flickr)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
11. Un premier exemple
(interfaces en anglais et en français)
Note : si la photo ne comporte pas de tags standards, alors les machine
tasg sont affichés comme des tags (sans Show/Hide machine tags)
12. Machine tags - autres représentations
Tableau statue hauteur 9.50m
statue nature bronze
statue ville Paris
statue localisation Place de la République
statue sculpteur Léopold et Charles Morice
statue sujet allégorie de la République
Arbre statue hauteur = 9.50m
nature = bronze
ville = Paris
localisation = Place de la République
sculpteur = Léopold et Charles Morice
sujet = allégorie de la République
Les machine tags permettent de travailler avec une folksonomie
organisée, d'introduire une structuration peu formelle dans une folksonomie
13. Machine tags entre folksonomy et taxonomy
présentation de Flickr
folksonomy
taxonomy
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
14. Machine tags (MT) et RDF
Photo MTnamespace:MTpredicate
"MTvalue"
(resource)
triple RDF ??
Non, mais presque...
« Machine tags associated to a photo are much like RDF triples having
that photo as its subject. The main difference is that the so-called
"namespace" of the machine tag is not necessarily associated to a
URI prefix. So there is no guarantee that different people will not use
the same prefix with different meaning. But this was already true of plain
tags, and is considered as a feature rather than a problem in the land of
folksonomies :) »
Wiki du W3C
http://www.w3.org/2008/WebVideo/Annotations/wiki/FlickrMachineTags
La flèche n'est même pas un morphisme (map) au sens de la théorie
des catégories : une même flèche MTnamespace:MTpredicate peut
pointer sur deux MTvalue distinctes (d'où l'expression folksonomie
organisée plutôt que catégorisée !)
15. Machine tags et RDF
NQRDF = Not Quite RDF
The Poor Man's RDF
A Performance and Scalability Metric for Virtual RDF Graphs,
by Michael Hausenblas, Wolfgang Slany, Danny Ayers, 2007
http://sw-app.org/pub/sfsw07-vrdfgraph.pdf
16. "RDFizers"
introduire de véritables namespaces
Service pour obtenir une représentation RDF des informations
sur une image Flickr
Flickr photo info to RDF image description
http://www.kanzaki.com/works/2005/imgdsc/flickr2rdf
✔ mais date de 2005, donc ne prend pas en compte les machines tags
Flickcurl: C library for the Flickr API, by Dave Beckett
http://librdf.org/flickcurl/
Comporte un utilitaire flickrdf qui génère des triples RDFà partir
d'une photo Flickr :
✔ « Machine tags when they are found are scanned for
xmlns:prefix=uri and then all other machine tags with that prefix turn
into triples. Several prefixes are also pre-defined by the library to
automatically get turned into triples without an xmlns, such as blue:,
cell:, filter: and geo:. Non-machine tags are not yet interpreted. »
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
17. Exemples de machine tags
The Library Of Congress / The Commons
Le projet The Commons (les Organismes publics
en français) a été lancé en janvier 2008 avec la
publication sur Flickr de photographies de la
Library of Congress
Actuellement 34 institutions participent au projet
Objectifs :
✔ accroître l'accès aux collections détenues par des institutions
du monde entier
✔ fournir au public un moyen lui permettant de contribuer à
l'amélioration de la description de ces collections
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
18.
19. The Library Of Congress / The Commons
Machine tags utilisés par la LoC
✔ xmlns:dc=http://purl.org/dc/elements/1.1/
✔ dc:identifier=http://hdl.loc.gov/loc.pnp/fsa.8b29516
✔ commons:event=commonground2009
xmlns:dc : syntaxe "à la XML" (cependant, xmlns n'est pas
standardisé en machine tags) -> l'espace de nom dc est bien le
Dublin Core, mais le souci de rigueur ne va pas jusqu'à définir
le préfixe commons ...
dc:identifier : la Library of Congress maintient le lien entre les
images stockées sur Flickr et son catalogue en ligne (Prints and
Photographs Online Catalog)
commons:event : l'image a été choisie en 2009 pour un
événement global Common Ground regroupant plusieurs
institutions -> sélection d'images par le public et projections sur
les bâtiments des institutions
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
21. Utilisation
Les machine tags xmlns:dc et dc:identifier
sont aussi utilisés par quelques institutions
du projet The Commons :
✔ Powerhouse Museum Collection
✔ New York Public Library
✔ Boston Public Library (très partiellement)
Ainsi que par d'autres institutions qui ne
font pas partie de The Commons
(MIT OpenCourseWare, etc.)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
23. Explore avec un joker sur predicate et value
http://www.flickr.com/photos/tags/dc:*=*
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
24. Explore avec un joker sur namespace
http://www.flickr.com/photos/tags/*:user=
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
25. Explore sur un namespace + predicate + value
http://www.flickr.com/photos/tags/photo:process=daguerreotype
26. Explore avec un joker sur namespace et value
http://www.flickr.com/photos/tags/*:*=losangeles
suppression des espaces
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
27. Applications simples
"Simple" :
machine tags = identifiant unique (id) ou
saisie manuelle des informations
Montre la variété de l'utilisation des
machine tags
Nécessité de groupes ou associations
qui développent un vocabulaire
spécifique à leurs besoins
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
28. Upcoming est un calendrier d'événements et un
réseau social. Appartient à Yahoo!
http://www.flickr.com/photos/tags/upcoming:*=*
(+373 000 photos)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
29. Upcoming
Chaque événement est
identifié par un numéro,
ce qui permet
d'effectuer des
Credit : Patrick H~ on Flickr, licence Creative Commons
recherches précises sur
les photos de cet
événement
30. Last.fm est une webradio et un site internet
proposant un système de collection de statistiques et
de recommandation de musique
http://www.flickr.com/photos/tags/lastfm:*=*
(+1457000 photos)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
31. Last.fm
Identification des
événements similaire à
celui de Upcoming :
autre namespace et
même predicate
Credit : Christoph! on Flickr, licence Creative Commons
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
32. Rotocasted groupe d'amateurs de jouets
http://rotocasted.com/
http://www.flickr.com/photos/tags/roto:*=*
(+2400 photos)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
33. Roto
Credit : blakewest on Flickr, licence Creative Commons
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
34. Autres applications simples
Utata - collectif de photographes et d'écrivains qui partagent un même intérêt artistique. Groupe
Flickr : plus de 18000 membres et 300000 photos.
http://www.flickr.com/photos/tags/utata:*=
Typedia – encyclopédie de dessins de caractères
http://www.flickr.com/photos/tags/type:*=
Citizen Weather Observer Program (CWOP) Station Metadata Group vise à constituer une
base de photos sur les stations météorologiques du réseau CWOP
http://www.flickr.com/photos/tags/wx:*=
Burning Man - « rencontre artistique et bariolée qui se tient chaque année dans le désert du
Nevada » (Wikipedia)
http://www.flickr.com/photos/tags/burningman:*=
Dopplr - « service gratuit de réseau social, lancé en 2001, qui permet aux utilisateurs de calcu-
ler l'empreinte carbone que leurs voyages ont produit » (Wikipedia)
http://www.flickr.com/photos/tags/dopplr:*=
Foursquare - outil de réseau social, de jeu et de microblogging qui permet à l’utilisateur d'indi-
quer où il se trouve et de rencontrer ses contacts
http://www.flickr.com/photos/tags/foursquare:*=
Open Plaques – plaques bleues commémoratives d'événements ou de personnalités (en
Grande-Bretagne)
http://www.flickr.com/photos/tags/openplaques:*=
Lego – photos de constructions en Lego
http://www.flickr.com/photos/tags/lego:*=
35. Applications "plus évoluées"
Utilisation d'automatismes ou de
l'API Flickr
Utilisation de Flickr en relation avec
une autre application
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
36. Taxonomie des plantes et animaux
http://www.flickr.com/photos/tags/taxonomy:*=*
(+78000 photos)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
38. Générateur de tags pour la taxonomie des oiseaux australiens
http://flickr.webboy.net/
39. Générateur de tags pour la taxonomie des oiseaux australiens
http://flickr.webboy.net/
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
40. Astrometry est un groupe Flickr créé en 2007.
Un programme automatique scrute le groupe et identifie
les photos astronomiques d'après les positions des
étoiles et planètes environnantes sur les clichés
http://www.flickr.com/photos/tags/astrometrydotnet:*=*
(+7800 photos)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
41. Credit : jimkster on Flickr,
licence Creative Commons
Machine tags
Compte-rendu générés par le robot
du robot Astrometry.net
Astrometry.net
42. Le projet AccessCeramics
accessCeramics est une collection de
photos de céramiques contemporaines
conçue pour être utilisée par des artistes,
des enseignants, des chercheurs et le grand
public
Le projet utilise les possibilités de Flickr et
des réseaux sociaux tout en proposant
également une interface web personnalisée
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
43. Le projet AccessCeramics
Les initiateurs du projet souhaitaient
initialement utiliser Flickr comme un silo
unique regroupant images et métadonnées
accédées par une interface web utilisant
l'API de Flickr
Mais les possibilités de Flickr sont apparues
insuffisantes, en ce qui concerne la
sécurisation des machine tags et
l'impossibilité d'effectuer des recherches
avec troncatures
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
44. Le projet AccessCeramics
Images sur Flickr
Métadonnées saisies par l'artiste stockées dans une base de
données MySQL
Machine tags générées ensuite par un 'super-utilisateur'
accessCeramics sur Flickr
45. Le projet AccessCeramics
Les métadonnées utilisées sont un mélange de :
✔ Dublin Core
✔ VRA Core (un standard développé par la Visual
Resource Association)
Choix effectué pour simplifier le processus
d'indexation des images
La plupart des valeurs de champs proviennent du
Getty Art and Architecture Thesaurus
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
46. accessCeramics sur Flickr
http://www.flickr.com/photos/tags/accessceramics:*=*
(+1300 photos)
(+3000 photos dans la base)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
49. Sur le groupe Flickr accessCeramics
Credit : accessCeramics guest on Flickr
licence Creative Commons
50. Autres applications "plus évoluées"
Fotopedia encyclopédie de photos en ligne mixant des contenus de Flickr, de
Wikipedia et des utilisateurs.
http://www.flickr.com/photos/tags/fotonauts:*=
WildlifeNearYou – site pour partager la passion de la vie sauvage
http://www.flickr.com/photos/tags/wlny:*=*
Open Library – couvertures de livres (très peu développé...)
http://www.flickr.com/photos/tags/openlibrary:*=
OpenStreetMap - projet pour créer des cartes libres du monde sous licence CC-BY-
SA, en utilisant le système GPS ou d'autres données libres
http://www.flickr.com/photos/tags/osm:*=
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
51. API Flickr
Pour exécuter une action à l'aide de l'API Flickr,
vous devez sélectionner une convention d'appel,
envoyer une requête à son point terminal en
spécifiant une méthode et des arguments, puis vous
recevez une réponse formatée
Format d'envoi : REST, XML-RPC, SOAP
Format de retour : REST, XML-RPC, SOAP, JSON
L'API Flickr dispose de 166 méthodes ...
... dont 5 pour travailler avec les machine tags
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
52. API Flickr
flickr.machinetags.getNamespaces
Return a list of unique namespaces, optionally limited by a given
predicate, in alphabetical order
flickr.machinetags.getPairs
Return a list of unique namespace and predicate pairs, optionally
limited by predicate or namespace, in alphabetical order
flickr.machinetags.getPredicates
Return a list of unique predicates, optionally limited by a given
namespace
flickr.machinetags.getValues
Return a list of unique values for a namespace and predicate
flickr.machinetags.getRecentValues
Fetch recently used (or created) machine tags values
Ces API sont mises en œuvre par exemple avec la fonction
Explore en utilisant des jokers * sur les machine tags
(voir ci-dessus)
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
54. Une application :
Flickr machine tag browser de Paul Mison
http://husk.org/code/machine-tag-browser.html
Navigation dans les machine tags selon les trois niveaux
namespace, predicate, value
55. Avantages et inconvénients des
machine tags
Lors du chargement d'une photo comprenant un mot-clé
IPTC (ou XMP) observant la syntaxe d'un machine tag,
celui-ci est effectivement reconnu comme un machine tag
La création des machine tags est libre et non contrôlée :
✔ avantage : souple et facile
✔ mais aussi inconvénient : c'est un capharnaüm
API : pas de possibilité de troncatures
Problèmes de langue
Accents et espaces
Problème des machine tags qui demeurent dans l'index
après suppression des photos
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010
56. Merci pour votre
attention
DICEN - Séminaire Folksonomies et Tagging – 26 mars 2010