De plus en plus fréquemment, le web s’intercale entre nous et le monde. Le web des documents et des données augmente nos perceptions de la réalité quand dans le même temps le web d'applications et de services accroît l’emprise que nous exerçons sur elle en multipliant les tâches que nous pouvons accomplir. Devenu incontournable dans nos activités quotidiennes, il est également difficilement gérable.
Sur le web, une ressource peut être n’importe quoi et, à mesure que le réseau s’étend, tout, dans notre environnement, est susceptible de se muer en ressource. Certes, on parle maintenant de « réalité augmentée » par le web mais, à mesure que la toile se déploie, il faut également noter à quel point la réalité vient l’augmenter elle-même, en raison de la quantité et de la diversité de ressources identifiées en son sein.
Emotions in Argumentation: an Empirical Evaluation @ IJCAI 2015
L avenir du web au prisme de la resource
1. l’avenir du web
au prisme de la ressource
Nicolas Delaforge, Fabien Gandon et Alexandre Monnin
2. cinq objectifs
• présenter
(un web de ressources computationnelles)
• résumer, rappeler
(web de données, web sémantique)
• discuter, provoquer
(le document n’existe pas)
• orienter
(et pour nous alors)
• conclure, ouvrir
(ce n’est que le début)
4. trois composants de l’architecture du web
• identification (URI) & adressage (URL)
http://www.inria.fr
http://ns.inria.fr/fabien.gandon#me
ldap://[2001:db8::7]/c=GB?objectClass?one
• communication / protocole (HTTP)
GET /centre/sophia HTTP/1.1
Host: www.inria.fr
User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de)
AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4
Safari/523.10
Accept-Encoding: gzip
Accept: text/html,application/xhtml+xml,application/xml
Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
Referer: http://fabien.info/
• langage de représentation (HTML / RDF)
Fabien travaille chez <a href="http://www.inria.fr">Inria</a>
<http://www.inria.fr> foaf:member data:fabien
5. UR*
pas pour les gens… et pourtant…
URI: identification de n’importe qu’elle ressource
URL=URI + Localisation URL=UR(I+L)
HTTP URI: URI déréférençable selon HTTP
« follow your nose » / naviguer au flair
(wikipedia)
7. URI aux jointures
• entre les assertions
même si elles sont distribuées
• entre les couches réseau
(Internet, Web, Web sémantique)
1 physique
2 données
3 réseau
4 transport
5 session
6 présentation
7 application
8. web documentaire « REST in peace »
• REST(ful): invocation et composition d’applications
distribuées sur le web
• primitives HTTP, actions sur la ressource
GET, HEAD, POST, OPTIONS,
CONNECT, TRACE, PUT, DELETE
• le web ne fut jamais vraiment documentaire
• web…
– application centrée ressources (identifiées par URI)
– architecture orientée ressource (localisables URL)
– toile de calculs liés et non de documents
9. trois composants de l’architecture du web
• identification de la ressource (URI)
• accès à une représentation (HTTP URI)
• codage de la représentation (HTML , RDF, etc)
11. HTTP Range 14
Code HTTP Résultat Indication
200 (OK) Représentation
Ressource informationnelle (IR) et
non informationnelle (NIR) ?
303 (voir
autre)
URI
Tout type de ressource notamment
des NIR
4XX, 5XX
(erreur)
Message
d’erreur
Aucune déduction possible
« ce n’est peut-être pas le problème de HTTP ou des URI »
ils n’en ont pas parlé ils en ont parlé
13. ressource• tout ce que l’on sait identifier
• pierre angulaire de l’architecture de tout le web
• concept unificateur de ses facettes
« ressource »
HTTP URI requête HTTP
erreur HTTP
représentation
14. Généalogie : du document (B.B.) à la
ressource
Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée
Ressource :
Manipulation indirecte
« … »
locus
15. l’objet
la ressource
l’état de la ressource
l’état représentationnel
ou une représentation de la ressource
ressources computationnelles
« … »
règles
16. rappel et parallèle
• sans notice pas d’existence dans la collection
• sans ressource pas d’existence sur le web
46. une représentation est
modifiée par un
commentaire
contenu essentiel, lié à une
ressource spécifique (un article)
vs
contenu accessoire, lié à une
règle non-essentielle
(un commentaire)
70. annotations des éléments multimédia
• description sémantique de ressources
multimedia [Media Annotation]
• adressage d’éléments internes aux
ressources [Media Fragment]
71. fragment multimédia
• partie fragment de l’URL = après le #
http://www.example.com/example.ogv#track=audio&t=10,20
• dimensions:
– temporelle:
t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z
– spatiale:
xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50
– track:
track=1 / track=video&track=subtitle / track=Wide
– nommée:
id=chapter-1
• fragment non transmis par le navigateur:
encodage dans la requête HTTP
72. ontologies des ressources multimédias
ontology for Media Resources 1.0
<video.ogv> a ma:MediaResource ;
ma:hasTrack <video.ogv#track=audio>,
<video.ogv#track=subtitle>;
ma:hasSubtitling <video.ogv#track=subtitle> ;
ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> .
<video.ogv#track=audio> a ma:AudioTrack ;
ma:hasLanguage [ rdfs:label "en-GB" ] ;
ma:hasFragment <video.ogv#track=audio&t=10,20> .
<video.ogv#track=audio&t=10,20> a ma:MediaFragment ;
ma:hasLanguage [ rdfs:label "fr" ] .
<video.ogv#track=subtitle> a ma:DataTrack ;
ma:hasLanguage [ rdfs:label "es" ] .
<video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ;
ma:hasLanguage [ rdfs:label "bfi" ] .
84. Le bug de l’an…
2020
( inspiration Gérard Berry)
SSRSSLSSS
SSLSSLSSS
85.
86. 1 sec. battement de cœur
1/2 sec. double click
24 images/sec. film
500 000 décisions / sec. algorithmes boursiers« Aliénation et accélération. »
Hartmut Rosa
94. Stéphane Crozat:
« le document numérique n'existe pas, ce qui
existe ce sont des constructions numériques
dont le traitement calculatoire simule un ordre
documentaire. »
96. nouveaux engagements, contrats
• contrats de lecture + computationnel
• contrats d’identification + computationnel
• contrats d’accès + computationnel
• contrats de publication + computationnel
• contrats de stockage + computationnel
• etc.
« il n’y a plus de documents, le besoin de
documentariser n’en n’est que plus fort. »
98. le web entre nous et le monde
• documents & données augmentent nos perceptions
• services & applications augmentent nos actions
• incontournable &… ingérable?
99. réalité augmentée par le web
& augmentation du web par le réel
• vers une réalité augmentée par le web
• diversité des ressources web augmentée par
diversité des ressources de notre réalité
• « documentarisation non documentaire »
de la réalité par le web
• modèle documentaire rendu minoritaire / modèle
calculatoire
• limite de la métaphore de la bibliothèque
• une toile de ressources informatiques
102. Image,T. Berners-Lee, RuleML kickoff, 2005
une toile de données multiples
entre différents barreaux de l’échelle des sphères
« small data & big data »
103.
104. web…devices
… Web Phone
… Web TV
… Web Radio
… Web Car
… Web Tablet
… Web eBook
… Web Watch
… Web GPS
…
[Web of Devices]
116. Janet Echelman, “Her Secret is Patience”, Civic Space Park,
Phoenix, AZ, USA, 2009
117. plusieurs évolutions concourantes
• explosion multimédia et multi-modalité
• toile de ressources computationnelles liées
• ressources comme locus de calcul
• assimilation de tous les objets à des ressources web
122. à travers le réseau
liens utilisant des références
http://www.
[Tim Berners-Lee, 1989]
123. hypertexte et document sur le Web :
de la nécessité de les reconstruire par
assemblages
Hypertexte : Google
Document : Scenari
Le Web à la base n’est
pas un hypertexte : il ne
relie pas des documents.
mais il peut le devenir ou accueillir
des documents car c’est aussi une
plateforme ouverte…
…
127. 2008 XML a eu dix ans <balise>…</balise>
XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html
structurer
des données
en utilisant
des balises
dans un format
textuel
construction
modulaire
une famille de
langages
un format ouvert
non propriétaire
129. de langages
Scalable Vector
Graphics (SVG)
XML Topic
Maps (XTM)
Synchronized
Multimedia Integration
Language (SMIL)
eXtensible Access Control
Markup Language (XACML)
OpenOffice
Schemas
MusicML
MathML
Financial
products Markup
Language (FpML)
GPS Exchange
format (GPX)
NewsML
WSDL
Chemical Markup
Language (CML)XHTML
famille
130. namespace
• espaces de nommage
• éviter les collision de noms
• associer un préfixe de balise à un URI
• exemple
• définitions héritées dans l’arbre XML
• namespace par défaut xmlns="…"
<ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note>
<bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note>
140. combiner
différents types de connaissances ontologiques
Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition
of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294).
LimbIndividual
Cat
Organic object
145. dans quelle mesure les
primitives sont décrites
dans un langage formel
formalité
146. méthodes
ex. rigidité dans Onto Clean [Guarino & Welty]
Rigid +R
is a necessary property for all its instances
Anti-Rigid ~R
is an optional property for all its instances
Person is y+R, Student is ~R
Constraint: ~R can't subsume y+R
153. ex. propagation sémantique
sel, eau
poivre, vin
moutarde
rugby, foot
foot, ciné
hockey sport sport
sport
condiment
condiment
condiment
from RAK/LP to SemTagP
172. May 2007 April 2008 September 2008
March 2009
September 2010
Linking Open Data
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
September 2011
0
100
200
300
400
10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012
181. principes
utiliser le format RDF
utiliser des URI pour nommer
utiliser des URI HTTP (URL) pour que l’on puisse les suivre
lorsqu’un URI est suivi donner des informations (HTML, RDF)
inclure dans ces informations des liens vers d’autres données
182. DNScelui qui contrôle le nom
de domaine contrôle le
déréférencement.
ex. bit.ly & Lybie
.fr
*
.inria
isicil
184. le cas de la France
mouvement d'ouverture
des données mais…
• redondance des identifiants
• hétérogénéité des formats
• diversité des vocabulaires
• hétérogénéité des accès
185. publication
processus démo
• installation en un
click
• import de données
trouvées en ligne
• transformation en
RDF
• publication sur le
web
• interrogation directe
186.
187. RDFS pour définir les classes de
ressources, leurs propriétés,
et organiser leur hiérarchie
Document
Rapport
créateur
auteur
Document Personne
188. OWLin one…
par énumération
par intersection
par union
par complément
la disjonction
par restriction!
par cardinalité
1..1
prop. algébriques
par équivalence
[>18]
union disjointe
restrict. valeur
prop. disjointes
cardinalité qualifiée
1..1
!
négation prop. indiv
prop. chainées
clefs
…
189.
190. alignements et liage
ontologies et entités nommées
• « Ontology Alignment
Evaluation Initiative »
• reconnaissance d’entités nommées
• liage de ressources
191.
192. OKKAM et owl:sameAs 1
“The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query:
where does John teach and what? One will make the following query on the merge of the two datasets:
< x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y
Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John
teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at
UNI1 and philosophy of language at UNI2.”
(Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web
Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo)
194. « when owl:sameAs is not the same »
(H. Halpin, I. Herman, P. Hayes)
des représentations de ressources jugées identiques
peuvent néanmoins diverger.
ex. : si ma ressource est l’élément sodium…
• OpenCyc : un élément est l’ensemble de
tous les fragments de cet élément à l’état pur
• DBpedia : inclut en outre les isotopes de sodium
(nombre de neutrons différent)
deux vue sur la même chose ou deux objets
différents ?
201. inria:CorporateSemanticWeb
skos:scopeNote "only within KM community";
skos:definition "a semantic web on an intranet";
skos:example "Nokia's internal use of RDF gateway";
skos:historyNote "semantic intranet until 2006";
skos:editorialNote "keep wikipedia def. uptodate";
skos:changeNote "acronym added by fabien".
204. Triplets produits :
• cellules d’une ligne sujet commun
• noms des colonnes prédicats
• une cellule un objet
• liens entre tables
nom prenom age
filar alain 34
seger thomas 45
#s1 :nom "filar"
#s1 :prenom "alain"
#s1 :age "34"
#s2 :nom "seger"
#s2 :prenom "thomas"
#s2 :age "45"
#s3 …
205. exemple de mapping
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name
a:homepage
a:author
I. Herman, W3C
206. (1) transformation
table personnes
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name
a:homepage
a:author
:P_Table rdf:type rr:TriplesMap ;
rr:subjectMap [
rr:termtype "BlankNode" ;
rr:column "ID" ;
] ;
rr:predicateObjectMap [
rr:predicateMap [
rr:predicate a:name
];
rr:objectMap [
rr:column "Name"
]
] ;
rr:predicateObjectMap [
rr:predicateMap [
rr:predicate a:homepage
];
rr:objectMap [
rr:column "Homepage" ;
rr:termtype "IRI"
]
] ;
I. Herman, W3C
207. (2) transformation
table livres
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name
a:homepage
a:author
I. Herman, W3C
:B_Table rdf:type rr:TriplesMap ;
rr:subjectMap [
rr:template "http://...isbn/{ISBN}";
];
rr:predicateObjectMap [
rr:predicateMap [
rr:predicate a:title
];
rr:objectMap [
rr:column "Title"
]
] ;
rr:predicateObjectMap [
rr:predicateMap [
rr:predicate a:year
];
rr:objectMap [
rr:column "Year" ;
]
] ;
208. (3) lier les tables
ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000
ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com
http://…isbn/000651409X
Ghosh, Amitav http://www.amitavghosh.com
The Glass Palace
2000
a:name
a:homepage
a:author
I. Herman, W3C
:B_Table a rr:TriplesMap ;
...
rr:refPredicateObjectMap [
rr:refPredicateMap [
rr:predicate a:author
];
rr:refObjectMap [
rr:parentTriplesMap :P_Table ;
rr:joinCondition
"{child}.Author = {parent}.ID"
]
]
].
209. RDFa signifie
RDF dans des attributs de HTML
<div xmlns:dc="http://purl.org/dc/elements/1.1/">
<h2 property="dc:title">The trouble with Bob</h2>
<h3 property="dc:creator">Alice</h3>
...
</div>
210.
211.
212.
213. provenance, confiance, explication,
“At the toolbar (menu,
whatever) associated with a
document there is a button
marked "Oh, yeah?". You
press it when you loses that
feeling of trust. It says to
the Web, "so how do I know
I can trust this
information?". The software
then goes directly or
indirectly back to
metainformation about the
document, which suggests a
number of reasons.”
Tim Berners-Lee, Consistent User
Interface, W3C Design Issues, 1997
Oh,yeah?
214. en insérant des étiquettes
émises par des autorités
dans les pages
protéger les enfants
<meta http-equiv="pics-label" content='(PICS-1.1
"http://www.icra.org/ratingsv02.html" labels
for "http://mm.256.com/"
generic true
ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1)
"http://www.rsac.org/ratingsv01.html" labels
for "http://mm.256.com/"
generic true
ratings (n 0 s 0 v 0 l 4) )' />
215. VoID: décrire des sources de données
schéma pour annoter des jeux de données
:DBpedia a void:Dataset .
et des jeux de liens
:DBpedia_Geonames a void:Linkset .
221. exemple de description POWDER
« toute ressource dont l’URI commence par
http://www-sop.inria.fr/fr/ concerne le centre
de recherche de l’INRIA géographiquement situé
à Sophia Antipolis et est en français »
certifié par inria.fr
232. 66 FOAF primitives 3 475 908 348 references (2)
x 52 millions
“a small tree ruling a big graph”(1)
(1) Franck Van Harmelen, ISWC 2011
(2) Libby Miller, 2009
233. le piège du domaine
le domaine d’application n’est pas
forcément celui de l’ontologie
242. donnez des URL aux contenus
une URL est un nom, sans URL pas de nom,
sans nom je ne peux pas en parler
• référence
• granularité
• vues
243. nouvelles formes de rédaction…
• systématiquement enrichir de liens
• identifier des cibles internes et externes
• identifier les persona de notre public
• permettre des parcours multimédias idoines
« produire une hyper-ressource, c’est hyper long…
c’est même jamais vraiment fini. »
244. forme / fond, structure, sémantique
• jeux de données scientifiques
entrées et sorties
• des schémas de données
développer http://ns.inria.fr
• Ex en biologie: HCLS IG
• SPARQL: recherche de liens, motifs et chaines
• référentiels métiers et domaines
nos termes, nos définitions, nos thésaurus, ...
ex. SHOINQ < ALC < Logique de Description < Langage Logique
<XML/>
245. utilités ? scénarios ?
• reproductibilité et comparatifs
• permettre d’autres expérimentations / algo
• ex. OAEI:
– Visibilité et citation
– Alignement de domaines,
sources, résultats, etc.
• journalisme de données
• génération de liens,
restructuration, ranking
246. le web comme écriture collective
• ouverture en écriture... collective
– ne plus centraliser la rédaction: distribuer, aider, …
– « utilisacteur »: nos lecteurs peuvent aider à
vulgariser, reformuler, enrichir
• ouverture en écriture collective ...
– ne plus centraliser la rédaction: animer, solliciter
– participer à d’autres sites: ex. wikipedia (édition, ref.)
247. nouvelles formes de publication…
• soumissions immédiatement publiques
• revues sollicitées et processus rendus publics
• ouvert aux commentaires et revues spontanés
• éditeur scientifiques vs. web ouvert
• nouveaux modes opératoires, nouveaux critères
249. socialité centrée ressource
• objets cristallisant une activité sociale et vice-versa
• bis repetita placent… « online or invisible »
• e.g. médiathèque sociale (vidéos, images, etc.)
– commentaires, tagging, etc. site ouvert à tous
– contributions ouvertes en interne
• e.g. « e-CRDP »
– cartographie intervenants et matériels pédagogiques
– ex. un compte slideshare, service interne… + animation
• interstice socialisé: réactions, tagging, etc.
…
250. au-delà du Buzz
• orchestrer la communication et sa contagion
• gérer notre présence en ligne
• faire explicitement appel au peuple
(sondages, campagnes de test, etc.)
• faire implicitement appel au peuple
(tagging, bookmarking, etc.)
• cartographie interne et externe de nos réseaux
251. nos algorithmes
en ligne
• fournisseurs de services de haut niveau
(bibliothèque, QoS, certification, etc.)
• démonstrateurs / testeurs
ex. traitement d’image
• services, API et widgets
• galerie, maintenance,
serveur application
HTTP HTTP
application
navigateur
HTTP
ex. « pseudo haptic »…
252. label sur des ressources web
• authentifier des ressources
• valider des données
• sécuriser des accès
• certifier des services
…
253. interfaces et utilisateurs partout
• HTML5: de la page à l’application
nouvelles formes de production et consultation
• consommation opportuniste, contextuelle, etc.
• contenus multi-formats (ex. podcasts interstices)
• Accessibilité ?
• App. INRIA ?
258. webrecommandations
html
http
url html httpurl
uri
iri
ataguaagwcag aria
mwbpearlra cc/pp assxcss
ddrsa xml eve. exi geo apidom xform
grddl inkml its cmwww ruby an.xhtml rdfa
ets omr m. ok emma p3pmath ml mf
pics qa rif sec cont. sawsdlpng powder
sml soap
wsdl
svg awwwttml smile
rdf owlrdfssparql
etc.
woff
webcgm
xbl xkms xlinkwscdl wsp
skos
ns canon. x dtxml xproc xfragxml xbase
xschema xml:id xpath xpointer xqueryxsignat. xbop
xslt xslfo
…
259. Leçon 1: faire une application web
o HTML 5
o CSS 2.1
o CSS 3 Selectors
o CSS 3 Media Queries
o CSS 3 Text
o CSS 3 Backgrounds
and Borders
o CSS 3 Colors
o CSS 3 2D
Transformations
o CSS 3 3D
Transformations
o CSS 3 Transitions
o CSS 3 Animations
o CSS 3 Multi-Columns
o CSS Namespaces
o SVG 1.1
o WAI-ARIA 1.0
o MathML 2.0
o ECMAScript 5
o 2D Context
o WebGL
o Web Storage
o Indexed Database
o Web Workers
o Web Sockets
Protocol/API
o Geolocation
o Server-Sent Events
o Element Traversal
o DOM Level 3 Events
o Media Fragments
o XMLHttpRequest
o Selectors API
o CSSOM View Module
o File API
o RDFa
o Microdata
o WOFF
o HTTP 1.1
o TLS 1.2 (updated)
o IRI (updated)
o …
W3C
264. informel
formel
usage représentation
un et un seul web…
données
personnes documents
programmes
un espace unique dans tous les sens du terme, une toile hybride
metadata
gestion-orientée métadonnée
• diversité de ressources (données ou non)
• métadonnées & schéma pour leur gestion
• importance du web sémantique dans ce contexte