1. 05/10/2012
cinq objectifs
l’avenir du web • présenter
(un web de ressources computationnelles)
au prisme de la ressource • résumer, rappeler
Nicolas Delaforge, Fabien Gandon et Alexandre Monnin (web de données, web sémantique)
• discuter, provoquer
(le document n’existe pas)
• orienter
(et pour nous alors)
• conclure, ouvrir
(ce n’est que le début)
trois composants de l’architecture du web
• identification (URI) & adressage (URL)
http://www.inria.fr
http://ns.inria.fr/fabien.gandon#me
architecture web
ldap://[2001:db8::7]/c=GB?objectClass?one
• communication / protocole (HTTP)
GET /centre/sophia HTTP/1.1
Host: www.inria.fr
User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de)
AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4
Safari/523.10
Accept-Encoding: gzip
Accept: text/html,application/xhtml+xml,application/xml
Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
Referer: http://fabien.info/
• langage de représentation (HTML / RDF)
Fabien travaille chez <a href="http://www.inria.fr">Inria</a>
<http://www.inria.fr> foaf:member data:fabien
pas pour les gens… et pourtant… la syntaxe des URIS
qui et quand ?
URI: identification de n’importe qu’elle ressource
URL=URI + Localisation URL=UR(I+L)
HTTP URI: URI déréférençable selon HTTP
« follow your nose » / naviguer au flair
UR*
(wikipedia)
1
2. 05/10/2012
URI aux jointures 7 application web documentaire « REST in peace »
• entre les assertions • REST(ful): invocation et composition d’applications
même si elles sont distribuées 6 présentation
distribuées sur le web
• entre les couches réseau 5 session • primitives HTTP, actions sur la ressource
(Internet, Web, Web sémantique) GET, HEAD, POST, OPTIONS,
4 transport CONNECT, TRACE, PUT, DELETE
• le web ne fut jamais vraiment documentaire
3 réseau
2 données • web…
1 physique – application centrée ressources (identifiées par URI)
– architecture orientée ressource (localisables URL)
– toile de calculs liés et non de documents
trois composants de l’architecture du web
• identification de la ressource (URI)
• accès à une représentation (HTTP URI)
ressource
• codage de la représentation (HTML , RDF, etc)
HTTP Range 14
uri, ressource, ombre, objet
• identification
• individuation/
ils n’en ont pas parlé ils en ont parlé
Code HTTP Résultat Indication
Ressource informationnelle (IR) et objectivation
200 (OK) Représentation
non informationnelle (NIR) ? zèbre (à défaut d’antilope )
303 (voir Tout type de ressource notamment
URI
autre) des NIR
4XX, 5XX Message
Aucune déduction possible
(erreur) d’erreur
« ce n’est peut-être pas le problème de HTTP ou des URI »
2
3. 05/10/2012
Généalogie : du document (B.B.) à la
ressource
• tout ce que l’on sait identifier
ressource
Ressource :
• pierre angulaire de l’architecture de tout le web Manipulation indirecte
• concept unificateur de ses facettes
HTTP URI requête HTTP
«…»
« ressource » erreur HTTP locus
représentation
Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée
ressources computationnelles rappel et parallèle
• sans notice pas d’existence dans la collection
l’objet
règles
• sans ressource pas d’existence sur le web
la ressource «…»
l’état de la ressource
l’état représentationnel
ou une représentation de la ressource
toile de calculs
3
4. 05/10/2012
1991-1993 System 33: un prédécesseur
méconnu du conneg + services de rendu
conneg
client http serveur
Servicing
Client
Application RPC
Rendering Electronic Other encoding
Computers service documents formats
Psychophysically
equivalents appearences database
moteur et CGI
personnalisation, adaptation
« Filter Bubble » Eli Pariser
Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris
6200, Windows 7, Anglais
4
5. 05/10/2012
Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London
(10.6.8), french
Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7
OS: MacOs X 10.6.8, Firefox Professional, English
il cherche « bmw »,
« mahler » et « gay » ?=!
BMW
« Je m’intéresse aux BMW »
5
6. 05/10/2012
Allo Google ? C’est la Noiraude…
United States Flu Activity - Influenza estimate
● Google Flu Trends ● U.S. Centers for Disease Control.
« document sur lui-même »
document vivant, chaque consultation
change le document
Chine: 1 600 millions
Inde: 1 200 millions
acebook
900 millions
PORTÉE
6
9. 05/10/2012
gérér sa bibliographie : Zotero et Coins
extraction de données
« page » donnant l’analyse du texte d’une autre « page »
made in web
auteurs? journal
confusion des genres?
9
10. 05/10/2012
permanence/
non permanence
raccourcisseur d’URL
et re-captcha…
des jeux utiles au crowdsourcing
le web comme une plateforme d’externalisation
distribuée de masse. temps facebook
16.2 millions secondes/seconde
x 16 203 703
253
Fold It
le web comme une
machine universelle
de moteurs à pulsions
(méta)-données
l’utilisateur utilisé
application web
10
13. 05/10/2012
une interface programmatique
universelle design & affordance
ceci est un ovetto
application serveur application
?
HTTP HTTP
HTTP
navigateur
affordance sémantique
SAWSDL of WSDL (W3C Rec. 2007)
semantic annotation
SAWSDL… services annotés et recherchés
sémantiquement
annuaire
2 1
3
demandeur client service fournisseur
13
14. 05/10/2012
sortie
entrée
pre-populating…
workflows scientifiques
• composer des données et traitements distribués
• échanger et comparer les traitements et leurs
compositions
name assistant’s phone phone phone name name
employee assistant
SSRSSLSSS
SSLSSLSSS
semonde
au
lier
Le bug de l’an…
2020
( inspiration Gérard Berry)
14
15. 05/10/2012
1 sec. battement de cœur
1/2 sec. double click
24 images/sec. film
« Aliénation et accélération. » 500 000 décisions / sec. algorithmes boursiers
Hartmut Rosa
DNS, TCP/IP, Web
http://mon.org/ma/ressource
DNS, TCP/IP, Web
GET
http://mon.org/ma/ressource
règles négociation règles négociation
calculs calculs
composition composition
rendu rendu
… …
… …
… …
… …
… …
…
…
… …
…
…
30 min…
15
16. 05/10/2012
le livre n’est pas recréé à chaque page
5 jours…
Stéphane Crozat:
« le document numérique n'existe pas, ce qui
existe ce sont des constructions numériques
dont le traitement calculatoire simule un ordre
documentaire. »
nouveaux engagements, contrats
• contrats de lecture + computationnel
Le juridique aussi souffre • contrats d’identification + computationnel
de l’héritage documentaire • contrats d’accès + computationnel
des données • contrats de publication + computationnel
• contrats de stockage + computationnel
• etc.
« il n’y a plus de documents, le besoin de
documentariser n’en n’est que plus fort. »
16
18. 05/10/2012
web…devices [Web of Devices]
… Web Phone
… Web TV
… Web Radio
… Web Car
… Web Tablet
… Web eBook
… Web Watch
… Web GPS
…
cintre Facebook chez C&A Brésil
nouvelles topologies du web
ex. « near field communication »
18
19. 05/10/2012
Open Street Map dans le métro
navigateur web = interface universelle
ex. domotique
Web 2.0 & Web Physique
19
20. 05/10/2012
fabien Janet Echelman, “Her Secret is Patience”, Civic Space Park,
Phoenix, AZ, USA, 2009
RFID&URI ex. Live Social Semantics
plusieurs évolutions concourantes l’effet diligence
Jacques Perriault
• explosion multimédia et multi-modalité
• toile de ressources computationnelles liées
• ressources comme locus de calcul
• assimilation de tous les objets à des ressources web
liens d’association [Vannevar Bush, 1945]
du mémex entre les informations qui nous importent
(méta) web
20
21. 05/10/2012
http://www.
hypertexte, hypermédia [Ted Nelson, 1965] liens utilisant des références
une structure de fichier pour l’information
complexe, changeante et indéterminée à travers le réseau [Tim Berners-Lee, 1989]
hypertexte et document sur le Web :
de la nécessité de les reconstruire par
assemblages
Hypertexte : Google
Le Web à la base n’est
pas un hypertexte : il ne
relie pas des documents.
mais il peut le devenir ou accueillir Document : Scenari
des documents car c’est aussi une
plateforme ouverte…
…
vers un web
structuré
séparer
forme et contenu
21
22. 05/10/2012
2008 XML a eu dix ans <balise>…</balise> XML
bien formé
structurer construction
des données
<racine>...</racine>
modulaire
<x>...</x> ou <x/>
en utilisant une famille de <a><b></a></b>
des balises langages <x> <X>
dans un format un format ouvert <1an> <xmla> <bla bla>
textuel non propriétaire <a b='c'></a> ou <a b='c'/>
XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html
Scalable Vector eXtensible Access Control
Graphics (SVG) Markup Language (XACML) WSDL namespace
OpenOffice • espaces de nommage
Schemas • éviter les collision de noms
MusicML • associer un préfixe de balise à un URI
• exemple
XML Topic
<ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note>
Maps (XTM) <bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note>
GPS Exchange Financial • définitions héritées dans l’arbre XML
format (GPX) products Markup
Chemical Markup • namespace par défaut xmlns="…"
Synchronized Language (CML) XHTML Language (FpML)
Multimedia Integration NewsML
Language (SMIL) MathML de langages
famille
“Jacob Lorhard's "Ogdoas Scholastica" (1606) contains the first occurrence of the term
Ontologie ontologie
->
‘ontologia’ ” Raul Corazzon on formalontology.it
ontos logos
être / êtres discours / science
22
23. 05/10/2012
votre réponse est basée sur une
sous
ontologie partagée type
Document
je peux comprendre
Book
vous pouvez raisonner
Novel Short story
sous
type
"document" #12 #12
#21 #12 #21 #12
"book" #21 #21
"livre"
#47 #21 #48 #21 #47 #21 #48 #21
#47 #48 #47 #48
"novel" "short story"
"roman" "nouvelle"
connaissance
ontologique formalisée
la connaissance
ontologie taxinomique
n’est pas un synonyme de est une connaissance
ontologique
taxinomie parmi d’autres
23
24. 05/10/2012
partie combiner
différents types de connaissances ontologiques
de Organic object
Individual Limb
méthane éthane méthanol éthanol
Cat
dioxyde de carbone dioxygène ozone phénol eau dihydrogène
méthyle
carbone oxygène hydrogène
Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition
of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294).
couverture
dans quelle mesure les primitives mobilisées par
les scénarios sont couvertes par l’ontologie spécificité dans quelle mesure
les primitives sont
précisément déclarées
dans l’ontologie
exemple granularité [Charlet - RFIA 2002]
granularité 1. Patient-Masculin
Patient-Féminin
dans quelle mesure les primitives 2. [Patient] (chrc) [Masculin]
[Patient] (chrc) [Féminin]
sont détaillées 3. [Patient] (attr) [Sexe] (val) [Masculin]
[Patient] (attr) [Sexe] (val) [Féminin]
24
25. 05/10/2012
méthodes
ex. rigidité dans Onto Clean [Guarino & Welty]
Rigid +R is a necessary property for all its instances
Anti-Rigid ~R is an optional property for all its instances
formalité Constraint: ~R can't subsume y+R
dans quelle mesure les
Person is y+R, Student is ~R
primitives sont décrites
dans un langage formel
structurer une “folksonomie” combinaison espaces métriques
web 2.0 folksonomies plates thesaurus distances d’édition
Monge-Elkan Soundex, JaroWinkler,
polluant énergie
asymétrie Monge-Elkan Qgram
related related
? pollution
has narrower
métrique contextuelle
cosinus vecteur de cooccurrences de tags
pollution des sols métriques sociales
SKOS inclusion de communautés
d’intérêt
25
26. 05/10/2012
ex. ademe TheseNet recherches & retours
83 027 relations / 9 037 tags
68 633 related
11 254 hyponyms
3 193 spelling variants
ex. propagation sémantique ex. Ademe 1 pollution ; 2 développent durable ;
3 énergie ; 4 chimie ; 5 pollution de l’air ;
6 métaux ; 7 biomasse ; 8 déchets.
from RAK/LP to SemTagP
rugby, foot hockey sel, eau sport sport condiment
poivre, vin condiment
foot, ciné moutarde sport condiment
langages
de formalisation
d’ontologies (define-class humain (?humain)
:def (animal ?humain))
exemple
subsomption dans les frames
26
27. 05/10/2012
(defprimconcept MALE)
(defprimconcept FEMELLE) [Concept: Directeur]->(Def)->
[LambdaExpression:
(disjoint MALE FEMELLE)
[Personne: ]->(Dirige)->[Groupe]]
exemple exemple
classes disjointes en logiques de description classe définie en graphes conceptuels
le web originel
liens typés…
vers un web
sémantique
web sémantique
mentionné par Tim BL
en 1994 à WWW RDF toute connaissance est décomposée en
,
triplets ( sujet , prédicat , objet )
arcs ( nœud, arête , nœud )
[Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]
27
28. 05/10/2012
ex : doc.html a pour auteur Fabien doc.html a pour auteur Fabien
et a pour thème la Musique doc.html a pour thème Musique
Fabien <RDF/> une syntaxe XML pour mieux
échanger ces graphes
auteur
doc.html
thème
Musique
<rdf:RDF nœuds anonymes (blank nodes)
xmlns:rdf="http://www.w3.org/1999/02/22- quantification existentielle
rdf-syntax-ns#" il existe une ressource telle que… { r ; …}
xmlns:inria="http://inria.fr/schema#" > <rdf:Description rdf:about="http://bu.ch/123.html ">
<auteur>
<rdf:Description>
<rdf:Description <nom>Trichard</nom>
<prenom>Laurent</prenom>
rdf:about="http://inria.fr/rr/doc.html"> </rdf:Description> x ; auteur(http://bu.ch/123.html,x)
<inria:author rdf:resource= </auteur> nom(x,"Trichard")
<titre>Les zélés faons roses</titre>
"http://inria.fr/~fabien#me" /> </rdf:Description>
prenom(x,"Laurent")
<inria:theme>Music</inria:theme>
auteur
</rdf:Description> http://bu.ch/l23.html
titre prenom nom
</rdf:RDF> "Les zélés faons roses" "Laurent" "Trichard"
28
29. 05/10/2012
exemple
personne ayant au moins 18 ans
PREFIX ex: <http://inria.fr/schema#>
SELECT ?person ?name
interroger avec SPARQL WHERE {
SPARQL Protocol and RDF ?person rdf:type ex:Person
?person ex:name ?name .
Query Language
?person ex:age ?age .
FILTER (?age > 17)
}
May 2007 April 2008 September 2008
March 2009
Linking Open Data
400
web de données
300
200
100
0
première vague de déploiement 10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012
du web sémantique (RDF, SPARQL)
September 2011
September 2010
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
e.g. DBpedia
29
30. 05/10/2012
CORESE/ KGRAM
contenus et thématiques
Domaines Nombre de jeux
de données Triplets % Liens sortants %
data.ratatouille.com
Media 25 1 841 852 061 5,82 % 50 440 705 10,01 %
Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 %
Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 %
Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 %
Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 %
Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 %
Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 %
295 31 634 213 770 503 998 829
0%
6%
9%
Gouvernement
10% 42%
Géographique
Inter-domaine
13% Sciences de la vie
Publications
20% Media
Contenu utilisateur
30
31. 05/10/2012
DNS celui qui contrôle le nom
*
.fr
de domaine contrôle le
principes déréférencement.
utiliser le format RDF
utiliser des URI pour nommer ex. bit.ly & Lybie .inria
utiliser des URI HTTP (URL) pour que l’on puisse les suivre
lorsqu’un URI est suivi donner des informations (HTML, RDF)
inclure dans ces informations des liens vers d’autres données
isicil
le cas de la France
mouvement d'ouverture
des données mais…
• redondance des identifiants
• hétérogénéité des formats
• diversité des vocabulaires
• hétérogénéité des accès
(June 2012)
publication
processus démo
• installation en un
click
• import de données
trouvées en ligne
• transformation en
RDF
• publication sur le
web
• interrogation directe
31
32. 05/10/2012
par union
RDFS pour définir les classes de la disjonction
ressources, leurs propriétés, OWL in one… par intersection
et organiser leur hiérarchie prop. algébriques par complément
! par restriction
Document créateur 1..1
par cardinalité
prop. disjointes par équivalence
auteur par énumération
! cardinalité qualifiée
Rapport Document Personne 1..1 [>18] restrict. valeur
négation prop. indiv union disjointe
prop. chainées clefs
…
alignements et liage
ontologies et entités nommées
• « Ontology Alignment
Evaluation Initiative »
• reconnaissance d’entités nommées
• liage de ressources
OKKAM et owl:sameAs 1
“The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query:
where does John teach and what? One will make the following query on the merge of the two datasets:
< x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y
Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John
teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at
UNI1 and philosophy of language at UNI2.”
(Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web
Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo)
32
33. 05/10/2012
OKKAM et owl:sameAs 2 « when owl:sameAs is not the same »
(H. Halpin, I. Herman, P. Hayes)
des représentations de ressources jugées identiques
peuvent néanmoins diverger.
ex. : si ma ressource est l’élément sodium…
• OpenCyc : un élément est l’ensemble de
tous les fragments de cet élément à l’état pur
• DBpedia : inclut en outre les isotopes de sodium
(nombre de neutrons différent)
deux vue sur la même chose ou deux objets
différents ?
chaine GATE : exemple en biologie…
thesaurus,
classifications,
sujets, taxinomies,
folksonomies, ...
vocabulaires
contrôlés
33
34. 05/10/2012
relations
expression naturelle pour
dénoter un concept
labels entre concepts
inria:CorporateSemanticWeb
inria:CorporateSemanticWeb skos:broader w3c:SemanticWeb;
skos:prefLabel "corporate semantic web"@en; skos:narrower inria:CorporateSemanticWiki;
skos:prefLabel "web sémantique d'entreprise"@fr; skos:related inria:KnowledgeManagement.
skos:altLabel "corporate SW"@en;
skos:altLabel "CSW"@en;
skos:hiddenLabel "web semantique d'entreprise"@fr.
beaucoup de données
dans beaucoup de pages
inria:CorporateSemanticWeb
skos:scopeNote "only within KM community";
skos:definition "a semantic web on an intranet";
skos:example "Nokia's internal use of RDF gateway";
skos:historyNote "semantic intranet until 2006";
skos:editorialNote "keep wikipedia def. uptodate";
skos:changeNote "acronym added by fabien".
Triplets produits :
schéma
• cellules d’une ligne sujet commun
• noms des colonnes prédicats
• une cellule un objet
• liens entre tables
mapping
nom prenom age #s1 :nom "filar"
filar alain 34 #s1 :prenom "alain"
R2RML seger thomas 45
#s1 :age "34"
#s2 :nom "seger"
une transformation standard
#s2 :prenom "thomas"
d’une base relationnelle en RDF #s2 :age "45"
#s3 …
34
35. 05/10/2012
:P_Table rdf:type rr:TriplesMap ;
(1) transformation rr:subjectMap [
rr:termtype "BlankNode" ;
exemple de mapping rr:column "ID" ;
] ;
table personnes rr:predicateObjectMap [
rr:predicateMap [
rr:predicate a:name
];
rr:objectMap [
ISBN Author Title Year ISBN Author Title Year rr:column "Name"
]
0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000
] ;
rr:predicateObjectMap [
rr:predicateMap [
ID Name Homepage ID Name Homepage rr:predicate a:homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com ];
rr:objectMap [
rr:column "Homepage" ;
rr:termtype "IRI"
]
] ;
The Glass Palace The Glass Palace
http://…isbn/000651409X http://…isbn/000651409X
2000 2000
a:author a:author
a:name a:name
a:homepage a:homepage
Ghosh, Amitav http://www.amitavghosh.com Ghosh, Amitav http://www.amitavghosh.com
I. Herman, W3C I. Herman, W3C
(2) transformation
(3) lier les tables
table livres
ISBN Author Title Year ISBN Author Title Year
0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000
ID Name Homepage ID Name Homepage
id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com
:B_Table rdf:type rr:TriplesMap ; The Glass Palace The Glass Palace
http://…isbn/000651409X http://…isbn/000651409X
rr:subjectMap [
rr:template "http://...isbn/{ISBN}"; 2000 2000
];
rr:predicateObjectMap [ :B_Table a rr:TriplesMap ;
rr:predicateMap [ ...
rr:predicate a:title
];
a:author rr:refPredicateObjectMap [ a:author
rr:objectMap [ rr:refPredicateMap [
rr:column "Title" rr:predicate a:author
] ];
] ; a:name a:name
rr:predicateObjectMap [ a:homepage rr:refObjectMap [ a:homepage
rr:predicateMap [ rr:parentTriplesMap :P_Table ;
rr:predicate a:year Ghosh, Amitav http://www.amitavghosh.com rr:joinCondition Ghosh, Amitav http://www.amitavghosh.com
];
rr:objectMap [ "{child}.Author = {parent}.ID"
rr:column "Year" ; ]
] ]
] ; ].
I. Herman, W3C I. Herman, W3C
RDFa signifie
RDF dans des attributs de HTML
<div xmlns:dc="http://purl.org/dc/elements/1.1/">
<h2 property="dc:title">The trouble with Bob</h2>
<h3 property="dc:creator">Alice</h3>
...
</div>
35
36. 05/10/2012
provenance, confiance, explication, protéger les enfants
en insérant des étiquettes
Oh,yeah?
émises par des autorités
“At the toolbar (menu, dans les pages
whatever) associated with a
document there is a button
marked "Oh, yeah?". You
press it when you loses that
feeling of trust. It says to
the Web, "so how do I know
I can trust this <meta http-equiv="pics-label" content='(PICS-1.1
information?". The software "http://www.icra.org/ratingsv02.html" labels
then goes directly or for "http://mm.256.com/"
indirectly back to generic true
metainformation about the ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1)
document, which suggests a "http://www.rsac.org/ratingsv01.html" labels
number of reasons.” for "http://mm.256.com/"
Tim Berners-Lee, Consistent User generic true
Interface, W3C Design Issues, 1997 ratings (n 0 s 0 v 0 l 4) )' />
:DBpedia a void:Dataset;
VoID: décrire des sources de données void:sparqlEndpoint <http://dbpedia.org/sparql>;
void:feature :RDFXML ;
schéma pour annoter des jeux de données void:subset :DBpedia2Geonames ;
:DBpedia a void:Dataset . void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ;
dcterms:modified "2008-11-17"^^xsd:date;
et des jeux de liens dcterms:title "DBPedia";
:DBpedia_Geonames a void:Linkset . dcterms:description "RDF data extracted from Wikipedia";
dcterms:publisher :DBpedia_community;
dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>;
dcterms:source <http://dbpedia.org/resource/Wikipedia>.
:Geonames a void:Dataset;
void:sparqlEndpoint <http://geosparql.appspot.com/query>;
void:triples "107983838"^^xsd:integer ;
dcterms:subject <http://dbpedia.org/resource/Location> .
:DBpedia2Geonames a void:Linkset ;
void:linkPredicate owl:sameAs ;
void:target :DBpedia ;
void:target :Geonames . ex. DBpedia dataset
36
37. 05/10/2012
PROV-DM & PROV-O OWL2 ontology
provenance & traçabilité décrire les entités et activités impliquées dans la
[Provenance WG] production, livraison, etc. d’un objet
++
ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 .
ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated .
ex1:illustrated prov:used ex1:aggregate2 .
ex1:chart2 prov:wasGeneratedBy ex1:illustrated .
ex1:aggregated prov:wasControlledBy ex1:derek .
ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 .
plusieurs
ressources
grouping mechanisms...
... list URIs
... domain names, paths
... regular expressions on URIs
listes
domaines, chemins
description expressions régulières
authentifiée
exemple de description POWDER
« toute ressource dont l’URI commence par
http://www-sop.inria.fr/fr/ concerne le centre
de recherche de l’INRIA géographiquement situé
à Sophia Antipolis et est en français »
certifié par inria.fr
préjugés, fausses idées
37
38. 05/10/2012
éviter de construire une
boite noire
rendre les conceptualisations à base d’ontologie
explicites ne signifie pas que l’on
a besoin d’un moteur
d’inférence.
ma montre n'a qu'une aiguille
mais elle n'est pas cassée.
de l'intérêt d'un à peu près…
38
39. 05/10/2012
sens et position
d’une taxonomie à une vue
0° a=120° 360°
r a
“semantic web” 66 FOAF primitives
x 52 millions
3 475 908 348 references (2)
and not
“semantic web”
[C. Welty, ISWC 2007]
“a lightweight ontology
allows us to do
lightweight reasoning”
“a small tree ruling a big graph”(1)
(1) Franck Van Harmelen, ISWC 2011
[J. Hendler, ISWC 2007] (2) Libby Miller, 2009
je n’ai jamais vu une ontologie
universelle
le piège du domaine
le domaine d’application n’est pas
forcément celui de l’ontologie
39
40. 05/10/2012
Trouble dans la classification
(F. Rastier)
la vache folle
ou l’ontologue végétarien
s:MadCow rdfs:subClassOf s:Cow
cycle
vie
brique de construction
vs.
modèle changeant
conception
besoin évolution diffusion
gestion
évaluer utilisation
tri sélectif sémantique
le web est une poubelle,
le web sémantique sera une poubelle sémantique.
et pour nous ?
40
41. 05/10/2012
hyper-documentaire donnez des URL aux contenus
de l’article scientifique à l’hyper-article multi-public
une URL est un nom, sans URL pas de nom,
sans nom je ne peux pas en parler
• référence
• granularité
• vues
plus vieille facette, mais encore sous exploitée
forme / fond, structure, sémantique
<XML/>
• jeux de données scientifiques
nouvelles formes de rédaction… entrées et sorties
• systématiquement enrichir de liens
• des schémas de données
• identifier des cibles internes et externes développer http://ns.inria.fr
• identifier les persona de notre public • Ex en biologie: HCLS IG
• permettre des parcours multimédias idoines • SPARQL: recherche de liens, motifs et chaines
• référentiels métiers et domaines
« produire une hyper-ressource, c’est hyper long… nos termes, nos définitions, nos thésaurus, ...
c’est même jamais vraiment fini. » ex. SHOINQ < ALC < Logique de Description < Langage Logique
utilités ? scénarios ? le web comme écriture collective
• reproductibilité et comparatifs
• permettre d’autres expérimentations / algo
• ouverture en écriture... collective
• ex. OAEI:
– ne plus centraliser la rédaction: distribuer, aider, …
– Visibilité et citation
– « utilisacteur »: nos lecteurs peuvent aider à
– Alignement de domaines,
vulgariser, reformuler, enrichir
sources, résultats, etc.
• ouverture en écriture collective ...
• journalisme de données
– ne plus centraliser la rédaction: animer, solliciter
• génération de liens,
– participer à d’autres sites: ex. wikipedia (édition, ref.)
restructuration, ranking
41