SlideShare uma empresa Scribd logo
1 de 45
Baixar para ler offline
05/10/2012




                                                                            cinq objectifs
                  l’avenir du web                                           • présenter
                                                                              (un web de ressources computationnelles)
                  au prisme de la ressource                                 • résumer, rappeler
                  Nicolas Delaforge, Fabien Gandon et Alexandre Monnin        (web de données, web sémantique)
                                                                            • discuter, provoquer
                                                                              (le document n’existe pas)
                                                                            • orienter
                                                                              (et pour nous alors)
                                                                            • conclure, ouvrir
                                                                              (ce n’est que le début)




                                                                          trois composants de l’architecture du web
                                                                          • identification (URI) & adressage (URL)
                                                                            http://www.inria.fr
                                                                            http://ns.inria.fr/fabien.gandon#me


   architecture web
                                                                            ldap://[2001:db8::7]/c=GB?objectClass?one

                                                                          • communication / protocole (HTTP)
                                                                            GET /centre/sophia HTTP/1.1
                                                                            Host: www.inria.fr
                                                                            User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de)
                                                                            AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4
                                                                            Safari/523.10
                                                                            Accept-Encoding: gzip
                                                                            Accept: text/html,application/xhtml+xml,application/xml
                                                                            Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3
                                                                            Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
                                                                            Referer: http://fabien.info/

                                                                          • langage de représentation (HTML / RDF)
                                                                            Fabien travaille chez <a href="http://www.inria.fr">Inria</a>
                                                                            <http://www.inria.fr> foaf:member data:fabien




 pas pour les gens… et pourtant…                                         la syntaxe des URIS
                                                                          qui et quand ?


 URI: identification de n’importe qu’elle ressource
 URL=URI + Localisation URL=UR(I+L)
 HTTP URI: URI déréférençable selon HTTP
  « follow your nose » / naviguer au flair


UR*
                                                            (wikipedia)




                                                                                                                                            1
05/10/2012




URI aux jointures                 7                   application         web documentaire « REST in peace »
• entre les assertions                                                    • REST(ful): invocation et composition d’applications
  même si elles sont distribuées  6                   présentation
                                                                            distribuées sur le web
• entre les couches réseau        5                   session             • primitives HTTP, actions sur la ressource
  (Internet, Web, Web sémantique)                                           GET, HEAD, POST, OPTIONS,
                                  4                   transport             CONNECT, TRACE, PUT, DELETE

                                                                          • le web ne fut jamais vraiment documentaire
                                                3     réseau
                                                2     données             • web…
                                                1     physique              – application centrée ressources (identifiées par URI)
                                                                            – architecture orientée ressource (localisables URL)
                                                                            – toile de calculs liés et non de documents




trois composants de l’architecture du web
• identification de la ressource (URI)



• accès à une représentation (HTTP URI)

                                                                                                               ressource
• codage de la représentation (HTML , RDF, etc)




 HTTP Range 14
                                                                            uri, ressource, ombre, objet

                                                                                                               • identification
                                                                                                               • individuation/
           ils n’en ont pas parlé             ils en ont parlé

   Code HTTP            Résultat                Indication
                                     Ressource informationnelle (IR) et                                          objectivation
     200 (OK)     Représentation
                                       non informationnelle (NIR) ?             zèbre (à défaut d’antilope )
     303 (voir                      Tout type de ressource notamment
                        URI
      autre)                                      des NIR
     4XX, 5XX         Message
                                        Aucune déduction possible
     (erreur)         d’erreur
  « ce n’est peut-être pas le problème de HTTP ou des URI »




                                                                                                                                         2
05/10/2012




                                                           Généalogie : du document (B.B.) à la
ressource
• tout ce que l’on sait identifier
                                                           ressource
                                                                                                                                                 Ressource :
• pierre angulaire de l’architecture de tout le web                                                                                              Manipulation indirecte


• concept unificateur de ses facettes

                 HTTP URI                 requête HTTP
                                                                                                                                                 «…»
   « ressource »                          erreur HTTP                                                                                            locus
                                          représentation




                                                           Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée




ressources computationnelles                                rappel et parallèle
                                                            • sans notice pas d’existence dans la collection
 l’objet
                                 règles




                                                            • sans ressource pas d’existence sur le web


 la ressource                                     «…»


 l’état de la ressource

 l’état représentationnel
  ou une représentation de la ressource




                        toile de calculs




                                                                                                                                                                          3
05/10/2012




1991-1993 System 33: un prédécesseur
méconnu du conneg + services de rendu
                                                conneg

         client                http                serveur




          Servicing
           Client
         Application         RPC
                                    Rendering         Electronic       Other encoding
 Computers                          service          documents           formats
     Psychophysically
       equivalents                                 appearences database


                                                                                        moteur et CGI


                                                                                        personnalisation, adaptation
                                                                                        « Filter Bubble » Eli Pariser




Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell      Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris
6200, Windows 7, Anglais




                                                                                                                                                                      4
05/10/2012




Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X       Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London
(10.6.8), french




Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English   Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7
OS: MacOs X 10.6.8, Firefox                                                      Professional, English




                                                      il cherche « bmw »,
                                                     « mahler » et « gay »        ?=!
                                                                                    BMW



                                                                                                              « Je m’intéresse aux BMW »




                                                                                                                                                                   5
05/10/2012




           Allo Google ? C’est la Noiraude…




United States Flu Activity - Influenza estimate
● Google Flu Trends    ● U.S. Centers for Disease Control.


                                                             « document sur lui-même »
                                                             document vivant, chaque consultation
                                                             change le document




                                                                                  Chine: 1 600 millions


                                                                                             Inde: 1 200 millions



                                                                                                      acebook
                                                                                                      900 millions




PORTÉE




                                                                                                                      6
05/10/2012




externaliser la socialité d’un site   OGP v2
intérêt et danger                     actions typées




                                      <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US"
                                           xmlns:fb="https://www.facebook.com/2008/fbml">

                                       <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE:
                                                  http://ogp.me/ns/apps/YOUR_NAMESPACE#">
                                          <meta property="fb:app_id" content="YOUR_APP_ID" />
                                          <meta property="og:type" content="YOUR_NAMESPACE:recipe" />
                                          <meta property="og:title" content="Stuffed Cookies" />
                                          <meta property="og:image" content="http://example.com/cookie.jpg" />
                                          <meta property="og:description" content="The Turducken of Cookies" />
                                          <meta property="og:url" content="http://example.com/cookie.html">
                                          <script type="text/javascript">
                                          function postCook()
                                          {   FB.api('/me/YOUR_NAMESPACE:cook' +
                                              '?recipe=http://example.com/cookie.html','post', (…)        });    }
                                          </script>
                                      </head>

                                       <body>
                                      (…)
                                          <form>
                                            <input type="button" value="Cook" onclick="postCook()" />
                                          </form>
                                       </body>

                       OGP schémas…   </html>
                                                                            code dans votre page




  Face… it




                                                                                                                         7
05/10/2012




     changing interface…


                                                                                   crowdsourcing crawling & indexing
                                                                                                    affiliation social sub-networks




analyse réseaux sociaux web 2.0 & dynamique
                                                                                                     une représentation est
                                                                                                        modifiée par un
                                                                                                         commentaire
                                                                                                       contenu essentiel, lié à une
                                                                                                    ressource spécifique (un article)
© FriendViz                                   © Obama’s network, Recorded Future                                   vs
                                                                                                      contenu accessoire, lié à une
                                                                                                          règle non-essentielle
                                                                                                           (un commentaire)




© Egyptian Revolution on Twitter, A. Panisson, Gephi        © Facebook




une ressource change : une question                                                suppression définitive
devient une réponse parfois…        ?!                                            ni ressource, ni représentation




                                                                                                                                         8
05/10/2012




     gérér sa bibliographie : Zotero et Coins




extraction de données
« page » donnant l’analyse du texte d’une autre « page »




                                                                                   made in web




                           auteurs?                        journal
                                                           confusion des genres?




                                                                                                  9
05/10/2012




permanence/
non permanence




                                                    raccourcisseur d’URL
                                                    et re-captcha…




des jeux utiles au crowdsourcing
le web comme une plateforme d’externalisation
distribuée de masse.                                temps facebook
                                                    16.2 millions secondes/seconde



                                                                      x 16 203 703




                                                                                     253




                                         Fold It




                   le web comme une
                  machine universelle
                 de moteurs à pulsions

                                   (méta)-données

l’utilisateur utilisé




                                                    application web



                                                                                                  10
05/10/2012




  jeu
   HTML5
                                               Mario Kart en HTML5 (ouf !)
                                                                   …




jouer dans le navigateur : le cloud
                                                   download

                                                                 upload


                                                   drag & drop




                                                  © HTML5Rocks




speech input

                                 geolocation




                                                html & js                 html & svg




                                                                                       WebGL
  © HTML5Rocks                                    © HTML5Rocks




                                                                                                      11
05/10/2012




                                                                 HTML pages
                                                                 of specifications




inputs, text, email, number, phone
©HTML5Rocks




                                                                                   HTML 1




                                                                               39 pages     963 pages




Ligne de
Temps
                                                                              • description sémantique de ressources
                                                                                multimedia [Media Annotation]
                                                                              • adressage d’éléments internes aux
                                                                                ressources [Media Fragment]
                                                                 annotations des éléments multimédia




                                                                 ontologies des ressources multimédias
fragment multimédia                                              ontology for Media Resources 1.0
• partie fragment de l’URL = après le #                           <video.ogv> a ma:MediaResource ;
  http://www.example.com/example.ogv#track=audio&t=10,20             ma:hasTrack <video.ogv#track=audio>,
                                                                                 <video.ogv#track=subtitle>;
• dimensions:                                                        ma:hasSubtitling <video.ogv#track=subtitle> ;
                                                                     ma:hasSigning <video.ogv#xywh=percent:70,70,90,90>   .
   – temporelle:
     t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z     <video.ogv#track=audio> a ma:AudioTrack ;
   – spatiale:                                                       ma:hasLanguage [ rdfs:label "en-GB" ] ;
     xywh=pixel:160,120,320,240   / xywh=percent:25,25,50,50         ma:hasFragment <video.ogv#track=audio&t=10,20> .

   – track:                                                        <video.ogv#track=audio&t=10,20> a ma:MediaFragment ;
     track=1 / track=video&track=subtitle / track=Wide               ma:hasLanguage [ rdfs:label "fr" ] .
   – nommée:                                                       <video.ogv#track=subtitle> a ma:DataTrack ;
     id=chapter-1
                                                                     ma:hasLanguage [ rdfs:label "es" ] .
• fragment non transmis par le navigateur:
                                                                  <video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ;
  encodage dans la requête HTTP                                      ma:hasLanguage [ rdfs:label "bfi" ] .




                                                                                                                                     12
05/10/2012




une interface programmatique
 universelle                                                  design & affordance
                                                              ceci est un ovetto
        application            serveur          application




                                                                                   ?
                        HTTP             HTTP




                           HTTP




           navigateur




affordance sémantique


                                                                SAWSDL of WSDL (W3C Rec. 2007)
                                                                semantic annotation




                                         SAWSDL…              services annotés et recherchés
                                                              sémantiquement


                                                                                       annuaire

                                                                                   2              1




                                                                                          3

                                                                 demandeur    client              service   fournisseur




                                                                                                                          13
05/10/2012




                                                                   sortie

                                                                   entrée




pre-populating…




                                                                   workflows scientifiques
                                                                   • composer des données et traitements distribués
                                                                   • échanger et comparer les traitements et leurs
                                                                     compositions




  name      assistant’s phone   phone   phone  name      name
 employee                                              assistant




                                                                                              SSRSSLSSS
                                                                                                  
                                                                                              SSLSSLSSS


   semonde
   au
      lier
                                                                                              Le bug de l’an…
                                                                                              2020
                                                                                                     ( inspiration Gérard Berry)




                                                                                                                                   14
05/10/2012




                                                                                                                             1 sec. battement de cœur




                                                                                                                                  1/2 sec. double click




                                                                                                                                     24 images/sec. film




                                                    « Aliénation et accélération. »                      500 000 décisions / sec. algorithmes boursiers
                                                    Hartmut Rosa




DNS, TCP/IP, Web


                   http://mon.org/ma/ressource
                                                                                      DNS, TCP/IP, Web

                                                                                                                 GET
                                                                                                                   http://mon.org/ma/ressource



                         règles négociation                                                                              règles négociation
                                  calculs                                                                                            calculs
                                  composition                                                                                        composition
                                  rendu                                                                                              rendu
                                  …                                                                                                  …

                                       …                                                                                                    …

                                                …                                                                                                  …
                                                …                                                                                                  …

                                                …                                                                                                  …
                       …




                                                                                                                        …
                                                …                                                                                                  …
                              …




                                                                                                                                 …




                                                                                                                              30 min…




                                                                                                                                                           15
05/10/2012




                                            le livre n’est pas recréé à chaque page




5 jours…




                                        Stéphane Crozat:
                                        « le document numérique n'existe pas, ce qui
                                          existe ce sont des constructions numériques
                                          dont le traitement calculatoire simule un ordre
                                          documentaire. »




                                        nouveaux engagements, contrats
                                        •   contrats de lecture         + computationnel
           Le juridique aussi souffre   •   contrats d’identification   + computationnel
           de l’héritage documentaire   •   contrats d’accès            + computationnel
           des données                  •   contrats de publication     + computationnel
                                        •   contrats de stockage        + computationnel
                                        •   etc.

                                        « il n’y a plus de documents, le besoin de
                                          documentariser n’en n’est que plus fort. »




                                                                                                  16
05/10/2012




                                                                       le web entre nous et le monde
                                                                       • documents & données augmentent nos perceptions
                                                                       • services & applications augmentent nos actions
                                                                       • incontournable &… ingérable?


                    tant à venir




réalité augmentée par le web
& augmentation du web par le réel                                                                                         google glass project

• vers une réalité augmentée par le web
• diversité des ressources web augmentée par
  diversité des ressources de notre réalité
• « documentarisation non documentaire »
  de la réalité par le web
• modèle documentaire rendu minoritaire / modèle
  calculatoire
• limite de la métaphore de la bibliothèque
• une toile de ressources informatiques




chaque utilisateur est un détecteur                                    une toile de données multiples
                                                                       entre différents barreaux de l’échelle des sphères
web de « consommacteurs » mobiles, « crawlers »                        « small data & big data »
du web & du monde physique
ex. Wikimapia, OpenStreetMap , etc.




                                      © Medialab Prado   © GeoSensor                                         Image,T. Berners-Lee, RuleML kickoff, 2005




                                                                                                                                                          17
05/10/2012




                                  web…devices       [Web of Devices]

                                           … Web Phone
                                           … Web TV
                                           … Web Radio
                                           … Web Car
                                           … Web Tablet
                                           … Web eBook
                                           … Web Watch
                                           … Web GPS

                                           …




cintre Facebook chez C&A Brésil




                                   nouvelles topologies du web
                                   ex. « near field communication »




                                                                              18
05/10/2012




Open Street Map dans le métro
                                      navigateur web = interface universelle
                                      ex. domotique




             Web 2.0 & Web Physique




                                                                               19
05/10/2012




            fabien                                          Janet Echelman, “Her Secret is Patience”, Civic Space Park,
                                                            Phoenix, AZ, USA, 2009




    RFID&URI                    ex. Live Social Semantics




plusieurs évolutions concourantes                           l’effet diligence
                                                            Jacques Perriault
•   explosion multimédia et multi-modalité
•   toile de ressources computationnelles liées
•   ressources comme locus de calcul
•   assimilation de tous les objets à des ressources web




                                                            liens d’association                                           [Vannevar Bush, 1945]

                                                            du mémex entre les informations qui nous importent

                              (méta) web




                                                                                                                                                         20
05/10/2012




                                                                                    http://www.
         hypertexte, hypermédia                           [Ted Nelson, 1965]   liens utilisant des références
       une structure de fichier pour l’information
         complexe, changeante et indéterminée                                  à travers le réseau [Tim Berners-Lee, 1989]




hypertexte et document sur le Web :
de la nécessité de les reconstruire par
assemblages

                                            Hypertexte : Google
    Le Web à la base n’est
    pas un hypertexte : il ne
    relie pas des documents.
    mais il peut le devenir ou accueillir   Document : Scenari
    des documents car c’est aussi une
    plateforme ouverte…




                                              …


                                    vers un web
                                    structuré




                                                                               séparer
                                                                               forme et contenu




                                                                                                                                    21
05/10/2012




2008                                 XML a eu dix ans <balise>…</balise>                                                                                                         XML
                                                                                                                                                                                 bien formé
              structurer                                               construction
              des données
                                                                                                                                                                                 <racine>...</racine>
                                                                       modulaire
                                                                                                                                                                                 <x>...</x> ou <x/>
              en utilisant                                             une famille de                                                                                            <a><b></a></b>
              des balises                                              langages                                                                                                  <x>   <X>
              dans un format                                           un format ouvert                                                                                          <1an> <xmla> <bla bla>
              textuel                                                  non propriétaire                                                                                          <a b='c'></a> ou <a b='c'/>



XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html




Scalable Vector                       eXtensible Access Control
Graphics (SVG)                        Markup Language (XACML)                                                                                                       WSDL   namespace
OpenOffice                                                                                                                                                                            •   espaces de nommage
Schemas                                                                                                                                                                               •   éviter les collision de noms
 MusicML                                                                                                                                                                              •   associer un préfixe de balise à un URI
                                                                                                                                                                                      •   exemple
  XML Topic
                                                                                                                                                                           <ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note>
  Maps (XTM)                                                                                                                                                               <bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note>

GPS Exchange                                Financial                                                                                                                                 • définitions héritées dans l’arbre XML
format (GPX)                        products Markup
             Chemical Markup                                                                                                                                                          • namespace par défaut xmlns="…"
 Synchronized Language (CML) XHTML Language (FpML)
Multimedia Integration NewsML
Language (SMIL)    MathML       de langages
                                                                       famille
                                                                           “Jacob Lorhard's "Ogdoas Scholastica" (1606) contains the first occurrence of the term




                                                                                                                                                                            Ontologie                          ontologie

                                                                                                                                                                                              ->
                                                                           ‘ontologia’ ” Raul Corazzon on formalontology.it




                               ontos                               logos
                         être / êtres                              discours / science




                                                                                                                                                                                                                                    22
05/10/2012




votre réponse est basée sur une
                                                                                                       sous
ontologie partagée                                                                                      type
                                                                              Document
                            je peux comprendre
                                                                                Book
              vous pouvez raisonner

                                                                       Novel           Short story




                                                sous
                                                   type
        "document"          #12                                                 #12

                              #21  #12                                            #21  #12
             "book"         #21                                                 #21
        "livre"

            #47  #21               #48  #21                     #47  #21                #48  #21
                      #47          #48                                  #47               #48
    "novel"                               "short story"
  "roman"                                   "nouvelle"
                                                          connaissance
                                                          ontologique formalisée




                                                                    la connaissance

        ontologie                                                 taxinomique
       n’est pas un synonyme de                                 est une connaissance
                                                                   ontologique
       taxinomie                                                     parmi d’autres




                                                                                                               23
05/10/2012




                                                         partie               combiner
                                                                              différents types de connaissances ontologiques
                                                         de                                            Organic object


                                                                                       Individual                                                      Limb
 méthane      éthane    méthanol     éthanol
                                                                               Cat




            dioxyde de carbone dioxygène   ozone   phénol eau   dihydrogène
  méthyle



       carbone                 oxygène                      hydrogène



                                                                                                            Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition
                                                                                                            of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294).




                                                   couverture


dans quelle mesure les primitives mobilisées par
     les scénarios sont couvertes par l’ontologie                                spécificité           dans quelle mesure
                                                                                                        les primitives sont
                                                                                                    précisément déclarées
                                                                                                           dans l’ontologie




                                                                              exemple granularité                                                            [Charlet - RFIA 2002]




                                                    granularité               1. Patient-Masculin
                                                                                 Patient-Féminin
  dans quelle mesure les primitives                                           2. [Patient]  (chrc)       [Masculin]
                                                                                 [Patient]  (chrc)       [Féminin]
                   sont détaillées                                            3. [Patient]  (attr)       [Sexe]  (val)  [Masculin]
                                                                                 [Patient]  (attr)       [Sexe]  (val)  [Féminin]




                                                                                                                                                                                                                            24
05/10/2012




                                                            méthodes
                                                            ex. rigidité dans Onto Clean [Guarino & Welty]
                                                            Rigid          +R       is a necessary property for all its instances
                                                            Anti-Rigid     ~R       is an optional property for all its instances
                 formalité                                  Constraint:    ~R can't subsume y+R
     dans quelle mesure les
                                                            Person is y+R, Student is ~R
     primitives sont décrites
     dans un langage formel




structurer une “folksonomie”                                combinaison espaces métriques
   web 2.0      folksonomies plates      thesaurus          distances d’édition
                                                            Monge-Elkan Soundex, JaroWinkler,
                                      polluant    énergie
                                                            asymétrie Monge-Elkan Qgram
                                       related    related



                              ?            pollution

                                         has narrower
                                                            métrique contextuelle
                                                            cosinus vecteur de cooccurrences de tags

                                       pollution des sols   métriques sociales
                                            SKOS            inclusion de communautés
                                                            d’intérêt




                                                                                                                                         25
05/10/2012




   ex. ademe TheseNet                                                             recherches & retours




                                           83 027 relations / 9 037 tags
                                               68 633 related
                                               11 254 hyponyms
                                               3 193 spelling variants




ex. propagation sémantique                                                        ex. Ademe     1 pollution ; 2 développent durable ;
                                                                                                3 énergie ; 4 chimie ; 5 pollution de l’air ;
                                                                                                6 métaux ; 7 biomasse ; 8 déchets.




                  from RAK/LP to SemTagP

rugby, foot   hockey sel, eau                  sport     sport   condiment


                             poivre, vin                              condiment
     foot, ciné   moutarde                             sport condiment




                                                       langages
                                                       de formalisation
                                                           d’ontologies           (define-class humain (?humain)
                                                                                         :def (animal ?humain))




                                                                                                                                 exemple
                                                                                                           subsomption dans les frames




                                                                                                                                                  26
05/10/2012




(defprimconcept MALE)
(defprimconcept FEMELLE)                                                       [Concept: Directeur]->(Def)->
                                                                                [LambdaExpression:
(disjoint MALE FEMELLE)
                                                                                 [Personne: ]->(Dirige)->[Groupe]]




                                                               exemple                                                    exemple
                               classes disjointes en logiques de description                       classe définie en graphes conceptuels




                                                                                                           le web originel
                                                                                                           liens typés…




                             vers un web
                             sémantique


  web sémantique
                 mentionné par Tim BL
                     en 1994 à WWW                                             RDF toute connaissance est décomposée en
                                                                                  ,
                                                                                           triplets ( sujet , prédicat , objet )
                                                                                               arcs ( nœud, arête , nœud )




   [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]




                                                                                                                                           27
05/10/2012




  ex : doc.html a pour auteur Fabien          doc.html a pour auteur Fabien
      et a pour thème la Musique             doc.html a pour thème Musique




                 Fabien                         <RDF/> une syntaxe XML pour mieux
                                                                           échanger ces graphes
                 auteur

                doc.html

                 thème

                Musique




<rdf:RDF                                     nœuds anonymes (blank nodes)
  xmlns:rdf="http://www.w3.org/1999/02/22-   quantification existentielle
  rdf-syntax-ns#"                            il existe une ressource telle que… {  r ; …}
  xmlns:inria="http://inria.fr/schema#" >    <rdf:Description rdf:about="http://bu.ch/123.html ">
                                               <auteur>
                                                <rdf:Description>
 <rdf:Description                                 <nom>Trichard</nom>
                                                  <prenom>Laurent</prenom>
 rdf:about="http://inria.fr/rr/doc.html">       </rdf:Description>       x ; auteur(http://bu.ch/123.html,x)
   <inria:author rdf:resource=                 </auteur>                                    nom(x,"Trichard")
                                               <titre>Les zélés faons roses</titre>
          "http://inria.fr/~fabien#me" />    </rdf:Description>
                                                                                         prenom(x,"Laurent")
   <inria:theme>Music</inria:theme>
                                                                           auteur
 </rdf:Description>                              http://bu.ch/l23.html

                                                      titre                     prenom              nom
</rdf:RDF>                                       "Les zélés faons roses"            "Laurent"   "Trichard"




                                                                                                                28
05/10/2012




                                             exemple
                                                                    personne ayant au moins 18 ans

                                             PREFIX ex: <http://inria.fr/schema#>
                                             SELECT ?person ?name
      interroger avec SPARQL                 WHERE {
      SPARQL Protocol and RDF                  ?person rdf:type ex:Person
                                               ?person ex:name ?name .
      Query Language
                                               ?person ex:age ?age .
                                               FILTER (?age > 17)
                                             }




                                             May 2007                    April 2008                                    September 2008




                                                                                                                                                                            March 2009
                                             Linking Open Data
                                              400




         web de données
                                              300

                                              200

                                              100

                                                0

           première vague de déploiement      10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012




           du web sémantique (RDF, SPARQL)




                                                                                                                      September 2011
                                                                                                                                                                         September 2010
                                             Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/




e.g. DBpedia




                                                                                                                                                                                          29
05/10/2012




                                                                                                                  CORESE/ KGRAM




contenus et thématiques
     Domaines           Nombre de jeux
                         de données               Triplets           %       Liens sortants             %
                                                                                                                  data.ratatouille.com
Media                         25               1 841 852 061       5,82 %     50 440 705            10,01 %

Géographique                  31               6145 532 484        19,43 %    35 812 328            7,11 %

Gouvernement                  49               13 315 009 400      42,09 %    19 343 519            3,84 %

Publications                  87               2 950 720 693       9,33 %     139 925 218           27,76 %

Inter-domaine                 41               4 184 635 715       13,23 %    63 183 065            12,54 %

Sciences de la vie            41               3 036 336 004       9,60 %     191 844 090           38,06 %

Contenu utilisateur           20                134 127 413        0,42 %      3 449 143            0,68 %

                              295              31 634 213 770                 503 998 829
                                          0%
                                    6%
                              9%
                                                                                            Gouvernement
                        10%                                  42%
                                                                                            Géographique
                                                                                            Inter-domaine
                      13%                                                                   Sciences de la vie
                                                                                            Publications

                                    20%                                                     Media
                                                                                            Contenu utilisateur




                                                                                                                                                30
05/10/2012




                                                                    DNS celui qui contrôle le nom
                                                                                                       *



                                                                                                      .fr
                                                                        de domaine contrôle le
principes                                                               déréférencement.
   utiliser le format RDF
   utiliser des URI pour nommer                                        ex. bit.ly & Lybie            .inria
   utiliser des URI HTTP (URL) pour que l’on puisse les suivre
   lorsqu’un URI est suivi donner des informations (HTML, RDF)
   inclure dans ces informations des liens vers d’autres données

                                                                                                      isicil




                                                                    le cas de la France
                                                                    mouvement d'ouverture
                                                                    des données mais…
                                                                    •   redondance des identifiants
                                                                    •   hétérogénéité des formats
                                                                    •   diversité des vocabulaires
                                                                    •   hétérogénéité des accès

                                          (June 2012)




publication
processus                              démo
                                       • installation en un
                                         click
                                       • import de données
                                         trouvées en ligne
                                       • transformation en
                                         RDF
                                       • publication sur le
                                         web
                                       • interrogation directe




                                                                                                                      31
05/10/2012




                                                                                                                                                                          par union
RDFS pour définir les classes de                                                                                                                                           la disjonction
           ressources, leurs propriétés,           OWL in one…                                                                                                            par intersection
           et organiser leur hiérarchie                                     prop. algébriques                                                                              par complément
                                                                                                                                                                  !                    par restriction
Document                  créateur                                                                                                                            1..1
                                                                                         par cardinalité
                                                             prop. disjointes           par équivalence
                          auteur                                                   par énumération
                                                           ! cardinalité qualifiée
 Rapport       Document              Personne         1..1                          [>18] restrict. valeur
                                                             négation prop. indiv  union disjointe
                                                                 prop. chainées           clefs
                                                                                                                                                                                                          …




                                                         

                                                                         
                                                       alignements et liage
                                                       ontologies et entités nommées
                                                       • « Ontology Alignment
                                                           Evaluation Initiative »

                                                       • reconnaissance d’entités nommées

                                                       • liage de ressources




                                                OKKAM et owl:sameAs 1




                                                “The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query:
                                                where does John teach and what? One will make the following query on the merge of the two datasets:
                                                < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y
                                                Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John
                                                teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at
                                                UNI1 and philosophy of language at UNI2.”
                                                                                           (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web
                                                                                           Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo)




                                                                                                                                                                                                                32
05/10/2012




OKKAM et owl:sameAs 2     « when owl:sameAs is not the same »
                          (H. Halpin, I. Herman, P. Hayes)

                        des représentations de ressources jugées identiques
                        peuvent néanmoins diverger.
                        ex. : si ma ressource est l’élément sodium…
                        • OpenCyc : un élément est l’ensemble de
                          tous les fragments de cet élément à l’état pur
                        • DBpedia : inclut en outre les isotopes de sodium
                          (nombre de neutrons différent)
                         deux vue sur la même chose ou deux objets
                            différents ?




                          chaine GATE : exemple en biologie…




                                                             thesaurus,
                                                             classifications,
                                                             sujets, taxinomies,
                                                             folksonomies, ...
                                                             vocabulaires
                                                             contrôlés




                                                                                        33
05/10/2012




                                                                                           relations
expression naturelle pour
dénoter un concept
                                      labels                                               entre concepts
                                                       inria:CorporateSemanticWeb
inria:CorporateSemanticWeb                               skos:broader w3c:SemanticWeb;
  skos:prefLabel "corporate semantic web"@en;            skos:narrower inria:CorporateSemanticWiki;
  skos:prefLabel "web sémantique d'entreprise"@fr;       skos:related inria:KnowledgeManagement.
  skos:altLabel "corporate SW"@en;
  skos:altLabel "CSW"@en;
  skos:hiddenLabel "web semantique d'entreprise"@fr.




                                                                          beaucoup de données
                                                                                      dans beaucoup de pages


inria:CorporateSemanticWeb
 skos:scopeNote "only within KM community";
 skos:definition "a semantic web on an intranet";
 skos:example "Nokia's internal use of RDF gateway";
 skos:historyNote "semantic intranet until 2006";
 skos:editorialNote "keep wikipedia def. uptodate";
 skos:changeNote "acronym added by fabien".




                                                       Triplets produits :
                       schéma
                                                        •   cellules d’une ligne  sujet commun
                                                        •   noms des colonnes  prédicats
                                                        •   une cellule  un objet
                                                        •   liens entre tables
                       mapping
                                                             nom     prenom age        #s1 :nom "filar"
                                                             filar    alain   34       #s1 :prenom "alain"
                    R2RML                                   seger    thomas   45
                                                                                       #s1 :age "34"
                                                                                       #s2 :nom "seger"
                    une transformation standard
                                                                                       #s2 :prenom "thomas"
                    d’une base relationnelle en RDF                                    #s2 :age "45"
                                                                                       #s3 …




                                                                                                                34
05/10/2012




                                                                                                                                                                                                                                              :P_Table rdf:type rr:TriplesMap ;
                                                                                                                                                       (1) transformation                                                                       rr:subjectMap [
                                                                                                                                                                                                                                                  rr:termtype "BlankNode" ;
exemple de mapping                                                                                                                                                                                                                                rr:column "ID" ;
                                                                                                                                                                                                                                                ] ;

                                                                                                                                                        table personnes                                                                         rr:predicateObjectMap [
                                                                                                                                                                                                                                                  rr:predicateMap [
                                                                                                                                                                                                                                                    rr:predicate a:name
                                                                                                                                                                                                                                                  ];
                                                                                                                                                                                                                                                  rr:objectMap [
               ISBN            Author           Title                Year                                                                                         ISBN           Author           Title                Year                         rr:column "Name"
                                                                                                                                                                                                                                                  ]
 0006511409X                   id_xyz   The Glass Palace      2000                                                                                  0006511409X                  id_xyz   The Glass Palace      2000
                                                                                                                                                                                                                                                ] ;
                                                                                                                                                                                                                                                rr:predicateObjectMap [
                                                                                                                                                                                                                                                  rr:predicateMap [
          ID                  Name                      Homepage                                                                                             ID                 Name                      Homepage                                  rr:predicate a:homepage
 id_xyz                Ghosh, Amitav       http://www.amitavghosh.com                                                                               id_xyz               Ghosh, Amitav       http://www.amitavghosh.com                           ];
                                                                                                                                                                                                                                                  rr:objectMap [
                                                                                                                                                                                                                                                    rr:column "Homepage" ;
                                                                                                                                                                                                                                                    rr:termtype "IRI"
                                                                                                                                                                                                                                                  ]
                                                                                                                                                                                                                                                ] ;


                                                                        The Glass Palace                                                                                                                                  The Glass Palace
                                                                                                                    http://…isbn/000651409X                                                                                                                           http://…isbn/000651409X
                                                                             2000                                                                                                                                              2000




                                                                                                                                  a:author                                                                                                                                          a:author




                                                                                                           a:name                                                                                                                                            a:name
                                                                                                                                  a:homepage                                                                                                                                        a:homepage


                                                                                           Ghosh, Amitav      http://www.amitavghosh.com                                                                                                     Ghosh, Amitav      http://www.amitavghosh.com




I. Herman, W3C                                                                                                                                     I. Herman, W3C




    (2) transformation
                                                                                                                                                       (3) lier les tables
        table livres
               ISBN            Author           Title                Year                                                                                         ISBN           Author           Title                Year
 0006511409X                   id_xyz   The Glass Palace      2000                                                                                  0006511409X                  id_xyz   The Glass Palace      2000



          ID                  Name                      Homepage                                                                                             ID                 Name                      Homepage
 id_xyz                Ghosh, Amitav       http://www.amitavghosh.com                                                                               id_xyz               Ghosh, Amitav       http://www.amitavghosh.com




:B_Table rdf:type rr:TriplesMap ;                                       The Glass Palace                                                                                                                                  The Glass Palace
                                                                                                                    http://…isbn/000651409X                                                                                                                           http://…isbn/000651409X
  rr:subjectMap [
    rr:template "http://...isbn/{ISBN}";                                     2000                                                                                                                                              2000
  ];
  rr:predicateObjectMap [                                                                                                                           :B_Table a rr:TriplesMap ;
    rr:predicateMap [                                                                                                                                 ...
      rr:predicate a:title
    ];
                                                                                                                                  a:author            rr:refPredicateObjectMap [                                                                                                    a:author
    rr:objectMap [                                                                                                                                      rr:refPredicateMap [
      rr:column "Title"                                                                                                                                   rr:predicate a:author
    ]                                                                                                                                                   ];
  ] ;                                                                                                      a:name                                                                                                                                            a:name
  rr:predicateObjectMap [                                                                                                         a:homepage            rr:refObjectMap [                                                                                                           a:homepage
    rr:predicateMap [                                                                                                                                     rr:parentTriplesMap :P_Table ;
      rr:predicate a:year                                                                  Ghosh, Amitav      http://www.amitavghosh.com                  rr:joinCondition                                                                   Ghosh, Amitav      http://www.amitavghosh.com
    ];
    rr:objectMap [                                                                                                                                          "{child}.Author = {parent}.ID"
      rr:column "Year" ;                                                                                                                                  ]
    ]                                                                                                                                                   ]
  ] ;                                                                                                                                                 ].
                                                                                                                                  I. Herman, W3C                                                                                                                                    I. Herman, W3C




                RDFa signifie
                RDF dans des attributs de HTML
                 <div xmlns:dc="http://purl.org/dc/elements/1.1/">
                      <h2 property="dc:title">The trouble with Bob</h2>
                      <h3 property="dc:creator">Alice</h3>
                      ...
                 </div>




                                                                                                                                                                                                                                                                                                       35
05/10/2012




provenance, confiance, explication,                      protéger les enfants
                                                         en insérant des étiquettes
    Oh,yeah?
                                                         émises par des autorités
“At the toolbar (menu,                                   dans les pages
 whatever) associated with a
 document there is a button
 marked "Oh, yeah?". You
 press it when you loses that
 feeling of trust. It says to
 the Web, "so how do I know
 I can trust this                              <meta http-equiv="pics-label" content='(PICS-1.1
 information?". The software                   "http://www.icra.org/ratingsv02.html" labels
 then goes directly or                         for "http://mm.256.com/"
 indirectly back to                            generic true
 metainformation about the                     ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1)
 document, which suggests a                    "http://www.rsac.org/ratingsv01.html" labels
 number of reasons.”                           for "http://mm.256.com/"
Tim Berners-Lee, Consistent User               generic true
Interface, W3C Design Issues, 1997             ratings (n 0 s 0 v 0 l 4) )' />




                                          :DBpedia a void:Dataset;
VoID: décrire des sources de données       void:sparqlEndpoint <http://dbpedia.org/sparql>;
                                           void:feature :RDFXML ;
schéma pour annoter des jeux de données    void:subset :DBpedia2Geonames ;
:DBpedia a void:Dataset .                  void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ;
                                           dcterms:modified "2008-11-17"^^xsd:date;
et des jeux de liens                       dcterms:title "DBPedia";
:DBpedia_Geonames a void:Linkset .         dcterms:description "RDF data extracted from Wikipedia";
                                           dcterms:publisher :DBpedia_community;
                                           dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>;
                                           dcterms:source <http://dbpedia.org/resource/Wikipedia>.

                                          :Geonames a void:Dataset;
                                           void:sparqlEndpoint <http://geosparql.appspot.com/query>;
                                           void:triples "107983838"^^xsd:integer ;
                                           dcterms:subject <http://dbpedia.org/resource/Location> .

                                          :DBpedia2Geonames a void:Linkset ;
                                             void:linkPredicate owl:sameAs ;
                                             void:target :DBpedia ;
                                             void:target :Geonames .                       ex. DBpedia dataset




                                                                                                                                              36
05/10/2012




                                                          PROV-DM & PROV-O OWL2 ontology
provenance & traçabilité                                  décrire les entités et activités impliquées dans la
 [Provenance WG]                                          production, livraison, etc. d’un objet




                                                                                                                 ++

                                                          ex1:aggregated    prov:used              ex1:dataSet2, ex1:regionList2 .
                                                          ex1:aggregate2    prov:wasGeneratedBy    ex1:aggregated .
                                                          ex1:illustrated   prov:used              ex1:aggregate2 .
                                                          ex1:chart2        prov:wasGeneratedBy    ex1:illustrated .
                                                          ex1:aggregated    prov:wasControlledBy   ex1:derek .
                                                          ex1:dataSet2      prov:wasRevisionOf     ex1:dataSet1 .




                                              plusieurs
                                            ressources
                                                          grouping mechanisms...


                                                                       ... list URIs
                                                                      ... domain names, paths
                                                                       ... regular expressions on URIs

                   listes
                   domaines, chemins
 description       expressions régulières
authentifiée




exemple de description POWDER
« toute ressource dont l’URI commence par
http://www-sop.inria.fr/fr/ concerne le centre
de recherche de l’INRIA géographiquement situé
à Sophia Antipolis et est en français »
certifié par inria.fr

                                                                       préjugés, fausses idées




                                                                                                                                       37
05/10/2012




                                                   éviter de construire une
                                                   boite noire




   rendre les conceptualisations   à base d’ontologie
   explicites                      ne signifie pas que l’on
                                   a besoin d’un moteur
                                   d’inférence.




ma montre n'a qu'une aiguille
mais elle n'est pas cassée.
de l'intérêt d'un à peu près…




                                                                                     38
05/10/2012




sens et position
d’une taxonomie à une vue

                                    0°        a=120°             360°




         r         a




                                   “semantic     web”                    66 FOAF primitives
                                                                                                             x 52 millions
                                                                                                                             3 475 908 348 references (2)


                                        and not

                                “semantic web”
 [C. Welty, ISWC 2007]



                               “a lightweight ontology
                                allows us to do
                                lightweight reasoning”
                                                                        “a small tree ruling a big graph”(1)
                                                                        (1) Franck Van Harmelen, ISWC 2011
  [J. Hendler, ISWC 2007]                                               (2) Libby Miller, 2009




                                                                           je n’ai jamais vu une ontologie
                                                                           universelle

                            le piège du domaine
                            le domaine d’application n’est pas
                            forcément celui de l’ontologie




                                                                                                                                                            39
05/10/2012




Trouble dans la classification
(F. Rastier)


                                                               la vache folle
                                                               ou l’ontologue végétarien

                                                               s:MadCow rdfs:subClassOf s:Cow




         cycle
          vie
                                                                               brique de construction
                                                                                     vs.
                                                                                           modèle changeant
                            conception




             besoin         évolution              diffusion


                                         gestion

                  évaluer           utilisation




tri sélectif sémantique
le web est une poubelle,
le web sémantique sera une poubelle sémantique.
                                                               et pour nous                       ?
                                                                                                              40
05/10/2012




hyper-documentaire                                         donnez des URL aux contenus
de l’article scientifique à l’hyper-article multi-public
                                                           une URL est un nom, sans URL pas de nom,
                                                           sans nom je ne peux pas en parler
                                                           • référence
                                                           • granularité
                                                           • vues
plus vieille facette, mais encore sous exploitée




                                                           forme / fond, structure, sémantique
                                                                    <XML/>
                                                           • jeux de données scientifiques
   nouvelles formes de rédaction…                            entrées et sorties
   •   systématiquement enrichir de liens
                                                           • des schémas de données
   •   identifier des cibles internes et externes            développer http://ns.inria.fr
   •   identifier les persona de notre public              • Ex en biologie: HCLS IG
   •   permettre des parcours multimédias idoines          • SPARQL: recherche de liens, motifs et chaines
                                                           • référentiels métiers et domaines
   « produire une hyper-ressource, c’est hyper long…         nos termes, nos définitions, nos thésaurus, ...
     c’est même jamais vraiment fini. »                      ex. SHOINQ < ALC < Logique de Description < Langage Logique




   utilités ? scénarios ?                                  le web comme écriture collective
   • reproductibilité et comparatifs
   • permettre d’autres expérimentations / algo
                                                           • ouverture en écriture... collective
   • ex. OAEI:
                                                              – ne plus centraliser la rédaction: distribuer, aider, …
       – Visibilité et citation
                                                              – « utilisacteur »: nos lecteurs peuvent aider à
       – Alignement de domaines,
                                                                vulgariser, reformuler, enrichir
         sources, résultats, etc.
                                                           • ouverture en écriture collective ...
   • journalisme de données
                                                              – ne plus centraliser la rédaction: animer, solliciter
   • génération de liens,
                                                              – participer à d’autres sites: ex. wikipedia (édition, ref.)
     restructuration, ranking




                                                                                                                             41
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource

Mais conteúdo relacionado

Semelhante a L'avenir du web au prisme de la ressource

États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantiqueIvan Herman
 
Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1Vlad Posea
 
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesMéthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesDesconnets Jean-Christophe
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data AsterismsGregoire Burel
 
Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étagesSemWebPro
 
ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES
 
Introduction à l'exploration du Web
Introduction à l'exploration du WebIntroduction à l'exploration du Web
Introduction à l'exploration du WebSébastien
 
2011 02-07-html5-security-v1
2011 02-07-html5-security-v12011 02-07-html5-security-v1
2011 02-07-html5-security-v1Sébastien GIORIA
 
Node.js et les nouvelles technologies javascript
Node.js et les nouvelles technologies javascriptNode.js et les nouvelles technologies javascript
Node.js et les nouvelles technologies javascriptKhalid Jebbari
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystèmeKhanh Maudoux
 
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDOmeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDJulien Sicot
 
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015Logilab
 
03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantiquebadirh
 
Utilité du Web 2.0 - Congrès des milieux documentaires 2011
Utilité du Web 2.0 - Congrès des milieux documentaires 2011Utilité du Web 2.0 - Congrès des milieux documentaires 2011
Utilité du Web 2.0 - Congrès des milieux documentaires 2011Sophie Roy
 
Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Antidot
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
 
Petit dejeuner-evolix-150410
Petit dejeuner-evolix-150410Petit dejeuner-evolix-150410
Petit dejeuner-evolix-150410evolix
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesnonue12
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sensFabien Gandon
 

Semelhante a L'avenir du web au prisme de la ressource (20)

États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
 
Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1
 
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesMéthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
 
Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étages
 
ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)
 
Introduction à l'exploration du Web
Introduction à l'exploration du WebIntroduction à l'exploration du Web
Introduction à l'exploration du Web
 
2011 02-07-html5-security-v1
2011 02-07-html5-security-v12011 02-07-html5-security-v1
2011 02-07-html5-security-v1
 
Node.js et les nouvelles technologies javascript
Node.js et les nouvelles technologies javascriptNode.js et les nouvelles technologies javascript
Node.js et les nouvelles technologies javascript
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
 
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDOmeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
 
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
 
03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantique
 
Utilité du Web 2.0 - Congrès des milieux documentaires 2011
Utilité du Web 2.0 - Congrès des milieux documentaires 2011Utilité du Web 2.0 - Congrès des milieux documentaires 2011
Utilité du Web 2.0 - Congrès des milieux documentaires 2011
 
Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 
Petit dejeuner-evolix-150410
Petit dejeuner-evolix-150410Petit dejeuner-evolix-150410
Petit dejeuner-evolix-150410
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 

L'avenir du web au prisme de la ressource

  • 1. 05/10/2012 cinq objectifs l’avenir du web • présenter (un web de ressources computationnelles) au prisme de la ressource • résumer, rappeler Nicolas Delaforge, Fabien Gandon et Alexandre Monnin (web de données, web sémantique) • discuter, provoquer (le document n’existe pas) • orienter (et pour nous alors) • conclure, ouvrir (ce n’est que le début) trois composants de l’architecture du web • identification (URI) & adressage (URL) http://www.inria.fr http://ns.inria.fr/fabien.gandon#me architecture web ldap://[2001:db8::7]/c=GB?objectClass?one • communication / protocole (HTTP) GET /centre/sophia HTTP/1.1 Host: www.inria.fr User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de) AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4 Safari/523.10 Accept-Encoding: gzip Accept: text/html,application/xhtml+xml,application/xml Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3 Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7 Referer: http://fabien.info/ • langage de représentation (HTML / RDF) Fabien travaille chez <a href="http://www.inria.fr">Inria</a> <http://www.inria.fr> foaf:member data:fabien  pas pour les gens… et pourtant… la syntaxe des URIS qui et quand ?  URI: identification de n’importe qu’elle ressource  URL=URI + Localisation URL=UR(I+L)  HTTP URI: URI déréférençable selon HTTP « follow your nose » / naviguer au flair UR* (wikipedia) 1
  • 2. 05/10/2012 URI aux jointures 7 application web documentaire « REST in peace » • entre les assertions • REST(ful): invocation et composition d’applications même si elles sont distribuées 6 présentation distribuées sur le web • entre les couches réseau 5 session • primitives HTTP, actions sur la ressource (Internet, Web, Web sémantique) GET, HEAD, POST, OPTIONS, 4 transport CONNECT, TRACE, PUT, DELETE • le web ne fut jamais vraiment documentaire 3 réseau 2 données • web… 1 physique – application centrée ressources (identifiées par URI) – architecture orientée ressource (localisables URL) – toile de calculs liés et non de documents trois composants de l’architecture du web • identification de la ressource (URI) • accès à une représentation (HTTP URI) ressource • codage de la représentation (HTML , RDF, etc) HTTP Range 14 uri, ressource, ombre, objet • identification • individuation/ ils n’en ont pas parlé ils en ont parlé Code HTTP Résultat Indication Ressource informationnelle (IR) et objectivation 200 (OK) Représentation non informationnelle (NIR) ? zèbre (à défaut d’antilope ) 303 (voir Tout type de ressource notamment URI autre) des NIR 4XX, 5XX Message Aucune déduction possible (erreur) d’erreur « ce n’est peut-être pas le problème de HTTP ou des URI » 2
  • 3. 05/10/2012 Généalogie : du document (B.B.) à la ressource • tout ce que l’on sait identifier ressource Ressource : • pierre angulaire de l’architecture de tout le web Manipulation indirecte • concept unificateur de ses facettes HTTP URI requête HTTP «…» « ressource » erreur HTTP locus représentation Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée ressources computationnelles rappel et parallèle • sans notice pas d’existence dans la collection  l’objet règles • sans ressource pas d’existence sur le web  la ressource «…»  l’état de la ressource  l’état représentationnel ou une représentation de la ressource toile de calculs 3
  • 4. 05/10/2012 1991-1993 System 33: un prédécesseur méconnu du conneg + services de rendu conneg client http serveur Servicing Client Application RPC Rendering Electronic Other encoding Computers service documents  formats Psychophysically equivalents appearences database moteur et CGI personnalisation, adaptation « Filter Bubble » Eli Pariser Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris 6200, Windows 7, Anglais 4
  • 5. 05/10/2012 Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London (10.6.8), french Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7 OS: MacOs X 10.6.8, Firefox Professional, English il cherche « bmw », « mahler » et « gay » ?=! BMW « Je m’intéresse aux BMW » 5
  • 6. 05/10/2012 Allo Google ? C’est la Noiraude… United States Flu Activity - Influenza estimate ● Google Flu Trends ● U.S. Centers for Disease Control. « document sur lui-même » document vivant, chaque consultation change le document Chine: 1 600 millions Inde: 1 200 millions acebook 900 millions PORTÉE 6
  • 7. 05/10/2012 externaliser la socialité d’un site OGP v2 intérêt et danger actions typées <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US" xmlns:fb="https://www.facebook.com/2008/fbml"> <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE: http://ogp.me/ns/apps/YOUR_NAMESPACE#"> <meta property="fb:app_id" content="YOUR_APP_ID" /> <meta property="og:type" content="YOUR_NAMESPACE:recipe" /> <meta property="og:title" content="Stuffed Cookies" /> <meta property="og:image" content="http://example.com/cookie.jpg" /> <meta property="og:description" content="The Turducken of Cookies" /> <meta property="og:url" content="http://example.com/cookie.html"> <script type="text/javascript"> function postCook() { FB.api('/me/YOUR_NAMESPACE:cook' + '?recipe=http://example.com/cookie.html','post', (…) }); } </script> </head> <body> (…) <form> <input type="button" value="Cook" onclick="postCook()" /> </form> </body> OGP schémas… </html> code dans votre page Face… it 7
  • 8. 05/10/2012 changing interface… crowdsourcing crawling & indexing affiliation social sub-networks analyse réseaux sociaux web 2.0 & dynamique une représentation est modifiée par un commentaire contenu essentiel, lié à une ressource spécifique (un article) © FriendViz © Obama’s network, Recorded Future vs contenu accessoire, lié à une règle non-essentielle (un commentaire) © Egyptian Revolution on Twitter, A. Panisson, Gephi © Facebook une ressource change : une question suppression définitive devient une réponse parfois… ?! ni ressource, ni représentation 8
  • 9. 05/10/2012 gérér sa bibliographie : Zotero et Coins extraction de données « page » donnant l’analyse du texte d’une autre « page » made in web auteurs? journal confusion des genres? 9
  • 10. 05/10/2012 permanence/ non permanence raccourcisseur d’URL et re-captcha… des jeux utiles au crowdsourcing le web comme une plateforme d’externalisation distribuée de masse. temps facebook 16.2 millions secondes/seconde x 16 203 703 253 Fold It le web comme une machine universelle de moteurs à pulsions (méta)-données l’utilisateur utilisé application web 10
  • 11. 05/10/2012 jeu HTML5 Mario Kart en HTML5 (ouf !) … jouer dans le navigateur : le cloud download upload drag & drop © HTML5Rocks speech input geolocation html & js html & svg WebGL © HTML5Rocks © HTML5Rocks 11
  • 12. 05/10/2012 HTML pages of specifications inputs, text, email, number, phone ©HTML5Rocks HTML 1 39 pages 963 pages Ligne de Temps • description sémantique de ressources multimedia [Media Annotation] • adressage d’éléments internes aux ressources [Media Fragment] annotations des éléments multimédia ontologies des ressources multimédias fragment multimédia ontology for Media Resources 1.0 • partie fragment de l’URL = après le # <video.ogv> a ma:MediaResource ; http://www.example.com/example.ogv#track=audio&t=10,20 ma:hasTrack <video.ogv#track=audio>, <video.ogv#track=subtitle>; • dimensions: ma:hasSubtitling <video.ogv#track=subtitle> ; ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> . – temporelle: t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z <video.ogv#track=audio> a ma:AudioTrack ; – spatiale: ma:hasLanguage [ rdfs:label "en-GB" ] ; xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50 ma:hasFragment <video.ogv#track=audio&t=10,20> . – track: <video.ogv#track=audio&t=10,20> a ma:MediaFragment ; track=1 / track=video&track=subtitle / track=Wide ma:hasLanguage [ rdfs:label "fr" ] . – nommée: <video.ogv#track=subtitle> a ma:DataTrack ; id=chapter-1 ma:hasLanguage [ rdfs:label "es" ] . • fragment non transmis par le navigateur: <video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ; encodage dans la requête HTTP ma:hasLanguage [ rdfs:label "bfi" ] . 12
  • 13. 05/10/2012 une interface programmatique universelle design & affordance ceci est un ovetto application serveur application ? HTTP HTTP HTTP navigateur affordance sémantique SAWSDL of WSDL (W3C Rec. 2007) semantic annotation SAWSDL… services annotés et recherchés sémantiquement annuaire 2 1 3 demandeur client service fournisseur 13
  • 14. 05/10/2012 sortie entrée pre-populating… workflows scientifiques • composer des données et traitements distribués • échanger et comparer les traitements et leurs compositions name assistant’s phone phone phone  name name employee assistant SSRSSLSSS  SSLSSLSSS semonde au lier Le bug de l’an… 2020 ( inspiration Gérard Berry) 14
  • 15. 05/10/2012 1 sec. battement de cœur 1/2 sec. double click 24 images/sec. film « Aliénation et accélération. » 500 000 décisions / sec. algorithmes boursiers Hartmut Rosa DNS, TCP/IP, Web http://mon.org/ma/ressource DNS, TCP/IP, Web GET http://mon.org/ma/ressource  règles négociation  règles négociation calculs calculs composition composition rendu rendu … … … … … … … … … … … … … … … … 30 min… 15
  • 16. 05/10/2012 le livre n’est pas recréé à chaque page 5 jours… Stéphane Crozat: « le document numérique n'existe pas, ce qui existe ce sont des constructions numériques dont le traitement calculatoire simule un ordre documentaire. » nouveaux engagements, contrats • contrats de lecture + computationnel Le juridique aussi souffre • contrats d’identification + computationnel de l’héritage documentaire • contrats d’accès + computationnel des données • contrats de publication + computationnel • contrats de stockage + computationnel • etc. « il n’y a plus de documents, le besoin de documentariser n’en n’est que plus fort. » 16
  • 17. 05/10/2012 le web entre nous et le monde • documents & données augmentent nos perceptions • services & applications augmentent nos actions • incontournable &… ingérable? tant à venir réalité augmentée par le web & augmentation du web par le réel google glass project • vers une réalité augmentée par le web • diversité des ressources web augmentée par diversité des ressources de notre réalité • « documentarisation non documentaire » de la réalité par le web • modèle documentaire rendu minoritaire / modèle calculatoire • limite de la métaphore de la bibliothèque • une toile de ressources informatiques chaque utilisateur est un détecteur une toile de données multiples entre différents barreaux de l’échelle des sphères web de « consommacteurs » mobiles, « crawlers » « small data & big data » du web & du monde physique ex. Wikimapia, OpenStreetMap , etc. © Medialab Prado © GeoSensor Image,T. Berners-Lee, RuleML kickoff, 2005 17
  • 18. 05/10/2012 web…devices [Web of Devices] … Web Phone … Web TV … Web Radio … Web Car … Web Tablet … Web eBook … Web Watch … Web GPS … cintre Facebook chez C&A Brésil nouvelles topologies du web ex. « near field communication » 18
  • 19. 05/10/2012 Open Street Map dans le métro navigateur web = interface universelle ex. domotique Web 2.0 & Web Physique 19
  • 20. 05/10/2012 fabien Janet Echelman, “Her Secret is Patience”, Civic Space Park, Phoenix, AZ, USA, 2009 RFID&URI ex. Live Social Semantics plusieurs évolutions concourantes l’effet diligence Jacques Perriault • explosion multimédia et multi-modalité • toile de ressources computationnelles liées • ressources comme locus de calcul • assimilation de tous les objets à des ressources web liens d’association [Vannevar Bush, 1945] du mémex entre les informations qui nous importent (méta) web 20
  • 21. 05/10/2012 http://www. hypertexte, hypermédia [Ted Nelson, 1965] liens utilisant des références une structure de fichier pour l’information complexe, changeante et indéterminée à travers le réseau [Tim Berners-Lee, 1989] hypertexte et document sur le Web : de la nécessité de les reconstruire par assemblages Hypertexte : Google Le Web à la base n’est pas un hypertexte : il ne relie pas des documents. mais il peut le devenir ou accueillir Document : Scenari des documents car c’est aussi une plateforme ouverte… … vers un web structuré séparer forme et contenu 21
  • 22. 05/10/2012 2008 XML a eu dix ans <balise>…</balise> XML bien formé structurer construction des données <racine>...</racine> modulaire <x>...</x> ou <x/> en utilisant une famille de <a><b></a></b> des balises langages <x> <X> dans un format un format ouvert <1an> <xmla> <bla bla> textuel non propriétaire <a b='c'></a> ou <a b='c'/> XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html Scalable Vector eXtensible Access Control Graphics (SVG) Markup Language (XACML) WSDL namespace OpenOffice • espaces de nommage Schemas • éviter les collision de noms MusicML • associer un préfixe de balise à un URI • exemple XML Topic <ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note> Maps (XTM) <bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note> GPS Exchange Financial • définitions héritées dans l’arbre XML format (GPX) products Markup Chemical Markup • namespace par défaut xmlns="…" Synchronized Language (CML) XHTML Language (FpML) Multimedia Integration NewsML Language (SMIL) MathML de langages famille “Jacob Lorhard's "Ogdoas Scholastica" (1606) contains the first occurrence of the term Ontologie ontologie -> ‘ontologia’ ” Raul Corazzon on formalontology.it ontos logos être / êtres discours / science 22
  • 23. 05/10/2012 votre réponse est basée sur une sous ontologie partagée type Document je peux comprendre Book vous pouvez raisonner Novel Short story sous type "document" #12 #12 #21  #12 #21  #12 "book" #21 #21 "livre" #47  #21 #48  #21 #47  #21 #48  #21 #47 #48 #47 #48 "novel" "short story" "roman" "nouvelle" connaissance ontologique formalisée la connaissance ontologie taxinomique n’est pas un synonyme de est une connaissance ontologique taxinomie parmi d’autres 23
  • 24. 05/10/2012 partie combiner différents types de connaissances ontologiques de Organic object Individual Limb méthane éthane méthanol éthanol Cat dioxyde de carbone dioxygène ozone phénol eau dihydrogène méthyle carbone oxygène hydrogène Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294). couverture dans quelle mesure les primitives mobilisées par les scénarios sont couvertes par l’ontologie spécificité dans quelle mesure les primitives sont précisément déclarées dans l’ontologie exemple granularité [Charlet - RFIA 2002] granularité 1. Patient-Masculin Patient-Féminin dans quelle mesure les primitives 2. [Patient]  (chrc)  [Masculin] [Patient]  (chrc)  [Féminin] sont détaillées 3. [Patient]  (attr)  [Sexe]  (val)  [Masculin] [Patient]  (attr)  [Sexe]  (val)  [Féminin] 24
  • 25. 05/10/2012 méthodes ex. rigidité dans Onto Clean [Guarino & Welty] Rigid +R  is a necessary property for all its instances Anti-Rigid ~R  is an optional property for all its instances formalité Constraint: ~R can't subsume y+R dans quelle mesure les Person is y+R, Student is ~R primitives sont décrites dans un langage formel structurer une “folksonomie” combinaison espaces métriques web 2.0 folksonomies plates thesaurus distances d’édition Monge-Elkan Soundex, JaroWinkler, polluant énergie asymétrie Monge-Elkan Qgram related related ? pollution has narrower métrique contextuelle cosinus vecteur de cooccurrences de tags pollution des sols métriques sociales SKOS inclusion de communautés d’intérêt 25
  • 26. 05/10/2012 ex. ademe TheseNet recherches & retours 83 027 relations / 9 037 tags  68 633 related  11 254 hyponyms  3 193 spelling variants ex. propagation sémantique ex. Ademe 1 pollution ; 2 développent durable ; 3 énergie ; 4 chimie ; 5 pollution de l’air ; 6 métaux ; 7 biomasse ; 8 déchets. from RAK/LP to SemTagP rugby, foot hockey sel, eau sport sport condiment poivre, vin condiment foot, ciné moutarde sport condiment langages de formalisation d’ontologies (define-class humain (?humain) :def (animal ?humain)) exemple subsomption dans les frames 26
  • 27. 05/10/2012 (defprimconcept MALE) (defprimconcept FEMELLE) [Concept: Directeur]->(Def)-> [LambdaExpression: (disjoint MALE FEMELLE) [Personne: ]->(Dirige)->[Groupe]] exemple exemple classes disjointes en logiques de description classe définie en graphes conceptuels le web originel liens typés… vers un web sémantique web sémantique mentionné par Tim BL en 1994 à WWW RDF toute connaissance est décomposée en , triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud ) [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/] 27
  • 28. 05/10/2012 ex : doc.html a pour auteur Fabien doc.html a pour auteur Fabien et a pour thème la Musique doc.html a pour thème Musique Fabien <RDF/> une syntaxe XML pour mieux échanger ces graphes auteur doc.html thème Musique <rdf:RDF nœuds anonymes (blank nodes) xmlns:rdf="http://www.w3.org/1999/02/22- quantification existentielle rdf-syntax-ns#" il existe une ressource telle que… {  r ; …} xmlns:inria="http://inria.fr/schema#" > <rdf:Description rdf:about="http://bu.ch/123.html "> <auteur> <rdf:Description> <rdf:Description <nom>Trichard</nom> <prenom>Laurent</prenom> rdf:about="http://inria.fr/rr/doc.html"> </rdf:Description>  x ; auteur(http://bu.ch/123.html,x) <inria:author rdf:resource= </auteur> nom(x,"Trichard") <titre>Les zélés faons roses</titre> "http://inria.fr/~fabien#me" /> </rdf:Description> prenom(x,"Laurent") <inria:theme>Music</inria:theme> auteur </rdf:Description> http://bu.ch/l23.html titre prenom nom </rdf:RDF> "Les zélés faons roses" "Laurent" "Trichard" 28
  • 29. 05/10/2012 exemple personne ayant au moins 18 ans PREFIX ex: <http://inria.fr/schema#> SELECT ?person ?name interroger avec SPARQL WHERE { SPARQL Protocol and RDF ?person rdf:type ex:Person ?person ex:name ?name . Query Language ?person ex:age ?age . FILTER (?age > 17) } May 2007 April 2008 September 2008 March 2009 Linking Open Data 400 web de données 300 200 100 0 première vague de déploiement 10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012 du web sémantique (RDF, SPARQL) September 2011 September 2010 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ e.g. DBpedia 29
  • 30. 05/10/2012 CORESE/ KGRAM contenus et thématiques Domaines Nombre de jeux de données Triplets % Liens sortants % data.ratatouille.com Media 25 1 841 852 061 5,82 % 50 440 705 10,01 % Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 % Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 % Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 % Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 % Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 % Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 % 295 31 634 213 770 503 998 829 0% 6% 9% Gouvernement 10% 42% Géographique Inter-domaine 13% Sciences de la vie Publications 20% Media Contenu utilisateur 30
  • 31. 05/10/2012 DNS celui qui contrôle le nom * .fr de domaine contrôle le principes déréférencement.  utiliser le format RDF  utiliser des URI pour nommer ex. bit.ly & Lybie .inria  utiliser des URI HTTP (URL) pour que l’on puisse les suivre  lorsqu’un URI est suivi donner des informations (HTML, RDF)  inclure dans ces informations des liens vers d’autres données isicil le cas de la France mouvement d'ouverture des données mais… • redondance des identifiants • hétérogénéité des formats • diversité des vocabulaires • hétérogénéité des accès (June 2012) publication processus démo • installation en un click • import de données trouvées en ligne • transformation en RDF • publication sur le web • interrogation directe 31
  • 32. 05/10/2012 par union RDFS pour définir les classes de  la disjonction ressources, leurs propriétés, OWL in one… par intersection et organiser leur hiérarchie prop. algébriques par complément ! par restriction Document créateur 1..1 par cardinalité prop. disjointes  par équivalence auteur par énumération ! cardinalité qualifiée Rapport Document Personne 1..1 [>18] restrict. valeur négation prop. indiv  union disjointe prop. chainées clefs …   alignements et liage ontologies et entités nommées • « Ontology Alignment Evaluation Initiative » • reconnaissance d’entités nommées • liage de ressources OKKAM et owl:sameAs 1 “The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query: where does John teach and what? One will make the following query on the merge of the two datasets: < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at UNI1 and philosophy of language at UNI2.” (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo) 32
  • 33. 05/10/2012 OKKAM et owl:sameAs 2 « when owl:sameAs is not the same » (H. Halpin, I. Herman, P. Hayes) des représentations de ressources jugées identiques peuvent néanmoins diverger. ex. : si ma ressource est l’élément sodium… • OpenCyc : un élément est l’ensemble de tous les fragments de cet élément à l’état pur • DBpedia : inclut en outre les isotopes de sodium (nombre de neutrons différent)  deux vue sur la même chose ou deux objets différents ? chaine GATE : exemple en biologie… thesaurus, classifications, sujets, taxinomies, folksonomies, ... vocabulaires contrôlés 33
  • 34. 05/10/2012 relations expression naturelle pour dénoter un concept labels entre concepts inria:CorporateSemanticWeb inria:CorporateSemanticWeb skos:broader w3c:SemanticWeb; skos:prefLabel "corporate semantic web"@en; skos:narrower inria:CorporateSemanticWiki; skos:prefLabel "web sémantique d'entreprise"@fr; skos:related inria:KnowledgeManagement. skos:altLabel "corporate SW"@en; skos:altLabel "CSW"@en; skos:hiddenLabel "web semantique d'entreprise"@fr. beaucoup de données dans beaucoup de pages inria:CorporateSemanticWeb skos:scopeNote "only within KM community"; skos:definition "a semantic web on an intranet"; skos:example "Nokia's internal use of RDF gateway"; skos:historyNote "semantic intranet until 2006"; skos:editorialNote "keep wikipedia def. uptodate"; skos:changeNote "acronym added by fabien". Triplets produits : schéma • cellules d’une ligne  sujet commun • noms des colonnes  prédicats • une cellule  un objet • liens entre tables mapping nom prenom age #s1 :nom "filar" filar alain 34 #s1 :prenom "alain" R2RML seger thomas 45 #s1 :age "34" #s2 :nom "seger" une transformation standard #s2 :prenom "thomas" d’une base relationnelle en RDF #s2 :age "45" #s3 … 34
  • 35. 05/10/2012 :P_Table rdf:type rr:TriplesMap ; (1) transformation rr:subjectMap [ rr:termtype "BlankNode" ; exemple de mapping rr:column "ID" ; ] ; table personnes rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:name ]; rr:objectMap [ ISBN Author Title Year ISBN Author Title Year rr:column "Name" ] 0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000 ] ; rr:predicateObjectMap [ rr:predicateMap [ ID Name Homepage ID Name Homepage rr:predicate a:homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com ]; rr:objectMap [ rr:column "Homepage" ; rr:termtype "IRI" ] ] ; The Glass Palace The Glass Palace http://…isbn/000651409X http://…isbn/000651409X 2000 2000 a:author a:author a:name a:name a:homepage a:homepage Ghosh, Amitav http://www.amitavghosh.com Ghosh, Amitav http://www.amitavghosh.com I. Herman, W3C I. Herman, W3C (2) transformation (3) lier les tables table livres ISBN Author Title Year ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com :B_Table rdf:type rr:TriplesMap ; The Glass Palace The Glass Palace http://…isbn/000651409X http://…isbn/000651409X rr:subjectMap [ rr:template "http://...isbn/{ISBN}"; 2000 2000 ]; rr:predicateObjectMap [ :B_Table a rr:TriplesMap ; rr:predicateMap [ ... rr:predicate a:title ]; a:author rr:refPredicateObjectMap [ a:author rr:objectMap [ rr:refPredicateMap [ rr:column "Title" rr:predicate a:author ] ]; ] ; a:name a:name rr:predicateObjectMap [ a:homepage rr:refObjectMap [ a:homepage rr:predicateMap [ rr:parentTriplesMap :P_Table ; rr:predicate a:year Ghosh, Amitav http://www.amitavghosh.com rr:joinCondition Ghosh, Amitav http://www.amitavghosh.com ]; rr:objectMap [ "{child}.Author = {parent}.ID" rr:column "Year" ; ] ] ] ] ; ]. I. Herman, W3C I. Herman, W3C RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/"> <h2 property="dc:title">The trouble with Bob</h2> <h3 property="dc:creator">Alice</h3> ... </div> 35
  • 36. 05/10/2012 provenance, confiance, explication, protéger les enfants en insérant des étiquettes Oh,yeah? émises par des autorités “At the toolbar (menu, dans les pages whatever) associated with a document there is a button marked "Oh, yeah?". You press it when you loses that feeling of trust. It says to the Web, "so how do I know I can trust this <meta http-equiv="pics-label" content='(PICS-1.1 information?". The software "http://www.icra.org/ratingsv02.html" labels then goes directly or for "http://mm.256.com/" indirectly back to generic true metainformation about the ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1) document, which suggests a "http://www.rsac.org/ratingsv01.html" labels number of reasons.” for "http://mm.256.com/" Tim Berners-Lee, Consistent User generic true Interface, W3C Design Issues, 1997 ratings (n 0 s 0 v 0 l 4) )' /> :DBpedia a void:Dataset; VoID: décrire des sources de données void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; schéma pour annoter des jeux de données void:subset :DBpedia2Geonames ; :DBpedia a void:Dataset . void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; et des jeux de liens dcterms:title "DBPedia"; :DBpedia_Geonames a void:Linkset . dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>. :Geonames a void:Dataset; void:sparqlEndpoint <http://geosparql.appspot.com/query>; void:triples "107983838"^^xsd:integer ; dcterms:subject <http://dbpedia.org/resource/Location> . :DBpedia2Geonames a void:Linkset ; void:linkPredicate owl:sameAs ; void:target :DBpedia ; void:target :Geonames . ex. DBpedia dataset 36
  • 37. 05/10/2012 PROV-DM & PROV-O OWL2 ontology provenance & traçabilité décrire les entités et activités impliquées dans la [Provenance WG] production, livraison, etc. d’un objet ++ ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 . ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated . ex1:illustrated prov:used ex1:aggregate2 . ex1:chart2 prov:wasGeneratedBy ex1:illustrated . ex1:aggregated prov:wasControlledBy ex1:derek . ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 . plusieurs ressources grouping mechanisms... ... list URIs ... domain names, paths ... regular expressions on URIs listes domaines, chemins description expressions régulières authentifiée exemple de description POWDER « toute ressource dont l’URI commence par http://www-sop.inria.fr/fr/ concerne le centre de recherche de l’INRIA géographiquement situé à Sophia Antipolis et est en français » certifié par inria.fr préjugés, fausses idées 37
  • 38. 05/10/2012 éviter de construire une boite noire rendre les conceptualisations à base d’ontologie explicites ne signifie pas que l’on a besoin d’un moteur d’inférence. ma montre n'a qu'une aiguille mais elle n'est pas cassée. de l'intérêt d'un à peu près… 38
  • 39. 05/10/2012 sens et position d’une taxonomie à une vue 0° a=120° 360° r a “semantic web” 66 FOAF primitives x 52 millions 3 475 908 348 references (2) and not “semantic web” [C. Welty, ISWC 2007] “a lightweight ontology allows us to do lightweight reasoning” “a small tree ruling a big graph”(1) (1) Franck Van Harmelen, ISWC 2011 [J. Hendler, ISWC 2007] (2) Libby Miller, 2009 je n’ai jamais vu une ontologie universelle le piège du domaine le domaine d’application n’est pas forcément celui de l’ontologie 39
  • 40. 05/10/2012 Trouble dans la classification (F. Rastier) la vache folle ou l’ontologue végétarien s:MadCow rdfs:subClassOf s:Cow cycle vie brique de construction vs. modèle changeant conception besoin évolution diffusion gestion évaluer utilisation tri sélectif sémantique le web est une poubelle, le web sémantique sera une poubelle sémantique. et pour nous ? 40
  • 41. 05/10/2012 hyper-documentaire donnez des URL aux contenus de l’article scientifique à l’hyper-article multi-public une URL est un nom, sans URL pas de nom, sans nom je ne peux pas en parler • référence • granularité • vues plus vieille facette, mais encore sous exploitée forme / fond, structure, sémantique <XML/> • jeux de données scientifiques nouvelles formes de rédaction… entrées et sorties • systématiquement enrichir de liens • des schémas de données • identifier des cibles internes et externes développer http://ns.inria.fr • identifier les persona de notre public • Ex en biologie: HCLS IG • permettre des parcours multimédias idoines • SPARQL: recherche de liens, motifs et chaines • référentiels métiers et domaines « produire une hyper-ressource, c’est hyper long… nos termes, nos définitions, nos thésaurus, ... c’est même jamais vraiment fini. » ex. SHOINQ < ALC < Logique de Description < Langage Logique utilités ? scénarios ? le web comme écriture collective • reproductibilité et comparatifs • permettre d’autres expérimentations / algo • ouverture en écriture... collective • ex. OAEI: – ne plus centraliser la rédaction: distribuer, aider, … – Visibilité et citation – « utilisacteur »: nos lecteurs peuvent aider à – Alignement de domaines, vulgariser, reformuler, enrichir sources, résultats, etc. • ouverture en écriture collective ... • journalisme de données – ne plus centraliser la rédaction: animer, solliciter • génération de liens, – participer à d’autres sites: ex. wikipedia (édition, ref.) restructuration, ranking 41