Presentation a la matinee Donnees Ouverte LIRMM - Montpellier - 28/11/2013
Presentation at the Open Data workshop LIRMM
http://odrg.lirmm.fr/index.php/event-details?id=14
Recentrer l'intelligence artificielle sur les connaissancesMathieu d'Aquin
Mais conteúdo relacionado
Semelhante a De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles
Vers une littératie des Communs : un parcours professionnel et universitaire Hélène MULOT
Semelhante a De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles (20)
De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles
1. De l'intelligence dans les données ouvertes
Problèmes et solutions dans les domaines
l’enseignement et de la gestion des données personnelles
Mathieu d’Aquin (@mdaquin)
Knowledge Media Institute,
The Open University, UK
2. Intelligence artificielle fouille
de données, raisonnement,
gestion des connaissances
Pas importe lesquelles,
On préfère les données web
De l'intelligence dans les données ouvertes
Problèmes et solutions dans les domaines
l’enseignement et de la gestion des données personnelles
Données web ouvertes comme solutions
au problèmes (nouveaux et anciens)
Mathieu d’Aquin (@mdaquin)
Knowledge Media Institute,
The Open University, UK
Ca, c’est moi
Parce que l’ouverture du web et des
données génère de nouveaux problèmes
Un endroit intéressant
4. coursera
eX
d
Maintenant…
(Et on simplifie toujours)
UDACITY
MIT
OCW
MOOCs
et OER
OpenLearn
Primaire
Secondaire
Autre institutions avec des cours en ligne
Open Universities
Universities
5. “I want to be a photographer,
what should I do?”
Siri, I want to
become a
professional
photographer.
What should I do?
I found this Open University
course (T189), that you can
enrolled to in the regional centre
2 miles from here (cost £427).
“OK, anything free I can try
first?”
There is an Introduction to
Photography course on MIT
OCW, and a Computational
Photography course on coursera
starting soon.
6. Besoin de données ouvertes, partagées et
intégrées de toutes ces sources (linked data…)
eX
d
learning
outcomes assessment
UDACITY
MIT
courses
results topics
locations courses
requirements
OCW
topics
OpenLearn
results
locations
learning
topics
outcomes courses
results
topics
requirements
learning
outcomes
coursera
http://linkedup-project.eu
http://linkeduniversities.org
7. Exemple: L’Open University
L’Open University:
– La plus grosse université du
royaume uni: 250K étudiants par
an, 8000 enseignants, un gros
campus a Milton Keynes
– Crée en 1969
– Presque entièrement fondée sur
l’enseignement a distance
– 13 centre régionaux, plus les
centres nationaux
– Cours disponibles dans plusieurs
dizaines de pays
Partager, transmettre, connecter
l’information (publique!): un
calvaire
9. Plein de (catégories) de données
Course information:
580 modules/ description of the course, information about the levels and number of
credits associated with it, topics, and conditions of enrolment.
Research publications:
16,000 academic articles / information about authors, dates, abstract and venue of the
publication.
Podcasts:
2220 video podcasts and 1500 audio podcats / short description, topics, link to a
representative image and to a transscript if available, information about the course the
podcast might relate to and license information regarding the content of the podcast.
Open Educational Resources:
640 OpenLearn Units / short description, topics, tags used to annotate the resource,
its language, the course it might relate to, and the license that applies to the content.
Youtube videos:
900 videos / short description of the video, tags that were used to annotate the video,
collection it might be part of and link to the related course if relevant.
University buildings:
100 buildings / address, a picture of the building and the sub-divisions of the building
into floors and spaces.
Library catalogue:
12,000 books/ topics, authors, publisher and ISBN, as well as the course related.
Others…
10. Mais que faire? (applications)
Social
Découverte
de ressources
Recherche
Exploration
13. Pourquoi les données ouvertes/pourquoi en linked data.
Exemple en dehors de l’Open University
“Unistats, which incorporates the KIS, provides course level information
on all undergraduate higher education courses provided in the UK,
which are of at least one year’s duration and consist of 120 or more
credits of study” [1]
« Données ouvertes » incluant des statistiques sur les taux de réussite
aux diplômes universitaires dans les différents institutions anglaises, sur
la poursuite d’étude et le recrutement des étudiants.
[1]
http://www.hesa.ac.uk/includes/C13061_resources/Unistats_checkdoc_d
efinitions.pdf?v=1.12
14. Le genre de chose que
l’ont peut faire avec
ces données.
16. … pour construire cette application
Il faut accepter les
termes et conditions
(click), télécharger le
fichier zip,
décompresser, mettre
le xml dans ca propre
DB, et finalement,
construire l’appli.
Fournir les données
en linked data avec
SPARQL c’est faire
tout ca une fois, pour
tout le monde.
http://data.linkededucation.org/linkedup
/catalog/browse/
17. 90 lignes de HTML/Javascript,
écrites en 2-3 heures
Avec cette requête SPARQL
select distinct ?course ?label ?link ?perc where {
?o <http://purl.org/linked-data/cube#dataSet>
<http://data.linkedu.eu/kis/dataset/commonJobs>.
?o <http://data.linkedu.eu/kis/ontology/job>
<http://data.linkedu.eu/kis/job/354>.
?o <http://data.linkedu.eu/kis/ontology/course>
?course.
?course <http://purl.org/dc/terms/title> ?label.
?course
<http://data.linkedu.eu/kis/ontology/courseUrl>
?link.
?o
<http://data.linkedu.eu/kis/ontology/percentage>
?perc.
filter ( ?perc > 0 )
} order by desc(?perc)
18. Pourquoi les données ouvertes/pourquoi en linked data.
Exemple entre l’Open University et la BBC
19.
20. Resources URIs +
common topics
Interface
SimilarityBased Search
BBC Programme or iPlayer page
Resource
descriptions
Indexes
Synopsis
Named Entity
Recognition
Semantic Entities
(Dbpedia)
Podcasts, OpenLearn
Units and Articles
data.open.ac.uk
Semantic
Indexing
Indexes
Semantic Index
d'Aquin, M., Allocca, C. and Collins, T. (2012) DiscOU: A Flexible Discovery Engine for Open
Educational Resources Using Semantic Indexing and Relationship Summaries, Demo ISWC 2012
23. Et encore, avec du matériel de cours
propriétaire (ouvert + fermé)
24. Amener plus d’intelligence
Learning Analytics avec des connaissances du domaine
Web logs or
application
logs
Web logs or
application
logs
Web logs or
application
logs
Generic
Ontology of
events,
resources
and actions
Domain
specific
extension
ontology (=
background
knowledge)
Analytics
with
domain
specific
filters,
views and
reasoning
26. Amener plus d’intelligence
Learning Analytics avec de la fouille de données (ouvertes/web)
d'Aquin, M. and Jay, N. (2013) Interpreting Data Mining Results with Linked Data for Learning
Analytics: Motivation, Case Study and Direction, LAK 2013
27. Un autre exemple:
Données publiques/privées/personnelles, besoin de pus de données,
besoin de connaissances
Classification des
régions du royaume
uni en accord avec les
sujets d’intérêts
d’après l’inscription
aux cours des
étudiants de l’Open
University
Comment expliquer
ces groupes?
Solution actuellement explorée : La programmation logique inductive combinée
avec le parcours du linked open data graph
Tiddi, I., d'Aquin, M. and Motta, E.Explaining Clusters with Inductive Logic Programming
and Linked Data, Poster at ISWC 2013,
28. De l’analyse intelligente de données ouvertes a la
gestion de l’information personnelle
L’information personnelle a
une place particulière
Rarement données ouverte
Utiliser pour améliorer les
processus de l’organisation
Rarement disponible pour
les utilisateurs
Et si les données personnelles
était ouvertes au utilisateurs
qui les génèrent
30. Exemple: UCIAD
personal analytics
dashboard
Tableaux de bord de mes
(étudiants, enseignants,
etc.) activités sur les sites
de l’Open University
Implication pour la
gestion des données
privées
Implication pour
l’intégration de
données
d'Aquin, Elahi, Motta.
Semantic technologies to
support the user-centric
analysis of activity data.
SDoW 2011 at ISWC 2011
Thomas and d'Aquin. On
the privacy implications of
releasing consumer
activity data. KMi Tech.
Report kmi-13-02, 2013.
http://uciad.info
31. Des situations de plus en plus complexes qui nécessitent des
raisonnements de plus en plus complexes
34. Example epistemic rules
Ka Post(X) :- author(X, a)
Ka Post(X) :- scope(X, All_Friends), author(X, Y), friend(Y, a)
Ka Post(X) :- includes(X,Y), friend(Y, a)
Ka wasIn(P, Y) :- includes(X,Y), in(X,P), Ka Post(X)
Ka wasWith (Y,Z) :- includes(X, Y), include(X,Z), Ka Post(X)
37. Conclusion
Un retour au web
sémantique?
Besoin en traitement
intelligent de l’information
de plus en plus présent
Réconcilier les approches
“raw data” avec la
modélisation, l’extraction
et le manipulation de la
connaissance.
41. Un peu d’intelligence
Trust in
websites
Sensitivity
of data
d'Aquin, Elahi, Motta. Semantic monitoring of personal web activity to support the management of trust and
privacy. SPOT 2010 at ESWC 2010