SlideShare uma empresa Scribd logo
1 de 41
Baixar para ler offline
De l'intelligence dans les données ouvertes
Problèmes et solutions dans les domaines
l’enseignement et de la gestion des données personnelles

Mathieu d’Aquin (@mdaquin)
Knowledge Media Institute,
The Open University, UK
Intelligence artificielle fouille
de données, raisonnement,
gestion des connaissances

Pas importe lesquelles,
On préfère les données web

De l'intelligence dans les données ouvertes
Problèmes et solutions dans les domaines
l’enseignement et de la gestion des données personnelles
Données web ouvertes comme solutions
au problèmes (nouveaux et anciens)

Mathieu d’Aquin (@mdaquin)
Knowledge Media Institute,
The Open University, UK
Ca, c’est moi

Parce que l’ouverture du web et des
données génère de nouveaux problèmes

Un endroit intéressant
Pourquoi l’enseignement?
L’éducation, avant
(en simplifiant beaucoup)

Secondaire

Primaire

Université
coursera

eX
d

Maintenant…
(Et on simplifie toujours)

UDACITY
MIT
OCW

MOOCs
et OER

OpenLearn

Primaire

Secondaire
Autre institutions avec des cours en ligne
Open Universities

Universities
“I want to be a photographer,
what should I do?”

Siri, I want to
become a
professional
photographer.
What should I do?

I found this Open University
course (T189), that you can
enrolled to in the regional centre
2 miles from here (cost £427).
“OK, anything free I can try
first?”

There is an Introduction to
Photography course on MIT
OCW, and a Computational
Photography course on coursera
starting soon.
Besoin de données ouvertes, partagées et
intégrées de toutes ces sources (linked data…)

eX
d

learning
outcomes assessment

UDACITY
MIT

courses

results topics

locations courses

requirements

OCW

topics

OpenLearn

results
locations
learning
topics
outcomes courses

results
topics
requirements
learning
outcomes

coursera
http://linkedup-project.eu
http://linkeduniversities.org
Exemple: L’Open University
L’Open University:
– La plus grosse université du
royaume uni: 250K étudiants par
an, 8000 enseignants, un gros
campus a Milton Keynes
– Crée en 1969
– Presque entièrement fondée sur
l’enseignement a distance
– 13 centre régionaux, plus les
centres nationaux
– Cours disponibles dans plusieurs
dizaines de pays

Partager, transmettre, connecter
l’information (publique!): un
calvaire
data.open.ac.uk
La première plateforme linked data provenant de
et utilisée par l’ensemble d’une université
Plein de (catégories) de données
Course information:
580 modules/ description of the course, information about the levels and number of
credits associated with it, topics, and conditions of enrolment.

Research publications:
16,000 academic articles / information about authors, dates, abstract and venue of the
publication.

Podcasts:
2220 video podcasts and 1500 audio podcats / short description, topics, link to a
representative image and to a transscript if available, information about the course the
podcast might relate to and license information regarding the content of the podcast.

Open Educational Resources:
640 OpenLearn Units / short description, topics, tags used to annotate the resource,
its language, the course it might relate to, and the license that applies to the content.

Youtube videos:
900 videos / short description of the video, tags that were used to annotate the video,
collection it might be part of and link to the related course if relevant.

University buildings:
100 buildings / address, a picture of the building and the sub-divisions of the building
into floors and spaces.

Library catalogue:
12,000 books/ topics, authors, publisher and ISBN, as well as the course related.

Others…
Mais que faire? (applications)

Social
Découverte
de ressources

Recherche
Exploration
Exemple (super simple)

Carte interactive des
bâtiments de l’Open
University en
Angleterre
data.open.ac.uk
bat1

name

“Berrill building”

Milton
Keynes

bat1address

inDistrict
inCounty
Postcodemk76aa
Buckingh
amshire

Espaces
location

Etages
Bâtiments
ID

Address

Code
postal

Mk76aalocation
lat
52.024924

long
-0.709726

data.ordnancesurvey.co.uk
Pourquoi les données ouvertes/pourquoi en linked data.

Exemple en dehors de l’Open University
“Unistats, which incorporates the KIS, provides course level information
on all undergraduate higher education courses provided in the UK,
which are of at least one year’s duration and consist of 120 or more
credits of study” [1]
« Données ouvertes » incluant des statistiques sur les taux de réussite
aux diplômes universitaires dans les différents institutions anglaises, sur
la poursuite d’étude et le recrutement des étudiants.
[1]
http://www.hesa.ac.uk/includes/C13061_resources/Unistats_checkdoc_d
efinitions.pdf?v=1.12
Le genre de chose que
l’ont peut faire avec
ces données.
Mais…
… pour construire cette application
Il faut accepter les
termes et conditions
(click), télécharger le
fichier zip,
décompresser, mettre
le xml dans ca propre
DB, et finalement,
construire l’appli.
Fournir les données
en linked data avec
SPARQL c’est faire
tout ca une fois, pour
tout le monde.
http://data.linkededucation.org/linkedup
/catalog/browse/
90 lignes de HTML/Javascript,
écrites en 2-3 heures

Avec cette requête SPARQL
select distinct ?course ?label ?link ?perc where {
?o <http://purl.org/linked-data/cube#dataSet>
<http://data.linkedu.eu/kis/dataset/commonJobs>.
?o <http://data.linkedu.eu/kis/ontology/job>
<http://data.linkedu.eu/kis/job/354>.
?o <http://data.linkedu.eu/kis/ontology/course>
?course.
?course <http://purl.org/dc/terms/title> ?label.
?course
<http://data.linkedu.eu/kis/ontology/courseUrl>
?link.
?o
<http://data.linkedu.eu/kis/ontology/percentage>
?perc.
filter ( ?perc > 0 )
} order by desc(?perc)
Pourquoi les données ouvertes/pourquoi en linked data.

Exemple entre l’Open University et la BBC
Resources URIs +
common topics

Interface

SimilarityBased Search

BBC Programme or iPlayer page
Resource
descriptions

Indexes

Synopsis
Named Entity
Recognition

Semantic Entities
(Dbpedia)

Podcasts, OpenLearn
Units and Articles
data.open.ac.uk

Semantic
Indexing
Indexes

Semantic Index

d'Aquin, M., Allocca, C. and Collins, T. (2012) DiscOU: A Flexible Discovery Engine for Open
Educational Resources Using Semantic Indexing and Relationship Summaries, Demo ISWC 2012
API/Service

Named Entity
Recognition

Programme
URI

Similarity
Search

Indexing

Scored sem.
Entities & Prg
URI

Prg. URI
Resource
URIS

Common Topic
Extraction

Prg. URI &
Res. URI
Common Sem. Entity

Scored
semantic
entities

Injected with bookmarklet
Interface
(Javascript)
La même chose, avec juste du texte
(discou.info/alfa)
Et encore, avec du matériel de cours
propriétaire (ouvert + fermé)
Amener plus d’intelligence
Learning Analytics avec des connaissances du domaine

Web logs or
application
logs

Web logs or
application
logs

Web logs or
application
logs

Generic
Ontology of
events,
resources
and actions

Domain
specific
extension
ontology (=
background
knowledge)

Analytics
with
domain
specific
filters,
views and
reasoning
Moodle analytics a la NHS
Amener plus d’intelligence
Learning Analytics avec de la fouille de données (ouvertes/web)

d'Aquin, M. and Jay, N. (2013) Interpreting Data Mining Results with Linked Data for Learning
Analytics: Motivation, Case Study and Direction, LAK 2013
Un autre exemple:
Données publiques/privées/personnelles, besoin de pus de données,
besoin de connaissances
Classification des
régions du royaume
uni en accord avec les
sujets d’intérêts
d’après l’inscription
aux cours des
étudiants de l’Open
University
Comment expliquer
ces groupes?

Solution actuellement explorée : La programmation logique inductive combinée
avec le parcours du linked open data graph
Tiddi, I., d'Aquin, M. and Motta, E.Explaining Clusters with Inductive Logic Programming
and Linked Data, Poster at ISWC 2013,
De l’analyse intelligente de données ouvertes a la
gestion de l’information personnelle
L’information personnelle a
une place particulière
Rarement données ouverte
Utiliser pour améliorer les
processus de l’organisation
Rarement disponible pour
les utilisateurs

Et si les données personnelles
était ouvertes au utilisateurs
qui les génèrent
Exemple:
MOLUTI Personal Analytics in the browser

http://moluti.com
Exemple: UCIAD
personal analytics
dashboard
Tableaux de bord de mes
(étudiants, enseignants,
etc.) activités sur les sites
de l’Open University
 Implication pour la
gestion des données
privées
 Implication pour
l’intégration de
données

d'Aquin, Elahi, Motta.
Semantic technologies to
support the user-centric
analysis of activity data.
SDoW 2011 at ISWC 2011
Thomas and d'Aquin. On
the privacy implications of
releasing consumer
activity data. KMi Tech.
Report kmi-13-02, 2013.
http://uciad.info
Des situations de plus en plus complexes qui nécessitent des
raisonnements de plus en plus complexes
Facebook
graph API

Facebook
Ontology

Basic
linked data

Epistemic
logic theory
of Facebook
Ontological
inference
(types,
relations)
Epistemic
inference
(who knows
what)
Facebook Ontology (extract)
Place

Agent
author

subclass
likes

Person

in

Post

includes

subclass

Video

App
author

Photo

on

Comment
scope

Status
update

{Everyone, Friends_of_Friends, All_Friends, Custom}
Example epistemic rules
Ka Post(X) :- author(X, a)
Ka Post(X) :- scope(X, All_Friends), author(X, Y), friend(Y, a)
Ka Post(X) :- includes(X,Y), friend(Y, a)
Ka wasIn(P, Y) :- includes(X,Y), in(X,P), Ka Post(X)
Ka wasWith (Y,Z) :- includes(X, Y), include(X,Z), Ka Post(X)
d'Aquin, Thomas. Modeling and reasoning upon facebook privacy settings. Demo at ISWC 2013
http://youtu.be/iFocaRtLdQg
Conclusion
Un retour au web
sémantique?
Besoin en traitement
intelligent de l’information
de plus en plus présent
Réconcilier les approches
“raw data” avec la
modélisation, l’extraction
et le manipulation de la
connaissance.
Check out:
Linkeduniversities.org

data.linkededucation.org/
linkedup/devtalk

semprivacy.com

linkedup-challenge.org

Linkedup-project.eu

mksmart.org
data.linkededucation.org
/linkedup/catalog
Un peu d’intégration

Ref privon
Datami

http://datami.co.uk
Un peu d’intelligence

Trust in
websites

Sensitivity
of data

d'Aquin, Elahi, Motta. Semantic monitoring of personal web activity to support the management of trust and
privacy. SPOT 2010 at ESWC 2010

Mais conteúdo relacionado

Semelhante a De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Plates formes CLOM - importance des normes ouvertes et du logiciel libre
Plates formes CLOM - importance des normes ouvertes et du logiciel librePlates formes CLOM - importance des normes ouvertes et du logiciel libre
Plates formes CLOM - importance des normes ouvertes et du logiciel libreClaude Coulombe
 
Des ressources éducatives libres aux MOOC : Défis et orientations
Des ressources éducatives libres aux MOOC : Défis et orientationsDes ressources éducatives libres aux MOOC : Défis et orientations
Des ressources éducatives libres aux MOOC : Défis et orientationsGilbert Paquette
 
CIAN-David_Compte_Rendu_PP
CIAN-David_Compte_Rendu_PPCIAN-David_Compte_Rendu_PP
CIAN-David_Compte_Rendu_PPDavid Cian
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
 
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaJean-Robert Bisaillon
 
ENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard PuimattoENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard PuimattoDocumentation Rouen
 
Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...Mathieu d'Aquin
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicAlexandre Monnin
 
Dépôt numérique et valorisation recherche lmd
Dépôt numérique et valorisation recherche lmdDépôt numérique et valorisation recherche lmd
Dépôt numérique et valorisation recherche lmdAdou Jean Constant ATTA
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataBorderCloud
 
TICE : normativité, interopérabilité et pratiques convergentes
TICE : normativité, interopérabilité et pratiques convergentesTICE : normativité, interopérabilité et pratiques convergentes
TICE : normativité, interopérabilité et pratiques convergentesMokhtar Ben Henda
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...Thierry Chanier
 
Travaux pratiques de l'activité réseaux et communautés
Travaux pratiques de l'activité réseaux et communautésTravaux pratiques de l'activité réseaux et communautés
Travaux pratiques de l'activité réseaux et communautésrichard peirano
 
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...Adou Jean Constant ATTA
 
Présentation Sebastien Chabrier Batier Christophe #ADNEpf
Présentation Sebastien Chabrier Batier Christophe #ADNEpfPrésentation Sebastien Chabrier Batier Christophe #ADNEpf
Présentation Sebastien Chabrier Batier Christophe #ADNEpfChristophe Batier
 
MyToutatice.Cloud
MyToutatice.Cloud MyToutatice.Cloud
MyToutatice.Cloud Olivier Adam
 
Retour d'Educause et visite de quelques universités américaines. Quelques imp...
Retour d'Educause et visite de quelques universités américaines. Quelques imp...Retour d'Educause et visite de quelques universités américaines. Quelques imp...
Retour d'Educause et visite de quelques universités américaines. Quelques imp...UPMC - Sorbonne Universities
 
Contenu d'un nouveau cours sur les Technologies sémantiques
Contenu d'un nouveau cours sur les Technologies sémantiquesContenu d'un nouveau cours sur les Technologies sémantiques
Contenu d'un nouveau cours sur les Technologies sémantiquesGilbert Paquette
 
Vers une littératie des Communs : un parcours professionnel et universitaire
Vers une littératie des Communs : un parcours professionnel et universitaire    Vers une littératie des Communs : un parcours professionnel et universitaire
Vers une littératie des Communs : un parcours professionnel et universitaire Hélène MULOT
 

Semelhante a De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles (20)

Plates formes CLOM - importance des normes ouvertes et du logiciel libre
Plates formes CLOM - importance des normes ouvertes et du logiciel librePlates formes CLOM - importance des normes ouvertes et du logiciel libre
Plates formes CLOM - importance des normes ouvertes et du logiciel libre
 
Des ressources éducatives libres aux MOOC : Défis et orientations
Des ressources éducatives libres aux MOOC : Défis et orientationsDes ressources éducatives libres aux MOOC : Défis et orientations
Des ressources éducatives libres aux MOOC : Défis et orientations
 
CIAN-David_Compte_Rendu_PP
CIAN-David_Compte_Rendu_PPCIAN-David_Compte_Rendu_PP
CIAN-David_Compte_Rendu_PP
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
 
ENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard PuimattoENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard Puimatto
 
Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...Architectures ouvertes, distribuées et intelligentes de partage d’information...
Architectures ouvertes, distribuées et intelligentes de partage d’information...
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du public
 
Dépôt numérique et valorisation recherche lmd
Dépôt numérique et valorisation recherche lmdDépôt numérique et valorisation recherche lmd
Dépôt numérique et valorisation recherche lmd
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
TICE : normativité, interopérabilité et pratiques convergentes
TICE : normativité, interopérabilité et pratiques convergentesTICE : normativité, interopérabilité et pratiques convergentes
TICE : normativité, interopérabilité et pratiques convergentes
 
OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...OpenData : au-delà des publications, le partage des données de la recherche e...
OpenData : au-delà des publications, le partage des données de la recherche e...
 
Travaux pratiques de l'activité réseaux et communautés
Travaux pratiques de l'activité réseaux et communautésTravaux pratiques de l'activité réseaux et communautés
Travaux pratiques de l'activité réseaux et communautés
 
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
Contribution des Archives Ouvertes dans les grandes réformes de l'Enseignemen...
 
Présentation Sebastien Chabrier Batier Christophe #ADNEpf
Présentation Sebastien Chabrier Batier Christophe #ADNEpfPrésentation Sebastien Chabrier Batier Christophe #ADNEpf
Présentation Sebastien Chabrier Batier Christophe #ADNEpf
 
MyToutatice.Cloud
MyToutatice.Cloud MyToutatice.Cloud
MyToutatice.Cloud
 
Présentation de l'Urfist
Présentation de l'UrfistPrésentation de l'Urfist
Présentation de l'Urfist
 
Retour d'Educause et visite de quelques universités américaines. Quelques imp...
Retour d'Educause et visite de quelques universités américaines. Quelques imp...Retour d'Educause et visite de quelques universités américaines. Quelques imp...
Retour d'Educause et visite de quelques universités américaines. Quelques imp...
 
Contenu d'un nouveau cours sur les Technologies sémantiques
Contenu d'un nouveau cours sur les Technologies sémantiquesContenu d'un nouveau cours sur les Technologies sémantiques
Contenu d'un nouveau cours sur les Technologies sémantiques
 
Vers une littératie des Communs : un parcours professionnel et universitaire
Vers une littératie des Communs : un parcours professionnel et universitaire    Vers une littératie des Communs : un parcours professionnel et universitaire
Vers une littératie des Communs : un parcours professionnel et universitaire
 

Mais de Mathieu d'Aquin

A factorial study of neural network learning from differences for regression
A factorial study of neural network learning from  differences for regressionA factorial study of neural network learning from  differences for regression
A factorial study of neural network learning from differences for regressionMathieu d'Aquin
 
Recentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissancesRecentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissancesMathieu d'Aquin
 
Data and Knowledge as Commodities
Data and Knowledge as CommoditiesData and Knowledge as Commodities
Data and Knowledge as CommoditiesMathieu d'Aquin
 
Unsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scoresUnsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scoresMathieu d'Aquin
 
Is knowledge engineering still relevant?
Is knowledge engineering still relevant?Is knowledge engineering still relevant?
Is knowledge engineering still relevant?Mathieu d'Aquin
 
A data view of the data science process
A data view of the data science processA data view of the data science process
A data view of the data science processMathieu d'Aquin
 
Dealing with Open Domain Data
Dealing with Open Domain DataDealing with Open Domain Data
Dealing with Open Domain DataMathieu d'Aquin
 
Web Analytics for Everyday Learning
Web Analytics for  Everyday LearningWeb Analytics for  Everyday Learning
Web Analytics for Everyday LearningMathieu d'Aquin
 
Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)
Presentation a in ovive   montpellier - 26%2 f06%2f2018 (1)Presentation a in ovive   montpellier - 26%2 f06%2f2018 (1)
Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)Mathieu d'Aquin
 
Learning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learnerLearning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learnerMathieu d'Aquin
 
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...Mathieu d'Aquin
 
Data for Learning and Learning with Data
Data for Learning and Learning with DataData for Learning and Learning with Data
Data for Learning and Learning with DataMathieu d'Aquin
 
Towards an “Ethics in Design” methodology for AI research projects
Towards an “Ethics in Design” methodology  for AI research projects Towards an “Ethics in Design” methodology  for AI research projects
Towards an “Ethics in Design” methodology for AI research projects Mathieu d'Aquin
 
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...Mathieu d'Aquin
 
Profiling information sources and services for discovery
Profiling information sources and services for discoveryProfiling information sources and services for discovery
Profiling information sources and services for discoveryMathieu d'Aquin
 
From Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent SystemsFrom Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent SystemsMathieu d'Aquin
 
Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0Mathieu d'Aquin
 
Données ouvertes et traces numériques
Données ouvertes et traces numériquesDonnées ouvertes et traces numériques
Données ouvertes et traces numériquesMathieu d'Aquin
 

Mais de Mathieu d'Aquin (20)

A factorial study of neural network learning from differences for regression
A factorial study of neural network learning from  differences for regressionA factorial study of neural network learning from  differences for regression
A factorial study of neural network learning from differences for regression
 
Recentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissancesRecentrer l'intelligence artificielle sur les connaissances
Recentrer l'intelligence artificielle sur les connaissances
 
Data and Knowledge as Commodities
Data and Knowledge as CommoditiesData and Knowledge as Commodities
Data and Knowledge as Commodities
 
Unsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scoresUnsupervised learning approach for identifying sub-genres in music scores
Unsupervised learning approach for identifying sub-genres in music scores
 
Is knowledge engineering still relevant?
Is knowledge engineering still relevant?Is knowledge engineering still relevant?
Is knowledge engineering still relevant?
 
A data view of the data science process
A data view of the data science processA data view of the data science process
A data view of the data science process
 
Dealing with Open Domain Data
Dealing with Open Domain DataDealing with Open Domain Data
Dealing with Open Domain Data
 
Web Analytics for Everyday Learning
Web Analytics for  Everyday LearningWeb Analytics for  Everyday Learning
Web Analytics for Everyday Learning
 
Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)
Presentation a in ovive   montpellier - 26%2 f06%2f2018 (1)Presentation a in ovive   montpellier - 26%2 f06%2f2018 (1)
Presentation a in ovive montpellier - 26%2 f06%2f2018 (1)
 
Learning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learnerLearning Analytics: understand learning and support the learner
Learning Analytics: understand learning and support the learner
 
The AFEL Project
The AFEL ProjectThe AFEL Project
The AFEL Project
 
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
Assessing the Readability of Policy Documents: The Case of Terms of Use of On...
 
Data ethics
Data ethicsData ethics
Data ethics
 
Data for Learning and Learning with Data
Data for Learning and Learning with DataData for Learning and Learning with Data
Data for Learning and Learning with Data
 
Towards an “Ethics in Design” methodology for AI research projects
Towards an “Ethics in Design” methodology  for AI research projects Towards an “Ethics in Design” methodology  for AI research projects
Towards an “Ethics in Design” methodology for AI research projects
 
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
AFEL: Towards Measuring Online Activities Contributions to Self-Directed Lear...
 
Profiling information sources and services for discovery
Profiling information sources and services for discoveryProfiling information sources and services for discovery
Profiling information sources and services for discovery
 
From Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent SystemsFrom Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
From Knowledge Bases to Knowledge Infrastructures for Intelligent Systems
 
Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0Data analytics beyond data processing and how it affects Industry 4.0
Data analytics beyond data processing and how it affects Industry 4.0
 
Données ouvertes et traces numériques
Données ouvertes et traces numériquesDonnées ouvertes et traces numériques
Données ouvertes et traces numériques
 

De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

  • 1. De l'intelligence dans les données ouvertes Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles Mathieu d’Aquin (@mdaquin) Knowledge Media Institute, The Open University, UK
  • 2. Intelligence artificielle fouille de données, raisonnement, gestion des connaissances Pas importe lesquelles, On préfère les données web De l'intelligence dans les données ouvertes Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles Données web ouvertes comme solutions au problèmes (nouveaux et anciens) Mathieu d’Aquin (@mdaquin) Knowledge Media Institute, The Open University, UK Ca, c’est moi Parce que l’ouverture du web et des données génère de nouveaux problèmes Un endroit intéressant
  • 3. Pourquoi l’enseignement? L’éducation, avant (en simplifiant beaucoup) Secondaire Primaire Université
  • 4. coursera eX d Maintenant… (Et on simplifie toujours) UDACITY MIT OCW MOOCs et OER OpenLearn Primaire Secondaire Autre institutions avec des cours en ligne Open Universities Universities
  • 5. “I want to be a photographer, what should I do?” Siri, I want to become a professional photographer. What should I do? I found this Open University course (T189), that you can enrolled to in the regional centre 2 miles from here (cost £427). “OK, anything free I can try first?” There is an Introduction to Photography course on MIT OCW, and a Computational Photography course on coursera starting soon.
  • 6. Besoin de données ouvertes, partagées et intégrées de toutes ces sources (linked data…) eX d learning outcomes assessment UDACITY MIT courses results topics locations courses requirements OCW topics OpenLearn results locations learning topics outcomes courses results topics requirements learning outcomes coursera http://linkedup-project.eu http://linkeduniversities.org
  • 7. Exemple: L’Open University L’Open University: – La plus grosse université du royaume uni: 250K étudiants par an, 8000 enseignants, un gros campus a Milton Keynes – Crée en 1969 – Presque entièrement fondée sur l’enseignement a distance – 13 centre régionaux, plus les centres nationaux – Cours disponibles dans plusieurs dizaines de pays Partager, transmettre, connecter l’information (publique!): un calvaire
  • 8. data.open.ac.uk La première plateforme linked data provenant de et utilisée par l’ensemble d’une université
  • 9. Plein de (catégories) de données Course information: 580 modules/ description of the course, information about the levels and number of credits associated with it, topics, and conditions of enrolment. Research publications: 16,000 academic articles / information about authors, dates, abstract and venue of the publication. Podcasts: 2220 video podcasts and 1500 audio podcats / short description, topics, link to a representative image and to a transscript if available, information about the course the podcast might relate to and license information regarding the content of the podcast. Open Educational Resources: 640 OpenLearn Units / short description, topics, tags used to annotate the resource, its language, the course it might relate to, and the license that applies to the content. Youtube videos: 900 videos / short description of the video, tags that were used to annotate the video, collection it might be part of and link to the related course if relevant. University buildings: 100 buildings / address, a picture of the building and the sub-divisions of the building into floors and spaces. Library catalogue: 12,000 books/ topics, authors, publisher and ISBN, as well as the course related. Others…
  • 10. Mais que faire? (applications) Social Découverte de ressources Recherche Exploration
  • 11. Exemple (super simple) Carte interactive des bâtiments de l’Open University en Angleterre
  • 13. Pourquoi les données ouvertes/pourquoi en linked data. Exemple en dehors de l’Open University “Unistats, which incorporates the KIS, provides course level information on all undergraduate higher education courses provided in the UK, which are of at least one year’s duration and consist of 120 or more credits of study” [1] « Données ouvertes » incluant des statistiques sur les taux de réussite aux diplômes universitaires dans les différents institutions anglaises, sur la poursuite d’étude et le recrutement des étudiants. [1] http://www.hesa.ac.uk/includes/C13061_resources/Unistats_checkdoc_d efinitions.pdf?v=1.12
  • 14. Le genre de chose que l’ont peut faire avec ces données.
  • 16. … pour construire cette application Il faut accepter les termes et conditions (click), télécharger le fichier zip, décompresser, mettre le xml dans ca propre DB, et finalement, construire l’appli. Fournir les données en linked data avec SPARQL c’est faire tout ca une fois, pour tout le monde. http://data.linkededucation.org/linkedup /catalog/browse/
  • 17. 90 lignes de HTML/Javascript, écrites en 2-3 heures Avec cette requête SPARQL select distinct ?course ?label ?link ?perc where { ?o <http://purl.org/linked-data/cube#dataSet> <http://data.linkedu.eu/kis/dataset/commonJobs>. ?o <http://data.linkedu.eu/kis/ontology/job> <http://data.linkedu.eu/kis/job/354>. ?o <http://data.linkedu.eu/kis/ontology/course> ?course. ?course <http://purl.org/dc/terms/title> ?label. ?course <http://data.linkedu.eu/kis/ontology/courseUrl> ?link. ?o <http://data.linkedu.eu/kis/ontology/percentage> ?perc. filter ( ?perc > 0 ) } order by desc(?perc)
  • 18. Pourquoi les données ouvertes/pourquoi en linked data. Exemple entre l’Open University et la BBC
  • 19.
  • 20. Resources URIs + common topics Interface SimilarityBased Search BBC Programme or iPlayer page Resource descriptions Indexes Synopsis Named Entity Recognition Semantic Entities (Dbpedia) Podcasts, OpenLearn Units and Articles data.open.ac.uk Semantic Indexing Indexes Semantic Index d'Aquin, M., Allocca, C. and Collins, T. (2012) DiscOU: A Flexible Discovery Engine for Open Educational Resources Using Semantic Indexing and Relationship Summaries, Demo ISWC 2012
  • 21. API/Service Named Entity Recognition Programme URI Similarity Search Indexing Scored sem. Entities & Prg URI Prg. URI Resource URIS Common Topic Extraction Prg. URI & Res. URI Common Sem. Entity Scored semantic entities Injected with bookmarklet Interface (Javascript)
  • 22. La même chose, avec juste du texte (discou.info/alfa)
  • 23. Et encore, avec du matériel de cours propriétaire (ouvert + fermé)
  • 24. Amener plus d’intelligence Learning Analytics avec des connaissances du domaine Web logs or application logs Web logs or application logs Web logs or application logs Generic Ontology of events, resources and actions Domain specific extension ontology (= background knowledge) Analytics with domain specific filters, views and reasoning
  • 26. Amener plus d’intelligence Learning Analytics avec de la fouille de données (ouvertes/web) d'Aquin, M. and Jay, N. (2013) Interpreting Data Mining Results with Linked Data for Learning Analytics: Motivation, Case Study and Direction, LAK 2013
  • 27. Un autre exemple: Données publiques/privées/personnelles, besoin de pus de données, besoin de connaissances Classification des régions du royaume uni en accord avec les sujets d’intérêts d’après l’inscription aux cours des étudiants de l’Open University Comment expliquer ces groupes? Solution actuellement explorée : La programmation logique inductive combinée avec le parcours du linked open data graph Tiddi, I., d'Aquin, M. and Motta, E.Explaining Clusters with Inductive Logic Programming and Linked Data, Poster at ISWC 2013,
  • 28. De l’analyse intelligente de données ouvertes a la gestion de l’information personnelle L’information personnelle a une place particulière Rarement données ouverte Utiliser pour améliorer les processus de l’organisation Rarement disponible pour les utilisateurs Et si les données personnelles était ouvertes au utilisateurs qui les génèrent
  • 29. Exemple: MOLUTI Personal Analytics in the browser http://moluti.com
  • 30. Exemple: UCIAD personal analytics dashboard Tableaux de bord de mes (étudiants, enseignants, etc.) activités sur les sites de l’Open University  Implication pour la gestion des données privées  Implication pour l’intégration de données d'Aquin, Elahi, Motta. Semantic technologies to support the user-centric analysis of activity data. SDoW 2011 at ISWC 2011 Thomas and d'Aquin. On the privacy implications of releasing consumer activity data. KMi Tech. Report kmi-13-02, 2013. http://uciad.info
  • 31. Des situations de plus en plus complexes qui nécessitent des raisonnements de plus en plus complexes
  • 32. Facebook graph API Facebook Ontology Basic linked data Epistemic logic theory of Facebook Ontological inference (types, relations) Epistemic inference (who knows what)
  • 34. Example epistemic rules Ka Post(X) :- author(X, a) Ka Post(X) :- scope(X, All_Friends), author(X, Y), friend(Y, a) Ka Post(X) :- includes(X,Y), friend(Y, a) Ka wasIn(P, Y) :- includes(X,Y), in(X,P), Ka Post(X) Ka wasWith (Y,Z) :- includes(X, Y), include(X,Z), Ka Post(X)
  • 35. d'Aquin, Thomas. Modeling and reasoning upon facebook privacy settings. Demo at ISWC 2013
  • 37. Conclusion Un retour au web sémantique? Besoin en traitement intelligent de l’information de plus en plus présent Réconcilier les approches “raw data” avec la modélisation, l’extraction et le manipulation de la connaissance.
  • 41. Un peu d’intelligence Trust in websites Sensitivity of data d'Aquin, Elahi, Motta. Semantic monitoring of personal web activity to support the management of trust and privacy. SPOT 2010 at ESWC 2010