SlideShare une entreprise Scribd logo
1  sur  72
Télécharger pour lire hors ligne
Les trois applications du projet
portail des thèses
Equipe Portail des thèses - ABES
Journées ABES - 17 mai 2011
Le projet Portail des thèses
• Rapport du comité Information Scientifique et Technique présidé par Jean Salençon (mai
2008)
• Rapport final du groupe de travail FutuRIS Entreprise et recherche publique : développer les
synergies, « Adéquation public - privé », Avril 2008 présidé par Germain Sanz (avril 2008)
• L’accès aux thèses françaises, en cours et
soutenues, est très difficile. L’absence de guichet
unique nuit :
– au monde académique
– et au monde économique
• Fin 2008, commande du Ministère (MISTRD) à
l’ABES
Journées ABES - 17 mai 2011
Les principes directeurs
• Exhaustivité : toutes les thèses françaises de
doctorat
• Validation : des données validées par
l’établissement de soutenance
• Actualité : des données à jour
• Utilité : des services autour des données
• Réutilisation : des données ouvertes
• Ubiquité : des données pour le web
3Journées ABES - 17 mai 2011
La structure du projet
• Un comité de pilotage qui réunit des acteurs des thèses en France
– administration centrale ( MISTRD, DGESIP, DGRI)
– Conférence des Présidents d’Université et Conférence des Grandes
Ecoles
– représentants des formations doctorales dans les établissements
habilités
– représentants de la recherche privée et du monde économique
– opérateurs documentaires nationaux des thèses (CNRS-INIST, Atelier
national de reproduction des thèses, CINES)
– des représentants d’associations : Intelli’agence (ex-Association
Bernard Gregory), ADBU, AURA.
Toutes les décisions du comité de pilotage ont fait l’objet de compte-
rendus sur le blog de l’ABES : Fil ABES, thème Portail des thèses
4Journées ABES - 17 mai 2011
Le périmètre du projet
• Toutes les thèses de doctorat (mais uniquement les
thèses de doctorat)
– En préparation en France
– Soutenues en France
• Quel que soit le type de dépôt
• Quel que soit le support matériel
• Toutes les personnes et tous les organismes
liés à ces thèses
Journées ABES - 17 mai 2011
Calendrier du projet
• 2010 :
• Hébergement du Fichier central des thèses
• Refonte de STAR
• 2011 :
• Une application professionnelle pour les thèses en
préparation
• Un moteur de recherche pour les thèses de STAR
• Le chargement des données de Thésa
• Un moteur de recherche pour les thèses en préparation
• « FRBrisation » et moteur de recherche pour les thèses du
Sudoc
• 2012 :
• Amélioration du moteur de recherche
• Lien vers les thèses en ligne externes : TEL et archives
institutionnelles
• Lien vers les données des partenaires : Intelli’Agence, ANRT..
Les applications relatives aux thèses et
gérées par l’ABES de 2000 à 2006
Gestion professionnelle
de tous les documents
possédés par les
bibliothèques dont les
thèses
Interface de consultation
P
U
B
L
I
C
P
R
O
F
E
S
I
O
N
N
E
L
Les applications relatives aux thèses et
gérées par l’ABES fin 2006
Gestion professionnelle
des thèses soutenues sur
support électronique
Gestion professionnelle
de tous les documents
possédés par les
bibliothèques dont les
thèses
Interface de consultation
P
U
B
L
I
C
P
R
O
F
E
S
I
O
N
N
E
L
Les applications relatives aux thèses et
gérées par l’ABES en 2010
Gestion professionnelle
des thèses soutenues sur
support électronique
Gestion professionnelle
des thèses en préparation
Interface de consultation
des thèses en préparation
Gestion professionnelle
de tous les documents
possédés par les
bibliothèques dont les
thèses
Interface de consultation
P
U
B
L
I
C
P
R
O
F
E
S
I
O
N
N
E
L
Les applications relatives aux thèses et
gérées par l’ABES courant 2011
Gestion professionnelle
des thèses soutenues sur
support électronique
Gestion professionnelle
des thèses en préparation
Gestion professionnelle
de tous les documents
possédés par les
bibliothèques dont les
thèses
Interface de consultation
P
U
B
L
I
C
P
R
O
F
E
S
I
O
N
N
E
L
Moteur de recherche pour toutes
les thèses françaises
Gestion professionnelle des
thèses soutenues sur
support électronique
Gestion professionnelle des
thèses en préparation
Moteur de recherche pour toutes les thèses françaises
Les trois applications du projet
Portail des thèses
I. Les thèses en préparation
Journées ABES - 17 mai 2011
Plan
1. Le FCT aujourd’hui
2. Les remplaçants du FCT : STEP et theses.fr
3. Le workflow de STEP
4. Les flux des données de STEP
5. La structure et la migration des données du
FCT vers STEP
6. Le calendrier
Journées ABES - 17 mai 2011
1. Deux fichiers nationaux de thèses en
cours
• Le Fichier Central des Thèses (FCT) géré par l’ABES
depuis le 1er janvier 2010
– Constitué selon un axe disciplinaire, il concerne les
thèses de lettres, de sciences humaines et sociales
• Thésa, le portail des Thèses de doctorat en cours
dans les Grandes Ecoles de la CGE, géré par
l’INIST et la CGE
– Fédère les thèses des établissements d’un type
particulier : les Grandes Ecoles
Journées ABES - 17 mai 2011
1. Le réseau FCT
• En 2010, 92 établissements sont des
partenaires actifs du FCT
• 165 personnes, travaillant au sein des services
de scolarité et les écoles doctorales, saisissent
et mettent à jour les données relatives aux
thèses en cours de leur établissement
Journées ABES - 17 mai 2011
1. Les statistiques en 2010
• En 2010, 8671 sujets de thèses en cours ont été signalés
et 11498 mis à jour
• Aujourd’hui, environ 73 000 thèses sont signalées
comme en cours dans le Fichier Central des Thèses
(2001-2011)
Journées ABES - 17 mai 2011
0
100
200
300
400
500
600
700
800
900
1000
Activité de saisie Activité de mise à jour
2. Deux nouvelles applications pour
le signalement des thèses en cours
• L’interface actuelle du Fichier Central des Thèses va
disparaître.
• Une application professionnelle va le remplacer -> STEP
(signalement des thèses en préparation)
– Le périmètre va être étendu à toutes les disciplines
• Une interface publique va permettre la visualisation des
thèses en préparation issues de STEP -> theses.fr (périmètre
des thèses en préparation)
– Les données de Thésa y seront accessibles
Journées ABES - 17 mai 2011
2. Zoom sur STEP
STEP signalement des thèses en préparation
http://step.theses.fr
Une application jumelle de STAR pour :
• Saisir les métadonnées de description des thèses en
préparation
• Importer ces métadonnées depuis les applications
locales de gestion des doctorants
• Exporter ces métadonnées
Journées ABES - 17 mai 2011
Etablissement de soutenance
Doit saisir :
•l’identité du doctorant
•la date d’inscription dans
l’établissement
Initialisation du workflow par l’établissement
3. Le workflow dans l’éditeur de
métadonnées de STEP
Etablissement de soutenance
Doctorant
Doit saisir :
•le directeur de thèse
•le titre du projet
•l’école doctorale
Peut saisir plus
Peut saisir :
•la description du projet
•les mots-clés
Visible dans Thèses en préparation
Visibilité selon la complétude des métadonnées
Etablissement de soutenance
Peut saisir
un indicateur
d’invisibilité
Visible dans Thèses en préparation
Rendre invisible
Etablissement de soutenance
Doit saisir :
La date de soutenance
Visible dans Toutes les thèses
Fin du workflow : la soutenance
Etablissement de soutenance
Doctorant
Doit saisir :
•La date d’abandon
Peut saisir :
•La date d’abandon
Fin du workflow : l’abandon
Processus de création dans STEP
4. STEP : les flux de données en amont
• En amont, STEP pourra être alimenté par les établissements par export des
données présentes dans leur logiciel de gestion administrative des doctorants.
• Le cas APOGEE : partenariat avec l’AMUE pour que le module Thèses d’APOGEE
(2012) soit nativement interconnecté avec STEP.
4. STEP : les flux de données en aval
• Les données de STEP seront visibles dans le périmètre
« thèses en préparation » de theses.fr
• STEP sera connecté à STAR
• STEP interrogera régulièrement le Sudoc pour vérifier qu’une
thèse en préparation n’est pas soutenue
Journées ABES - 17 mai 2011
Si l’établissement est en production dans STAR,
Lorsque la date de soutenance est saisie dans STEP :
- push vers STAR en cycle dépôt national
statut « à traiter »,
- statut soutenu dans STEP.
Processus d’alimentation de STAR
Périmètre « thèses en préparation »
Lorsque la thèse soutenue est traitée dans STAR
- alerte de STAR : statut thèse dans STEP
- visibilité dans les thèses de theses.fr.
Processus de mise à jour de STEP par interrogation de STAR et d’alimentation de theses.fr par
STAR
Puis périmètre « toutes les thèses »
Périmètre « thèses en préparation »
Puis périmètre « toutes les thèses »
Périmètre « thèses en préparation »
Si l’établissement n’est pas en production dans STAR,
lorsque la date de soutenance est saisie dans STEP , requête régulière du Sudoc
pour savoir si la thèse soutenue existe dans le Sudoc.
Si oui,
- visibilité dans les thèses de theses.fr
- et statut thèse dans STEP.
Processus de mise à jour de STEP
par interrogation du Sudoc
5. Transformer et enrichir les
données du FCT
• Les données du FCT sont aujourd’hui stockées dans une base
relationnelle traditionnelle.
• Chaque thèse sera convertie en un fichier XML fortement inspiré du
modèle de données TEF.
• Les données issues du FCT vont être enrichies avant la migration
dans STEP :
– Lien entre les directeurs de thèses en préparation et les autorités
personnes physiques (PPN) via le WS d'IdRef
– Lien entre les établissement du FCT et les autorités collectivités (PPN)
– Attribution à chaque thèse en préparation d’un code de domaine basé sur
la classification Dewey (« oaiset », déjà utilisé dans STAR)
Journées ABES - 17 mai 2011
5. Migration des données
• Seules les thèses en préparation depuis moins de 10 ans seront
migrées dans STEP (décision du comité de pilotage du Portail des Thèses)
– A l’avenir, les thèses en préparation depuis plus de 10 ans seront
automatiquement supprimées de STEP
• Pour les 70 000 thèses en préparation (2001-2011) à migrer, la
qualité des données a été expertisée et est en cours d’amélioration :
– Traitement des doublons en collaboration avec les
établissements
– Comparaison entre les thèses en préparation du FCT et les
thèses soutenues signalées dans le SUDOC
– Subsiste le problème des thèses abandonnées pour lesquelles
seul l’établissement possède l’information
Journées ABES - 17 mai 2011
6. Calendrier du sous-projet
• Septembre 2011 :
– arrêt de l’interface professionnelle du FCT
– Migration des données dans STEP et dans
theses.fr
– Arrêt de l’interface publique du FCT
– Ouverture du périmètre « thèses en préparation »
dans theses.fr
• Fin septembre 2011 : ouverture de STEP
Journées ABES - 17 mai 2011
II. Un moteur de recherche pour
les thèses françaises
Journées ABES - 17 mai 2011
Plan
1. Présentation de l’application et démonstration
2. Point technique
1. L’application
2. Les données
3. L’indexation et la recherche
4. Les principaux problèmes rencontrés
5. La plateforme de production
3. Les données disponibles à l’ouverture de
theses.fr
Journées ABES - 17 mai 2011
1. Les quatre périmètres
• Toutes les thèses : une page par thèse
– Les thèses soutenues et les thèses en préparation
– Deux restrictions possibles :
• uniquement les thèses soutenues
• uniquement les thèses soutenues accessibles en ligne
• Thèses en préparation : une page par thèse en
préparation
• Personnes : docteurs, directeurs de thèse, membres du
jury
• Organismes : établissement de soutenance, de co-tutelle,
écoles doctorales, partenaires de recherche
Journées ABES - 17 mai 2011
1. Au choix de l’utilisateur
• Consultation par l’encart de recherche
• Consultation par l’encart de recherche puis
raffinement par utilisation des facettes
• Consultation par navigation pure via les facettes
Journées ABES - 17 mai 2011
1. L’encart de recherche
• Moteur de recherche présent sur toutes les
pages
– Périmètre toutes les thèses : métadonnées et
texte intégral.
• Affichage d’un extrait du texte intégral contenant le
mot recherché (highlight = surlignage)
– Autres périmètres : métadonnées
• Autocomplétion de deux types : personne ou
sujet
1. La recherche par facettes
• Sept facettes
disponibles pour le
périmètre Toutes les
thèses
• Multisélection
possible au sein
d’une facette (OU)
et croisement entre
facettes (ET).
• Deux affichages
possibles des
facettes :
– liste courte
– ou surimpression
1. La page de la thèse
• Une page par thèse:
– www.theses.fr/NNT pour les thèses soutenues
– www.theses.fr/sXXX pour les thèses en
préparation saisies dans STEP
– www.theses.fr/tXXX pour les thèses en
préparation saisies dans Thésa
• Eventuellement, accès au texte intégral
Journées ABES - 17 mai 2011
1. La page d’une personne
• Docteurs, directeurs de thèse, président du jury,
rapporteurs, autres membres du jury
• Une page par personne : www.theses.fr/PPN
sous réserve que les personnes soient identifiées
par leur notice d’autorité dans le Sudoc
• Rôle de la personne et affichage d’un extrait des
thèses liées
• Nuage de mots construit à partir de l’indexation
de toutes les thèses liées
Journées ABES - 17 mai 2011
1. La page d’un organisme
• Etablissement de soutenance, de cotutelle, écoles
doctorales, partenaires de recherche (laboratoire,
entreprise…)
• Une page par organisme : www.theses.fr/PPN
sous réserve que les organismes soient identifiés
par leur notice d’autorité dans le Sudoc
• Affichage d’un extrait des thèses liées
• Nuage de mots construit à partir de l’indexation
de toutes les thèses liées
Journées ABES - 17 mai 2011
1. Les services proposés par l’interface
• Panier de requêtes ou panier de
notices
• Exporter les résultats ou une notice :
format bureautique (CSV, text) mais
aussi format des logiciels de références
bibliographiques
• S’abonner par fil RSS ou par courriel à
tout changement dans une requête ou
dans une page
• Partager (delicious..)
Journées ABES - 17 mai 2011
1. L’authentification sur theses.fr
• Disposer d’un compte sur theses.fr permettra
de bénéficier de certains services précités.
• Deux modalités techniques :
– création ex nihilo d’un compte
– utilisation d’un compte existant (Gmail, twitter,
facebook…) reconnu via janrain
• Si une personne est reconnue comme étant
l’auteur d’une thèse, elle disposera de droits
supplémentaires sur la page de sa thèse :
– Accès aux statistiques de consultation de la page
de sa thèse
– autorisation d’être contacté par d’autres
utilisateurs de theses.fr
– … Journées ABES - 17 mai 2011
Page d’accueil : www.theses.fr
Page de résultats obtenue après utilisation de l’encart de recherche
Page de résultats obtenue après raffinement par la facette Etablissement
Page de la thèse obtenue en cliquant sur le titre
Page d’une personne obtenue en cliquant sur le nom de la personne
Page d’un organisme obtenue en cliquant sur le nom de l’organisme
2.1. L’application
• Application web développée en Java :
– Réécriture d’URL : Apache
– Conteneur de servlet : Tomcat
– Langage Java : JSP / Servlet
– Librairies utilisées : Saxon / JDOM / SolrJ / JSON …
• Application web, donc :
– HTML
– CSS (charte graphique réalisée par Oxynel)
– Javascript : JQuery
• Pour les widgets : autocompleter / slider / checkers …
Journées ABES - 17 mai 2011
2.1. D’autres moyens d’accès aux
données
• Pas seulement une interface HTML
• Les servlets peuvent aussi délivrer le contenu
sous d’autres formats :
– Fils RSS
– Alertes mail
– API REST XML qui peut être utilisée par d’autres
sites : pour la recherche/résultat et le détail
– TEF, RDF, Marc XML, Dublin Core, etc.
Journées ABES – 17 mai 2011
2.2. Les données
• Base de données Oracle :
– La base de données de la nouvelle plateforme de
production de l’ABES (IdRef, Star, SelfSudoc, …)
– Une table contenant les métadonnées des sujets
(STEP et THESA) et des thèses (Sudoc et STAR)
• Métadonnées sous format TEF étendu
• Clé unique : n°de sujet ou n° national de thèse,
accessible à l’adresse : www.theses.fr/n°
– Des tables pour gérer les comptes utilisateurs, etc.
Journées ABES - 17 mai 2011
2.3. L’indexation et la recherche
• C’est le point le plus important / critique de l’application
• A terme, on aura :
– les métadonnées des thèses en préparation
– les métadonnées (et si possible le plein texte du document) de
toutes les thèses soutenues au moins depuis 1985
• Soit :
– 70 000 thèses en préparation du FCT à migrer
– 450 000 (?) notices de thèses soutenues dans le Sudoc à
« FRBriser » puis à migrer
– accroissement annuel :
• 11 000 thèses soutenues
• 8 000 thèses en préparation en lettres, sciences humaines et sociales
• Choix d’Apache Solr Journées ABES - 17 mai 2011
Apache Solr
• Apache Solr : plateforme de recherche
opensource, basée sur le projet Apache Lucene
• Fonctions principales :
– Recherche plein texte
– Highlighting (surlignage)
– Facettes
– Support de différent type de document (word, pdf…)
– Recherche distribuée
– Réplication d’index automatique
Journées ABES – 17 mai 2011
Apache Solr
• Se lance comme un serveur indépendant de recherche (dans un
conteneur de servlet, comme Apache Tomcat).
• Ecrit en Java, utilise Lucene comme moteur de recherche.
• APIs (interfaces) de type REST XML et JSON, ce qui le rend facile à
utiliser avec n’importe quel langage de programmation.
• Est utilisé à l’ABES par les applications et projets :
• IdRef, Star et API Sudoc (« Solr total », SudocAD), Step, Portail des
thèses.
• Dans le monde des bibliothèques, est de plus en plus utilisé par les
catalogues de nouvelle génération : Blacklight, VuFind, etc.
Journées ABES – 17 mai 2011
2.4. Les problèmes rencontrés :
la recherche par personne
• Nous avons indexé des métadonnées de thèses
• Ces métadonnées décrivent la thèse ainsi :
– Titre, sujets, auteur, directeurs de thèses, etc.
• Nous avons 1 description de thèse = 1 document solr
• Solr indexe des documents « à plat » (pas de liens possibles
entre différents documents)
• Problème : on veut effectuer des recherches, par personne
(auteur, directeur, …), et non pas uniquement par thèse.
C’est à dire, être capable de trouver une personne qui
aurait participé à des thèses qui correspondent à un ou
plusieurs critères de recherche
Journées ABES - 17 et 18 mai 2011
Exemple de document indexé
TEF Document Solr correspondant
Journées ABES - 17 et 18 mai 2011
Comment faire ?
• Créer un solr « personne » dédié, donnant une
vue par personne, et non plus, par thèse
• A chaque ajout / modification / suppression
de métadonnées d’une thèse, pour chaque
personne concernée, on recalcule
intégralement sa fiche à partir des
métadonnées de toutes les thèses
Journées ABES – 17 mai 2011
Exemple
TEF
Document solr personneDocument solr personne
Une fiche personne
2.4. Les problèmes rencontrés :
le surlignage du plein texte
• Solr a des problèmes de performance sur le
surlignage de mot quand le texte est
important (plein texte d’une thèse) :
• C’est d’autant plus lent que le texte est long
• Car solr effectue une recherche par expression
régulière sur la totalité du texte
Journées ABES - 17 mai 2011
Idée / solution
• Découper ce plein texte en « page », lors de
l’indexation :
A chaque plein texte extrait d’un document de
thèse, on découpe ce texte tous les x milliers
de mots, afin d’obtenir des pages
• Ces pages sont placées dans un solr dédié
• La recherche sur ce plein texte s’effectue sur le
solr principal, et le surlignage est fait, pour
chaque document trouvé sur le solr dédié
Journées ABES - 17 mai 2011
A l’indexation : découpage du texte
Extraction du texte
(Apache Tika)
Découpage en
pages
Document de thèse Plein texte extrait
Journées ABES - 17 mai 2011
Ajout du surlignage aux résultats
1) Recherche sur les métadonnées
et le plein texte
3) Surlignage sur critères de recherche + identifiant
2) Liste de résultat (identifiants)
4) Extrait surligné
Solr des métadonnées
Solr dédié
au surlignage
Journées ABES - 17 mai 2011
Pour chaque résultat :
2.5. La plateforme de production
• Serveurs Red Hat Enterprise (linux) :
– 2 boîtiers de répartition de charge
– 2 serveurs frontaux (Apache + Tomcat)
– 1 serveur de fichiers (NAS)
– 2 serveurs de recherche (Tomcat + Solr)
– 2 serveurs de base de données (Oracle en SAN)
Journées ABES - 17 mai 2011
2.5. La plateforme de production
Internet
Boîtiers de répartition de charge
Serveurs frontaux
Serveur de fichiers
Serveurs de recherche
Serveurs de base de données
FrontendBackend
3. Les données disponibles à
l’ouverture de theses.fr
• Toutes les thèses validées dans STAR (4 765 le
1er mai 2011)
• L’utilisateur lambda peut signaler un problème
relatif aux données
Journées ABES - 17 mai 2011
3. La complétude des données saisies
dans STAR
• Saisir les écoles doctorales
3. La qualité des données
• Attention aux textes libres !
3. L’exploitation des autorités
• Saisir le lien aux
autorités dans
STAR pour
permettre son
exploitation dans
une page de
personne ou une
page
d’organisme.
Conclusion
Journées ABES - 17 mai 2011
Suite du projet
• 2010 :
• Hébergement du Fichier central des thèses
• Refonte de STAR
• 2011 :
• Une application professionnelle pour les thèses en
préparation
• Un moteur de recherche pour les thèses de STAR
• Le chargement des données de Thésa
• Un moteur de recherche pour les thèses en préparation
• « FRBrisation » et moteur de recherche pour les thèses du
Sudoc
• 2012 :
• Amélioration du moteur de recherche
• Lien vers les thèses en ligne externes : TEL et archives
institutionnelles
• Lien vers les données des partenaires : Intelli’Agence, ANRT..
Contacts
• L’équipe projet portail des thèses : pth@abes.fr
• Avec le soutien actif du Département Etudes Projets : dep@abes.fr
• Les sites :
http://www.theses.fr http://step.theses.fr http://star.theses.fr
• Crédits icônes :
– gakuseiSean , Jack Cai, Mayosoft, YellowIcon, Oxygen Team, silvestre herrera

Contenu connexe

Similaire à Jabes 2011 - Sessions parallèles : Portail des thèses - "Les trois applications du projet Portail des thèses"

Jabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium CouperinJabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium CouperinABES
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAADBSAquidoc
 
SAM, archive ouverte institutionnelle Arts et Métiers ParisTech
SAM, archive ouverte institutionnelle Arts et Métiers ParisTechSAM, archive ouverte institutionnelle Arts et Métiers ParisTech
SAM, archive ouverte institutionnelle Arts et Métiers ParisTechChristine Ollendorff
 
Formation doctorants-juin 2016
Formation doctorants-juin 2016Formation doctorants-juin 2016
Formation doctorants-juin 2016violaineg
 
JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...
JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...
JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...ABES
 
L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...Institut National Polytechnique de Toulouse
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
 
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016Frédérique Couffignal
 
Formation doctorants-janvier 2015
Formation doctorants-janvier 2015Formation doctorants-janvier 2015
Formation doctorants-janvier 2015violaineg
 
Le portail Archive Ouverte HAL de l'Ecole des Ponts ParisTech
Le portail Archive Ouverte HAL de l'Ecole des Ponts ParisTechLe portail Archive Ouverte HAL de l'Ecole des Ponts ParisTech
Le portail Archive Ouverte HAL de l'Ecole des Ponts ParisTechEcoledespontsparistech
 
Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"
Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"
Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"ABES
 
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...ADBS
 
Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ?
Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ? Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ?
Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ? ABES
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...infoclio.ch
 
Le zoom établissements Archives Ouvertes
Le zoom établissements Archives OuvertesLe zoom établissements Archives Ouvertes
Le zoom établissements Archives OuvertesJean-François Lutz
 
Journées ABES 2013 - Les Actualités de l'ABES
Journées ABES 2013 - Les Actualités de l'ABESJournées ABES 2013 - Les Actualités de l'ABES
Journées ABES 2013 - Les Actualités de l'ABESABES
 
JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8
JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8
JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8ABES
 
Achives ouvertes ISAE-SUPAERO
Achives ouvertes ISAE-SUPAEROAchives ouvertes ISAE-SUPAERO
Achives ouvertes ISAE-SUPAERONaacira
 

Similaire à Jabes 2011 - Sessions parallèles : Portail des thèses - "Les trois applications du projet Portail des thèses" (20)

Jabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium CouperinJabes 2013 - Poster du Consortium Couperin
Jabes 2013 - Poster du Consortium Couperin
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
 
SAM, archive ouverte institutionnelle Arts et Métiers ParisTech
SAM, archive ouverte institutionnelle Arts et Métiers ParisTechSAM, archive ouverte institutionnelle Arts et Métiers ParisTech
SAM, archive ouverte institutionnelle Arts et Métiers ParisTech
 
Formation doctorants-juin 2016
Formation doctorants-juin 2016Formation doctorants-juin 2016
Formation doctorants-juin 2016
 
JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...
JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...
JABES 2018 - Atelier : Améliorer le circuit de dépôt légal et de signalement ...
 
L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...L'offre de services numériques du SCD de l'Institut National Polytechnique de...
L'offre de services numériques du SCD de l'Institut National Polytechnique de...
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 
OATAO, archive ouverte institutionnelle
OATAO, archive ouverte institutionnelleOATAO, archive ouverte institutionnelle
OATAO, archive ouverte institutionnelle
 
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
Retour d'expérience : migration Cadic vers Koha 3.14. Symposium Koha Lyon 2016
 
Formation doctorants-janvier 2015
Formation doctorants-janvier 2015Formation doctorants-janvier 2015
Formation doctorants-janvier 2015
 
Le portail Archive Ouverte HAL de l'Ecole des Ponts ParisTech
Le portail Archive Ouverte HAL de l'Ecole des Ponts ParisTechLe portail Archive Ouverte HAL de l'Ecole des Ponts ParisTech
Le portail Archive Ouverte HAL de l'Ecole des Ponts ParisTech
 
Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"
Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"
Jabes 2011 - Actualités et projets de l'Abes "Les API Sudoc, le Sudoc autrement"
 
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
RDA : le nouveau paradigme du catalogage (5). Bonus : un travail de veille au...
 
Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ?
Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ? Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ?
Parcours Thèses : Theses. fr et le Sudoc : concurrence ou complémentarité ?
 
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
Stéphane Pouyllau (CNRS) - ISIDORE : plateforme d’accès unifié aux données de...
 
Le zoom établissements Archives Ouvertes
Le zoom établissements Archives OuvertesLe zoom établissements Archives Ouvertes
Le zoom établissements Archives Ouvertes
 
Journées ABES 2013 - Les Actualités de l'ABES
Journées ABES 2013 - Les Actualités de l'ABESJournées ABES 2013 - Les Actualités de l'ABES
Journées ABES 2013 - Les Actualités de l'ABES
 
JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8
JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8
JABES 2016 - Le traitement documentaire des thèses à l’Université Paris 8
 
Achives ouvertes ISAE-SUPAERO
Achives ouvertes ISAE-SUPAEROAchives ouvertes ISAE-SUPAERO
Achives ouvertes ISAE-SUPAERO
 
20111004 05 - Présentation Squash
20111004 05 - Présentation Squash20111004 05 - Présentation Squash
20111004 05 - Présentation Squash
 

Plus de ABES

FOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibreFOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibreABES
 
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...ABES
 
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"ABES
 
Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"ABES
 
JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"ABES
 
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"ABES
 
JCR 2021 - Présentation "Cidemis au-dela des frontieres"
JCR 2021 - Présentation "Cidemis au-dela des frontieres"JCR 2021 - Présentation "Cidemis au-dela des frontieres"
JCR 2021 - Présentation "Cidemis au-dela des frontieres"ABES
 
JCR 2021 - Présentation "Cidemis au Cieps"
JCR 2021 - Présentation "Cidemis au Cieps"JCR 2021 - Présentation "Cidemis au Cieps"
JCR 2021 - Présentation "Cidemis au Cieps"ABES
 
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"ABES
 
JCR 2021 - Présentation "Cidemis en amont : petits rappels"
JCR 2021 - Présentation "Cidemis en amont : petits rappels" JCR 2021 - Présentation "Cidemis en amont : petits rappels"
JCR 2021 - Présentation "Cidemis en amont : petits rappels" ABES
 
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"ABES
 
Jabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'AbesJabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'AbesABES
 
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...ABES
 
Jabes 2021 - Les Actus de l'Abes, partie 2
Jabes 2021 - Les Actus de l'Abes, partie 2Jabes 2021 - Les Actus de l'Abes, partie 2
Jabes 2021 - Les Actus de l'Abes, partie 2ABES
 
Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1ABES
 
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"ABES
 
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...ABES
 
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...ABES
 
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...ABES
 
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...ABES
 

Plus de ABES (20)

FOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibreFOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibre
 
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
 
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
 
Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"
 
JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"
 
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
 
JCR 2021 - Présentation "Cidemis au-dela des frontieres"
JCR 2021 - Présentation "Cidemis au-dela des frontieres"JCR 2021 - Présentation "Cidemis au-dela des frontieres"
JCR 2021 - Présentation "Cidemis au-dela des frontieres"
 
JCR 2021 - Présentation "Cidemis au Cieps"
JCR 2021 - Présentation "Cidemis au Cieps"JCR 2021 - Présentation "Cidemis au Cieps"
JCR 2021 - Présentation "Cidemis au Cieps"
 
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
 
JCR 2021 - Présentation "Cidemis en amont : petits rappels"
JCR 2021 - Présentation "Cidemis en amont : petits rappels" JCR 2021 - Présentation "Cidemis en amont : petits rappels"
JCR 2021 - Présentation "Cidemis en amont : petits rappels"
 
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
 
Jabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'AbesJabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'Abes
 
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
 
Jabes 2021 - Les Actus de l'Abes, partie 2
Jabes 2021 - Les Actus de l'Abes, partie 2Jabes 2021 - Les Actus de l'Abes, partie 2
Jabes 2021 - Les Actus de l'Abes, partie 2
 
Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1
 
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
 
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
 
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
 
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
 
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
 

Dernier

SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSKennel
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsRajiAbdelghani
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .Txaruka
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSKennel
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETMedBechir
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSKennel
 
Evaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxEvaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxAsmaa105193
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETMedBechir
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeXL Groupe
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre françaisTxaruka
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 37
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxrababouerdighi
 
Saint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxSaint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxMartin M Flynn
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSKennel
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Gilles Le Page
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSKennel
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxmmatar2
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 37
 

Dernier (20)

SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdfSciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
SciencesPo_Aix_InnovationPédagogique_Conférence_SK.pdf
 
Principe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 tempsPrincipe de fonctionnement d'un moteur 4 temps
Principe de fonctionnement d'un moteur 4 temps
 
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .Annie   Ernaux  Extérieurs. pptx. Exposition basée sur un livre .
Annie Ernaux Extérieurs. pptx. Exposition basée sur un livre .
 
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_FormationRecherche.pdf
 
Cours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSETCours SE Gestion des périphériques - IG IPSET
Cours SE Gestion des périphériques - IG IPSET
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdfSciencesPo_Aix_InnovationPédagogique_Bilan.pdf
SciencesPo_Aix_InnovationPédagogique_Bilan.pdf
 
Evaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. MarocpptxEvaluation du systeme d'Education. Marocpptx
Evaluation du systeme d'Education. Marocpptx
 
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSETCours SE Le système Linux : La ligne de commande bash - IG IPSET
Cours SE Le système Linux : La ligne de commande bash - IG IPSET
 
Le Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directeLe Lean sur une ligne de production : Formation et mise en application directe
Le Lean sur une ligne de production : Formation et mise en application directe
 
Bernard Réquichot.pptx Peintre français
Bernard Réquichot.pptx   Peintre françaisBernard Réquichot.pptx   Peintre français
Bernard Réquichot.pptx Peintre français
 
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdfBibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
Bibdoc 2024 - Les maillons de la chaine du livre face aux enjeux écologiques.pdf
 
DO PALÁCIO À ASSEMBLEIA .
DO PALÁCIO À ASSEMBLEIA                 .DO PALÁCIO À ASSEMBLEIA                 .
DO PALÁCIO À ASSEMBLEIA .
 
Présentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptxPrésentation_ Didactique 1_SVT (S4) complet.pptx
Présentation_ Didactique 1_SVT (S4) complet.pptx
 
Saint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptxSaint Georges, martyr, et la lègend du dragon.pptx
Saint Georges, martyr, et la lègend du dragon.pptx
 
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_EtudiantActeur.pdf
 
Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024Presentation de la plateforme Moodle - avril 2024
Presentation de la plateforme Moodle - avril 2024
 
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_IA.pdf
 
le present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptxle present des verbes reguliers -er.pptx
le present des verbes reguliers -er.pptx
 
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdfBibdoc 2024 - Ecologie du livre et creation de badge.pdf
Bibdoc 2024 - Ecologie du livre et creation de badge.pdf
 

Jabes 2011 - Sessions parallèles : Portail des thèses - "Les trois applications du projet Portail des thèses"

  • 1. Les trois applications du projet portail des thèses Equipe Portail des thèses - ABES Journées ABES - 17 mai 2011
  • 2. Le projet Portail des thèses • Rapport du comité Information Scientifique et Technique présidé par Jean Salençon (mai 2008) • Rapport final du groupe de travail FutuRIS Entreprise et recherche publique : développer les synergies, « Adéquation public - privé », Avril 2008 présidé par Germain Sanz (avril 2008) • L’accès aux thèses françaises, en cours et soutenues, est très difficile. L’absence de guichet unique nuit : – au monde académique – et au monde économique • Fin 2008, commande du Ministère (MISTRD) à l’ABES Journées ABES - 17 mai 2011
  • 3. Les principes directeurs • Exhaustivité : toutes les thèses françaises de doctorat • Validation : des données validées par l’établissement de soutenance • Actualité : des données à jour • Utilité : des services autour des données • Réutilisation : des données ouvertes • Ubiquité : des données pour le web 3Journées ABES - 17 mai 2011
  • 4. La structure du projet • Un comité de pilotage qui réunit des acteurs des thèses en France – administration centrale ( MISTRD, DGESIP, DGRI) – Conférence des Présidents d’Université et Conférence des Grandes Ecoles – représentants des formations doctorales dans les établissements habilités – représentants de la recherche privée et du monde économique – opérateurs documentaires nationaux des thèses (CNRS-INIST, Atelier national de reproduction des thèses, CINES) – des représentants d’associations : Intelli’agence (ex-Association Bernard Gregory), ADBU, AURA. Toutes les décisions du comité de pilotage ont fait l’objet de compte- rendus sur le blog de l’ABES : Fil ABES, thème Portail des thèses 4Journées ABES - 17 mai 2011
  • 5. Le périmètre du projet • Toutes les thèses de doctorat (mais uniquement les thèses de doctorat) – En préparation en France – Soutenues en France • Quel que soit le type de dépôt • Quel que soit le support matériel • Toutes les personnes et tous les organismes liés à ces thèses Journées ABES - 17 mai 2011
  • 6. Calendrier du projet • 2010 : • Hébergement du Fichier central des thèses • Refonte de STAR • 2011 : • Une application professionnelle pour les thèses en préparation • Un moteur de recherche pour les thèses de STAR • Le chargement des données de Thésa • Un moteur de recherche pour les thèses en préparation • « FRBrisation » et moteur de recherche pour les thèses du Sudoc • 2012 : • Amélioration du moteur de recherche • Lien vers les thèses en ligne externes : TEL et archives institutionnelles • Lien vers les données des partenaires : Intelli’Agence, ANRT..
  • 7. Les applications relatives aux thèses et gérées par l’ABES de 2000 à 2006 Gestion professionnelle de tous les documents possédés par les bibliothèques dont les thèses Interface de consultation P U B L I C P R O F E S I O N N E L
  • 8. Les applications relatives aux thèses et gérées par l’ABES fin 2006 Gestion professionnelle des thèses soutenues sur support électronique Gestion professionnelle de tous les documents possédés par les bibliothèques dont les thèses Interface de consultation P U B L I C P R O F E S I O N N E L
  • 9. Les applications relatives aux thèses et gérées par l’ABES en 2010 Gestion professionnelle des thèses soutenues sur support électronique Gestion professionnelle des thèses en préparation Interface de consultation des thèses en préparation Gestion professionnelle de tous les documents possédés par les bibliothèques dont les thèses Interface de consultation P U B L I C P R O F E S I O N N E L
  • 10. Les applications relatives aux thèses et gérées par l’ABES courant 2011 Gestion professionnelle des thèses soutenues sur support électronique Gestion professionnelle des thèses en préparation Gestion professionnelle de tous les documents possédés par les bibliothèques dont les thèses Interface de consultation P U B L I C P R O F E S I O N N E L Moteur de recherche pour toutes les thèses françaises
  • 11. Gestion professionnelle des thèses soutenues sur support électronique Gestion professionnelle des thèses en préparation Moteur de recherche pour toutes les thèses françaises Les trois applications du projet Portail des thèses
  • 12. I. Les thèses en préparation Journées ABES - 17 mai 2011
  • 13. Plan 1. Le FCT aujourd’hui 2. Les remplaçants du FCT : STEP et theses.fr 3. Le workflow de STEP 4. Les flux des données de STEP 5. La structure et la migration des données du FCT vers STEP 6. Le calendrier Journées ABES - 17 mai 2011
  • 14. 1. Deux fichiers nationaux de thèses en cours • Le Fichier Central des Thèses (FCT) géré par l’ABES depuis le 1er janvier 2010 – Constitué selon un axe disciplinaire, il concerne les thèses de lettres, de sciences humaines et sociales • Thésa, le portail des Thèses de doctorat en cours dans les Grandes Ecoles de la CGE, géré par l’INIST et la CGE – Fédère les thèses des établissements d’un type particulier : les Grandes Ecoles Journées ABES - 17 mai 2011
  • 15. 1. Le réseau FCT • En 2010, 92 établissements sont des partenaires actifs du FCT • 165 personnes, travaillant au sein des services de scolarité et les écoles doctorales, saisissent et mettent à jour les données relatives aux thèses en cours de leur établissement Journées ABES - 17 mai 2011
  • 16. 1. Les statistiques en 2010 • En 2010, 8671 sujets de thèses en cours ont été signalés et 11498 mis à jour • Aujourd’hui, environ 73 000 thèses sont signalées comme en cours dans le Fichier Central des Thèses (2001-2011) Journées ABES - 17 mai 2011 0 100 200 300 400 500 600 700 800 900 1000 Activité de saisie Activité de mise à jour
  • 17. 2. Deux nouvelles applications pour le signalement des thèses en cours • L’interface actuelle du Fichier Central des Thèses va disparaître. • Une application professionnelle va le remplacer -> STEP (signalement des thèses en préparation) – Le périmètre va être étendu à toutes les disciplines • Une interface publique va permettre la visualisation des thèses en préparation issues de STEP -> theses.fr (périmètre des thèses en préparation) – Les données de Thésa y seront accessibles Journées ABES - 17 mai 2011
  • 18. 2. Zoom sur STEP STEP signalement des thèses en préparation http://step.theses.fr Une application jumelle de STAR pour : • Saisir les métadonnées de description des thèses en préparation • Importer ces métadonnées depuis les applications locales de gestion des doctorants • Exporter ces métadonnées Journées ABES - 17 mai 2011
  • 19. Etablissement de soutenance Doit saisir : •l’identité du doctorant •la date d’inscription dans l’établissement Initialisation du workflow par l’établissement 3. Le workflow dans l’éditeur de métadonnées de STEP
  • 20. Etablissement de soutenance Doctorant Doit saisir : •le directeur de thèse •le titre du projet •l’école doctorale Peut saisir plus Peut saisir : •la description du projet •les mots-clés Visible dans Thèses en préparation Visibilité selon la complétude des métadonnées
  • 21. Etablissement de soutenance Peut saisir un indicateur d’invisibilité Visible dans Thèses en préparation Rendre invisible
  • 22. Etablissement de soutenance Doit saisir : La date de soutenance Visible dans Toutes les thèses Fin du workflow : la soutenance
  • 23. Etablissement de soutenance Doctorant Doit saisir : •La date d’abandon Peut saisir : •La date d’abandon Fin du workflow : l’abandon
  • 24. Processus de création dans STEP 4. STEP : les flux de données en amont • En amont, STEP pourra être alimenté par les établissements par export des données présentes dans leur logiciel de gestion administrative des doctorants. • Le cas APOGEE : partenariat avec l’AMUE pour que le module Thèses d’APOGEE (2012) soit nativement interconnecté avec STEP.
  • 25. 4. STEP : les flux de données en aval • Les données de STEP seront visibles dans le périmètre « thèses en préparation » de theses.fr • STEP sera connecté à STAR • STEP interrogera régulièrement le Sudoc pour vérifier qu’une thèse en préparation n’est pas soutenue Journées ABES - 17 mai 2011
  • 26. Si l’établissement est en production dans STAR, Lorsque la date de soutenance est saisie dans STEP : - push vers STAR en cycle dépôt national statut « à traiter », - statut soutenu dans STEP. Processus d’alimentation de STAR Périmètre « thèses en préparation »
  • 27. Lorsque la thèse soutenue est traitée dans STAR - alerte de STAR : statut thèse dans STEP - visibilité dans les thèses de theses.fr. Processus de mise à jour de STEP par interrogation de STAR et d’alimentation de theses.fr par STAR Puis périmètre « toutes les thèses » Périmètre « thèses en préparation »
  • 28. Puis périmètre « toutes les thèses » Périmètre « thèses en préparation » Si l’établissement n’est pas en production dans STAR, lorsque la date de soutenance est saisie dans STEP , requête régulière du Sudoc pour savoir si la thèse soutenue existe dans le Sudoc. Si oui, - visibilité dans les thèses de theses.fr - et statut thèse dans STEP. Processus de mise à jour de STEP par interrogation du Sudoc
  • 29. 5. Transformer et enrichir les données du FCT • Les données du FCT sont aujourd’hui stockées dans une base relationnelle traditionnelle. • Chaque thèse sera convertie en un fichier XML fortement inspiré du modèle de données TEF. • Les données issues du FCT vont être enrichies avant la migration dans STEP : – Lien entre les directeurs de thèses en préparation et les autorités personnes physiques (PPN) via le WS d'IdRef – Lien entre les établissement du FCT et les autorités collectivités (PPN) – Attribution à chaque thèse en préparation d’un code de domaine basé sur la classification Dewey (« oaiset », déjà utilisé dans STAR) Journées ABES - 17 mai 2011
  • 30. 5. Migration des données • Seules les thèses en préparation depuis moins de 10 ans seront migrées dans STEP (décision du comité de pilotage du Portail des Thèses) – A l’avenir, les thèses en préparation depuis plus de 10 ans seront automatiquement supprimées de STEP • Pour les 70 000 thèses en préparation (2001-2011) à migrer, la qualité des données a été expertisée et est en cours d’amélioration : – Traitement des doublons en collaboration avec les établissements – Comparaison entre les thèses en préparation du FCT et les thèses soutenues signalées dans le SUDOC – Subsiste le problème des thèses abandonnées pour lesquelles seul l’établissement possède l’information Journées ABES - 17 mai 2011
  • 31. 6. Calendrier du sous-projet • Septembre 2011 : – arrêt de l’interface professionnelle du FCT – Migration des données dans STEP et dans theses.fr – Arrêt de l’interface publique du FCT – Ouverture du périmètre « thèses en préparation » dans theses.fr • Fin septembre 2011 : ouverture de STEP Journées ABES - 17 mai 2011
  • 32. II. Un moteur de recherche pour les thèses françaises Journées ABES - 17 mai 2011
  • 33. Plan 1. Présentation de l’application et démonstration 2. Point technique 1. L’application 2. Les données 3. L’indexation et la recherche 4. Les principaux problèmes rencontrés 5. La plateforme de production 3. Les données disponibles à l’ouverture de theses.fr Journées ABES - 17 mai 2011
  • 34. 1. Les quatre périmètres • Toutes les thèses : une page par thèse – Les thèses soutenues et les thèses en préparation – Deux restrictions possibles : • uniquement les thèses soutenues • uniquement les thèses soutenues accessibles en ligne • Thèses en préparation : une page par thèse en préparation • Personnes : docteurs, directeurs de thèse, membres du jury • Organismes : établissement de soutenance, de co-tutelle, écoles doctorales, partenaires de recherche Journées ABES - 17 mai 2011
  • 35. 1. Au choix de l’utilisateur • Consultation par l’encart de recherche • Consultation par l’encart de recherche puis raffinement par utilisation des facettes • Consultation par navigation pure via les facettes Journées ABES - 17 mai 2011
  • 36. 1. L’encart de recherche • Moteur de recherche présent sur toutes les pages – Périmètre toutes les thèses : métadonnées et texte intégral. • Affichage d’un extrait du texte intégral contenant le mot recherché (highlight = surlignage) – Autres périmètres : métadonnées • Autocomplétion de deux types : personne ou sujet
  • 37. 1. La recherche par facettes • Sept facettes disponibles pour le périmètre Toutes les thèses • Multisélection possible au sein d’une facette (OU) et croisement entre facettes (ET). • Deux affichages possibles des facettes : – liste courte – ou surimpression
  • 38. 1. La page de la thèse • Une page par thèse: – www.theses.fr/NNT pour les thèses soutenues – www.theses.fr/sXXX pour les thèses en préparation saisies dans STEP – www.theses.fr/tXXX pour les thèses en préparation saisies dans Thésa • Eventuellement, accès au texte intégral Journées ABES - 17 mai 2011
  • 39. 1. La page d’une personne • Docteurs, directeurs de thèse, président du jury, rapporteurs, autres membres du jury • Une page par personne : www.theses.fr/PPN sous réserve que les personnes soient identifiées par leur notice d’autorité dans le Sudoc • Rôle de la personne et affichage d’un extrait des thèses liées • Nuage de mots construit à partir de l’indexation de toutes les thèses liées Journées ABES - 17 mai 2011
  • 40. 1. La page d’un organisme • Etablissement de soutenance, de cotutelle, écoles doctorales, partenaires de recherche (laboratoire, entreprise…) • Une page par organisme : www.theses.fr/PPN sous réserve que les organismes soient identifiés par leur notice d’autorité dans le Sudoc • Affichage d’un extrait des thèses liées • Nuage de mots construit à partir de l’indexation de toutes les thèses liées Journées ABES - 17 mai 2011
  • 41. 1. Les services proposés par l’interface • Panier de requêtes ou panier de notices • Exporter les résultats ou une notice : format bureautique (CSV, text) mais aussi format des logiciels de références bibliographiques • S’abonner par fil RSS ou par courriel à tout changement dans une requête ou dans une page • Partager (delicious..) Journées ABES - 17 mai 2011
  • 42. 1. L’authentification sur theses.fr • Disposer d’un compte sur theses.fr permettra de bénéficier de certains services précités. • Deux modalités techniques : – création ex nihilo d’un compte – utilisation d’un compte existant (Gmail, twitter, facebook…) reconnu via janrain • Si une personne est reconnue comme étant l’auteur d’une thèse, elle disposera de droits supplémentaires sur la page de sa thèse : – Accès aux statistiques de consultation de la page de sa thèse – autorisation d’être contacté par d’autres utilisateurs de theses.fr – … Journées ABES - 17 mai 2011
  • 43. Page d’accueil : www.theses.fr
  • 44. Page de résultats obtenue après utilisation de l’encart de recherche
  • 45. Page de résultats obtenue après raffinement par la facette Etablissement
  • 46. Page de la thèse obtenue en cliquant sur le titre
  • 47. Page d’une personne obtenue en cliquant sur le nom de la personne
  • 48. Page d’un organisme obtenue en cliquant sur le nom de l’organisme
  • 49. 2.1. L’application • Application web développée en Java : – Réécriture d’URL : Apache – Conteneur de servlet : Tomcat – Langage Java : JSP / Servlet – Librairies utilisées : Saxon / JDOM / SolrJ / JSON … • Application web, donc : – HTML – CSS (charte graphique réalisée par Oxynel) – Javascript : JQuery • Pour les widgets : autocompleter / slider / checkers … Journées ABES - 17 mai 2011
  • 50. 2.1. D’autres moyens d’accès aux données • Pas seulement une interface HTML • Les servlets peuvent aussi délivrer le contenu sous d’autres formats : – Fils RSS – Alertes mail – API REST XML qui peut être utilisée par d’autres sites : pour la recherche/résultat et le détail – TEF, RDF, Marc XML, Dublin Core, etc. Journées ABES – 17 mai 2011
  • 51. 2.2. Les données • Base de données Oracle : – La base de données de la nouvelle plateforme de production de l’ABES (IdRef, Star, SelfSudoc, …) – Une table contenant les métadonnées des sujets (STEP et THESA) et des thèses (Sudoc et STAR) • Métadonnées sous format TEF étendu • Clé unique : n°de sujet ou n° national de thèse, accessible à l’adresse : www.theses.fr/n° – Des tables pour gérer les comptes utilisateurs, etc. Journées ABES - 17 mai 2011
  • 52. 2.3. L’indexation et la recherche • C’est le point le plus important / critique de l’application • A terme, on aura : – les métadonnées des thèses en préparation – les métadonnées (et si possible le plein texte du document) de toutes les thèses soutenues au moins depuis 1985 • Soit : – 70 000 thèses en préparation du FCT à migrer – 450 000 (?) notices de thèses soutenues dans le Sudoc à « FRBriser » puis à migrer – accroissement annuel : • 11 000 thèses soutenues • 8 000 thèses en préparation en lettres, sciences humaines et sociales • Choix d’Apache Solr Journées ABES - 17 mai 2011
  • 53. Apache Solr • Apache Solr : plateforme de recherche opensource, basée sur le projet Apache Lucene • Fonctions principales : – Recherche plein texte – Highlighting (surlignage) – Facettes – Support de différent type de document (word, pdf…) – Recherche distribuée – Réplication d’index automatique Journées ABES – 17 mai 2011
  • 54. Apache Solr • Se lance comme un serveur indépendant de recherche (dans un conteneur de servlet, comme Apache Tomcat). • Ecrit en Java, utilise Lucene comme moteur de recherche. • APIs (interfaces) de type REST XML et JSON, ce qui le rend facile à utiliser avec n’importe quel langage de programmation. • Est utilisé à l’ABES par les applications et projets : • IdRef, Star et API Sudoc (« Solr total », SudocAD), Step, Portail des thèses. • Dans le monde des bibliothèques, est de plus en plus utilisé par les catalogues de nouvelle génération : Blacklight, VuFind, etc. Journées ABES – 17 mai 2011
  • 55. 2.4. Les problèmes rencontrés : la recherche par personne • Nous avons indexé des métadonnées de thèses • Ces métadonnées décrivent la thèse ainsi : – Titre, sujets, auteur, directeurs de thèses, etc. • Nous avons 1 description de thèse = 1 document solr • Solr indexe des documents « à plat » (pas de liens possibles entre différents documents) • Problème : on veut effectuer des recherches, par personne (auteur, directeur, …), et non pas uniquement par thèse. C’est à dire, être capable de trouver une personne qui aurait participé à des thèses qui correspondent à un ou plusieurs critères de recherche Journées ABES - 17 et 18 mai 2011
  • 56. Exemple de document indexé TEF Document Solr correspondant Journées ABES - 17 et 18 mai 2011
  • 57. Comment faire ? • Créer un solr « personne » dédié, donnant une vue par personne, et non plus, par thèse • A chaque ajout / modification / suppression de métadonnées d’une thèse, pour chaque personne concernée, on recalcule intégralement sa fiche à partir des métadonnées de toutes les thèses Journées ABES – 17 mai 2011
  • 60. 2.4. Les problèmes rencontrés : le surlignage du plein texte • Solr a des problèmes de performance sur le surlignage de mot quand le texte est important (plein texte d’une thèse) : • C’est d’autant plus lent que le texte est long • Car solr effectue une recherche par expression régulière sur la totalité du texte Journées ABES - 17 mai 2011
  • 61. Idée / solution • Découper ce plein texte en « page », lors de l’indexation : A chaque plein texte extrait d’un document de thèse, on découpe ce texte tous les x milliers de mots, afin d’obtenir des pages • Ces pages sont placées dans un solr dédié • La recherche sur ce plein texte s’effectue sur le solr principal, et le surlignage est fait, pour chaque document trouvé sur le solr dédié Journées ABES - 17 mai 2011
  • 62. A l’indexation : découpage du texte Extraction du texte (Apache Tika) Découpage en pages Document de thèse Plein texte extrait Journées ABES - 17 mai 2011
  • 63. Ajout du surlignage aux résultats 1) Recherche sur les métadonnées et le plein texte 3) Surlignage sur critères de recherche + identifiant 2) Liste de résultat (identifiants) 4) Extrait surligné Solr des métadonnées Solr dédié au surlignage Journées ABES - 17 mai 2011 Pour chaque résultat :
  • 64. 2.5. La plateforme de production • Serveurs Red Hat Enterprise (linux) : – 2 boîtiers de répartition de charge – 2 serveurs frontaux (Apache + Tomcat) – 1 serveur de fichiers (NAS) – 2 serveurs de recherche (Tomcat + Solr) – 2 serveurs de base de données (Oracle en SAN) Journées ABES - 17 mai 2011
  • 65. 2.5. La plateforme de production Internet Boîtiers de répartition de charge Serveurs frontaux Serveur de fichiers Serveurs de recherche Serveurs de base de données FrontendBackend
  • 66. 3. Les données disponibles à l’ouverture de theses.fr • Toutes les thèses validées dans STAR (4 765 le 1er mai 2011) • L’utilisateur lambda peut signaler un problème relatif aux données Journées ABES - 17 mai 2011
  • 67. 3. La complétude des données saisies dans STAR • Saisir les écoles doctorales
  • 68. 3. La qualité des données • Attention aux textes libres !
  • 69. 3. L’exploitation des autorités • Saisir le lien aux autorités dans STAR pour permettre son exploitation dans une page de personne ou une page d’organisme.
  • 71. Suite du projet • 2010 : • Hébergement du Fichier central des thèses • Refonte de STAR • 2011 : • Une application professionnelle pour les thèses en préparation • Un moteur de recherche pour les thèses de STAR • Le chargement des données de Thésa • Un moteur de recherche pour les thèses en préparation • « FRBrisation » et moteur de recherche pour les thèses du Sudoc • 2012 : • Amélioration du moteur de recherche • Lien vers les thèses en ligne externes : TEL et archives institutionnelles • Lien vers les données des partenaires : Intelli’Agence, ANRT..
  • 72. Contacts • L’équipe projet portail des thèses : pth@abes.fr • Avec le soutien actif du Département Etudes Projets : dep@abes.fr • Les sites : http://www.theses.fr http://step.theses.fr http://star.theses.fr • Crédits icônes : – gakuseiSean , Jack Cai, Mayosoft, YellowIcon, Oxygen Team, silvestre herrera