HAL : optimisation du referencement et de la diffusion des contenus
1. HAL, OPTIMISATION DU RÉFÉRENCEMENT
ET DE LA DIFFUSION DES CONTENUS
Bénédicte Kuntziger, CCSD
‘Visibilité des archives ouvertes’
Journée Couperin -INSA – Villeurbanne
novembre 2018
2. S’assurer que les utilisateurs ont accès au
contenu de HAL, ceci quel que soit leur mode
d’accès (services utilisés) à ce contenu
Signalement dans les annuaires et les registres
Exposition des données pour les Agrégateurs de
contenus
Optimisation pour les moteurs de recherche
(SEO)
Partenariats avec des bases de données
spécialisées
HAL ET LE RÉFÉRENCEMENT
2
3. ROAR : registry of
Open Access
Repository
OpenDoar : Directory
of Open Access
Repository
Þ OpenAire
RÉFÉRENCEMENT ANNUAIRES
3Pour mémoire : Ranking Web of Repositories
21. Base de données bibliographiques de référence pour la recherche
biomédicale
Service LinkOut : vise à faciliter l'accès aux ressources en ligne
pertinentes pour étendre, clarifier et compléter les informations
trouvées dans les bases de données de la NCBI. Service ouvert
pour les AI en 2017
Conditions à respecter :
§ identifiant PubMed (PMID)
§ version auteur (preprint, postprint)
§ sans embargo
Rétrospectif : 5032 dépôts + 1 extraction mensuelle (environ 50 dépôts en
moyenne chaque mois) = 6189 dépôts HAL référencés
RÉFERENCEMENT PUBMED
23. Transfert géré par l’INSERM
http://halms.ccsd.cnrs.fr/
Conditions du transfert
§ Identifiant PubMed
§ Fichier auteur
§ Langue du document = anglais
MAJ HAL : récupération du PMCID
Recherche PMC : saisir HAL-INSERM
RÉFÉRENCEMENT PMC
23
29. http://repec.org/
Research Documents Information Format (ReDIF)
Mise à disposition quotidienne d’un fichier au
format ReDIF (nouveaux dépôts + modifs)
Dépôts correspondant à des séries REPEC
(collections de working papers) signalés dans des
répertoires spécifiques
Domaines =
§ Économie et finance quantitative [q-fin]
§ SHS/ Economies et finances
§ SHS/ Gestion et management
REPEC (RESEARCH PAPERS IN ECONOMICS)
29
31. RÉFÉRENCEMENT DES THÈSES TEL DANS
LE SUDOC
31
https://punktokomo.abes.fr/2018/05/14/signaler-dans-le-sudoc-et-dans-theses-fr-les-
theses-deposees-sur-tel/
33. SEO : L'optimisation pour les moteurs de
recherche, référencement naturel ou SEO
(pour search engine optimization), est un
ensemble de techniques visant à optimiser la
visibilité d'une page web dans les résultats de
recherche (les SERP, pour Search Engine
Result Pages).
33
34. Code source : Travail sur les métadonnées
dans la page
Pour les moteurs de recherche dont Google
Scholar
Non spécifique à Google
Page de résultats : Pour les applications de
gestion de références biblio type Zotero
(COinS=Context Objects in Spans)
MOTEURS DE RECHERCHE
34
40. Contact Google => modifications
Un document => 1 seule URL
Document inaccessible => code d’erreur
Visibilité d’un document = dans tous les
portails et collections concernées
URL du document = celle de son portail de
dépôt
RÉFÉRENCEMENT GOOGLE
40
43. Matomo (Piwik)
50% des visites via les moteurs de recherche
32% via d’autres sites internet
18% d’entrées directes
Réseaux sociaux en hausse
Accès via réseaux sociaux Facebook 50%, Twitter
25%
Google Scholar / Google
Mais aussi Bing, Yahoo, Ecosia, Qwant, Baidu…
Portails HAL : accès Matomo
MAIS D’OÙ VIENNENT NOS UTILISATEURS?
43
51. HAL: OUTILS AU SERVICE DU
RÉFÉRENCEMENT
Chercheurs
Documentalistes
(laboratoires,
Universités,)
Editeurs
SciencesConf
Archives
institutionnelles
OAI-PMH
‘Crawling’ et
indexation
Formats à
disposition
(DC, json, XML-TEI,
etc…)
Moissonnage, SEO, interconnections
Google Scholar, BASE, Isidore, ScanR, DART-Europe
OpenAIRE, arXiv, PubMed, PubMed Central, RePec
Episciences, EBSCO, etc…
API, RDF
Triplestore
Episciences
52. Uniformisation et Stabilité des URL
§ https://hal.archives-ouvertes.fr/hal-01917105
§ https://hal.archives-ouvertes.fr/hal-01917105/document
Adoption de formats, normes et protocoles
standardisés : OAI-PMH, DC; XML-TEI, Counter etc…
Pérennité des identifiants (Orcid)
Licences d’utilisation
Statistiques (GT COAR)
Système de recommandations?
Partenariats, par exemple entrepôts type Zenodo
INTEROPÉRABILITÉ
52