Repository Usage Statistics and the Open Research Analytics Service
1. Webinar: Repository Nutzungsstatistiken und
der Open Research Analytics Service
Paul Borchert, GBV
Jochen Schirrwagen, UB-Bielefeld / OpenAIRE
Max Mosterd, Knowledge Unlatched
2. Übersicht
• Rückblende OA-Statistik
• electronic Publication Statistics – neue
Entwicklungen beim gbv
• OpenAIRE Usage Statistics – Stand und Ausblick
• Open Research Analytics Service – Community-
Projekt initiiert von Knowledge Unlatched
3. Rückblende OA-Statistik (OAS)
• Gestartet als DFG-Projekt mit zwei Förderphasen
2008 – 2013
• Unterstützt von DINI
• Ziel: Infrastruktur für standardisierte, international
vergleichbare Nutzungsstatistiken
• Aufbauend auf OAI-PMH als Transferprotokoll und
OpenURL ContextObjects als XML-Format
• Generierung von COUNTER R4 Reports
• Machbarkeitsstudie
https://dini.de/fileadmin/oa-statistik/Machbarkeitsstudie/OAS-
Machbarkeitsstudie.pdf
4. Rückblende OA-Statistik (OAS)
• Ab 2015 Inbetriebnahme als Dienst bei der
Verbundzentrale des GBV
• Abgestuftes Gebührenmodell für Teilnehmer
(Stand 2017)
• Nach Anzahl der Records: 160 – 470 EUR / annum
• Incl. OAS-Widget: 180 – 510 EUR / annum
• Eingeschränkte Nachnutzbarkeit der Statistiken
wegen CC-BY-NC-SA 3.0 Lizenz
• Teilnehmer: KOBV & BSZ: OPUS-Hosting, sowie 7
weitere Einrichtungen
7. Open-Access-Statistik (OAS)
• Beendigung von OAS zum 31.12.2019
• extremer Speicherplatzbedarf
• aufwändige Dienstbetreuung
• Intransparenz der ermittelten Zugriffszahlen
• Einnahmen- Aufwandverhältnis
8. OAS-Abwicklung
• kein umfassender Support mehr
• für ehemalige Nutzer
• lokale Weiternutzung der OAS Software
• Datenübernahme durch Dumps der
Datenbanktabellen oder über die OAS-API
9. OAS Nachfolger
• Eigenentwicklung für die Reposis – Repositoren
• Open Source
• neues Konzept zum Parsen der Logfiles
• OAS kompatible API
• neue REST-API (in der Entwicklung)
• Zusammenarbeit mit KOBV und BSZ
10. ePuSta
• electronic Publications Statistics
• ehm. ReposAS
• ePuSta-logfileparser
• https://github.com/gbv/ePuSta-logfileparser/
• Skriptbibliothek zur Erzeugung von angereicherten
Logfiles
• ePuSta-Server
• https://github.com/gbv/ePuSta-Server/
• Speicherung der Zugriffe SOLR
• OAS kompatible API
feel free to
- watch
- write issues
- commit
- fork
11. Roadmap
3.Q 2019 1 produktives Repository über OAS kompatible API
(perspectivia.net) (MyCoRe)
4.Q 2019 KOBV/BSZ für OPUS, OAS kompatible API
4.Q 2019 Umzug aller Reposis- Repositorien
- Verbesserung des logfileparser
2020 2020 neue REST-API und Oberfläche
- Nachvollziehbarkeit
13. Anreicherung der Logfiles
• markieren jeder Logzeile durch eine UUID
• Anreicherung mit statitikrelvanten
Informationen
• ID der Publikation, Art des Zugriffs, SessionID
• Textdatei (.epusta.log)
16. Motivation Usage Statistics in
OpenAIRE
• Monitoring und Analyse über Nutzungsereignisse in OA-
Repositorien
• Mehrwertdienst als Teil eines paneuropäischen
Forschungsinformationssystems
• Akkumulation von Nutzungszahlen über Dokumente, die in
mehreren Quellen vorliegen
• Dank Metadaten-Deduplizierung
• Generierung der Nutzungsstatistiken nach COUNTER CoP
R4 bzw. R5
• Bereitstellung der Statistiken unter CC0 Lizenz
• Beschreibung des Dienstes in den OpenAIRE Usage
Statistics Guidelines, https://openaire.github.io/usage-statistics-guidelines/
18. Workflows zur Aggregation von
Nutzungsereignissen in OpenAIRE
Metadata-Index
UsageStatistics-DB
● Repository
● CRIS
● eJournal
● National Statistics
Node
● Publisher
PULL
COUNTER Report
PUSH
tracked
event
IP-Anonym.
processing script
processing script
19. In vier Schritten zum
Nutzungsstatistik-Dienst
• Voraussetzung: Registrierung des Repositories
im Contentprovider-Dashboard
1. Download des generischen Matomo Usage
Activity Tracker (https://github.com/openaire/Generic-Matomo-Tracker)
2. Konfiguration, z.B. Matomo-SiteID für die
eigene Quelle
3. Installation
4. Test und Validierung durch OpenAIRE
23. Mögliches Migrationsszenario OAS
nach OpenAIRE Usage Statistics
• Betrifft bestehende OAS-Kunden; historische
Nutzungszahlen sollen nicht verloren gehen
1. Abruf via OAS-API bzw. Bereitstellung eines Dumps
der in OAS generierten COUNTER Reports (als CSV,
XML oder JSON)
2. Ggf. Transformation der OAS-COUNTER Reports in das
SUSHI-Lite Schema
3. (semi)automatischer Import in OpenAIRE-Usage
Statistics DB
24. Open Research Analytics Service
• OAS Nachfolger, Knowledge Unlatched zusammen mit OpenAIRE (und OpenAPC)
25. Wieso ORAS?
• Offene Infrastruktur zur Verbesserung der Interoperabilität
von Nutzungsdaten und Analysemöglichkeiten von
Repositorien
• Zusammenführung mehrerer, unterschiedlicher Datenquellen
(OpenAIRE metadata, OpenAPC, etc.)
• Zunächst Fokus auf die Integration von Nutzungsdaten von
OpenAIRE-Repositorien und die Entwicklung der ORAS Public
API.
26. Wieso ORAS?
Researcher
• Wie viele Downloads hat mein Artikel auf dem Repository?
Wie sieht das im Vergleich zu anderen Artikeln aus?
Repository Manager
• Wie kann ich die Einlagenrate meiner Forscher erhöhen? Wie
hoch ist die Rate und Nutzung meiner IR-Einzahlung im
Vergleich zu anderen IRs im Land?
Bibliotheksleitung
• Sind unsere Gold- und Hybridartikel auch im Repository
hinterlegt? Werden teurere Gold Open Access auch vermehrt
von unseren Kunden genutzt?
27. Reporting to researchers
• Stellen Sie den Forschern mit wenigen Klicks Berichte zur
Verfügung, die den Forschern Einblicke in die Verwendung
ihrer hinterlegten Gegenstände geben
28. Benchmarking IR to IR managers
• Wie kann ich die Einlagenrate meiner Forscher
erhöhen? Wie hoch ist die Rate und Nutzung
meiner IR-Einzahlung im Vergleich zu anderen
IRs im Land?
Total Usage
15th
of 160 DE repositories
No. of Items
50th
of 160 DE repositories
Deposit Rate
10th
of 160 DE repositories
Repository Benchmarking
29. OpenAPC and IR integration
• Sind unsere Gold- und Hybridartikel auch im
Repository hinterlegt? Werden teurere Gold
Open Access auch vermehrt von unseren
Kunden genutzt?
OpenAPC Benchmarking
Total APC paid in 2019
15th
of 160 DE institutions
No. of Items in 2019
4th
of 160 DE institutions
Deposit Rate APC Items
15th
of 160 DE institutions
30. Wie funktioniert ORAS?
• Nahtlose Integration mit OpenAIRE-konformen
Repositories (via SUSHI lite) und OpenAPC
• Anbindung anderer Nutzung Datenquellen
(COUNTER reports, Google Analytics, etc.)
• Beginnen Sie mit der Analyse und dem
Reporting.
31. International Community
Knowledge Unlatched
InstitutionInstitutionInstitution
Open Research
Analytics
(Membership
Interface)
Sustainable funding (Membership)
OpenAIRE OpenAPC Open Analytics
Advisory Board
Other third-Party
Integrations
Public Roadmap
Usage Data Trans. Data Interface
Funding flows to all projects to
maintain + expand scope and
features (roadmap)
Public Open Database (CC 0 licence)
32. Mitgliedschaftsmodell Deutschland
• Freemium Model
• Basic (OpenAIRE-only) = free
• Membership (ORAS) = setup fee (1.500 EUR) + annual fee (1.250 EUR p.a.)
• Vorteile einer Mitgliedschaft:
• 2019Q1 Zugriff auf Repository Nutzungsdaten nach COUNTER, generiert durch
OpenAIRE
• Entwicklung neuer analytischer Anwendungsfälle auf Basis von Open Repositories
als Teil einer internationalen Community.
• Generierung von Nutzungsreports für die eigene Einrichtung / Fakultäten;
Stimulierung einer verstärkten Nutzung des Repositories und Erhöhung der Zahl
von (Open Access) Deposits.
• Zugriff auf IR-Benchmarking-Berichte auf Basis unterschiedlicher Dimensionen
33. Roadmap
• Bis zum 1. Dezember Interesse anmelden (pledge),
um einen reibungslosen Zugang im ersten Quartal
2019 zu gewährleisten:
• Umstellung von GBV auf Open Research Analytics
(inklusive OpenAIRE usage data)
• OpenAIRE Metadaten-Aggregationsdienst
• Registrierung über OpenAIRE Content Provider-
Dashboard
• Registriere Interesse am Mitgliedschaftsmodell hier:
• https://app.knowledgeunlatched.org/ku-
partners/knowledge-unlatched/open-research-analytics