Georg Rehm. EPUB, quo vadis? ePublishing im W3C. Jahrestagung der IG Digital. Im Rahmen der Buchtage, Jahreskongress des Börsenvereins, Berlin, Germany, June 2017. June 14, 2017. Invited talk.
2. Das World Wide Web Consortium
} Internationale, durch Mitglieder finanzierte non-profit
Organisation, die Standards entwickelt
} 1994 gegründet von Sir Tim Berners-Lee
} 470+ Mitglieder – 26 in Deutschland/Österreich
} 80 Mitarbeiter (ERCIM, MIT, UKeio, UBeihang)
} 20 Büros in wichtigen Regionen
} Open Web Platform, HTML5, Digital Publishing, Automotive,
Web of Things, Web Payments, Web Security, Linked Data
2
http://w3.org Ÿ http://w3c.de
3. Struktur des W3C
} Vier Host-Organisationen als legale Repräsentanz des W3C
} USA: MIT
} Europe: ERCIM (Frankreich)
} Japan: Keio Universität
} China: Beihang Universität
} W3C-Team: Koordination der technischen Arbeit; Verwaltung
} W3C-Mitglieder: machen die eigentliche technische Arbeit
und Standardisierung; geben Impulse für zukünftige Themen
} W3C-Büros: Etwa 20 Kontaktpunkte zu regionaler Industrie,
Forschung, Verwaltung, Standardisierung
3
4. Das W3C-Büro DE/AT
} Aufgaben
} Mitgliederbetreuung
} Kommunikation
} Politik und Verwaltung
} Forschung
4
1. Altova GmbH (Österreich)
2. Bundesverband Digitale Wirtschaft (BVDW)
3. DALIM Software GmbH
4. Deutsche Nationalbibliothek (DNB)
5. Deutsche Telekom AG
6. DFKI GmbH
7. Eccenca GmbH
8. Forschungszentrum Informatik (FZI)
9. Fraunhofer Gesellschaft
10. Harting KGaA
11. Hochschulbibliothekszentrum des Landes NRW
12. IoT Connctd GmbH
13. Institut für Rundfunktechnik GmbH (IRT)
14. Opendi AG
15. Optile GmbH
16. PONS GmbH
17. RWE AG
18. SAP SE
19. Siemens AG
20. Software AG
21. TU Berlin
22. Unify GmbH & Co. KG
23. Universität Leipzig
24. Viacom
25. Volkswagen AG
26. Wirtschaftsuniversität Wien (Österreich)
5. Digitales Publizieren
} Digital Publishing Activity im W3C seit 2013
} https://www.w3.org/blog/dpub/2013/07/
} Internationale Mitglieder
} Z.B.: Adobe, Antenna House, Apple, Benetech, Book Industry
Study Group, DAISY Consortium, EDRLab, Elsevier, Google,
Hachette Livre, IDFP, Monotype, Pearson, Stanford University,
Vivliostyle, Wiley
} Treffpunkt für Verlagswelt und Webindustrie
} Neue Entwicklungen mit Relevanz für digitales Publizieren
werden vermehrt in der Webcommunity thematisiert
5
6. Publishing@W3C – W4
} Vier Aspekte:
} Wo, d.h. welche W3C-Gruppen umfasst Publishing@W3C?
} Wer, d.h. wer nimmt teil bzw. kann wie teilnehmen?
} Was, d.h. woran wird die Initiative arbeiten?
} Wann, d.h. was ist die grobe Zeitlinie der Aktivitäten?
6
8. W3C-Gruppen im Überblick
8
Community
Groups
Accessible SVG
Blockchain
Scholarly HTML
EPUB3
Color on the Web
Math on Web Pages
PublishingAutomotive
Web and Broadcasting
Web Based Signage
Business
Groups
A11y Guidelines
Internationalization
CSS
Web Platform
SVG
Web Security
DPUB
Working/Interest
Groups
Annotation
Audio
9. W3C-Gruppen im Überblick
9
A11y Guidelines
Internationalization
CSS
Web Platform
SVG
Web Security
DPUB
Working/Interest
Groups
Annotation
Audio
} Strikte Satzung (Charter)
} Einrichtung erfolgt durch
Mitgliederabstimmung
} W3C-Mitglieder nehmen teil
} W3C-Team nimmt teil
} Nur Working Groups können
W3C-Standards publizieren
(W3C Recommendations)
} IPR-Schutz der Resultate
Ca. 50 Gruppen
10. W3C-Gruppen im Überblick
10
Community
Groups
Accessible SVG
Blockchain
Scholarly HTML
EPUB3
Color on the Web
Math on Web Pages
} Locker formulierte Mission
} Alle Interessenten können eine
CG einrichten, es werden nur
fünf Unterstützer benötigt
} Beliebige Personen können
kostenfrei teilnehmen
} W3C-Team nimmt in CGs
typischerweise nicht teil
} Kann Spezifikationen
veröffentlichen, diese sind
jedoch keine offiziellen W3C-
Recommendations
Ca. 270 Gruppen
11. W3C-Gruppen im Überblick
11
PublishingAutomotive
Web and Broadcasting
Web Based Signage
Business
Groups
} Wie Community Groups, konzentrieren sich jedoch auf
spezifische Industrien bzw. Sektoren
} Teilnehmer: W3C-Mitglieder oder Business Group-Mitglieder
(Teilnahme kostet eine geringe Gebühr)
} Kann Spezifikationen veröffentlichen, diese sind jedoch
keine offiziellen W3C-Recommendations
Vier Gruppen
12. Publishing im W3C
12
Community
Groups
EPUB 3
Community Group
Publishing
Business Group
Business
Groups
Publishing
Working Group
Digital Publishing
Interest Group
Working/Interest
Groups
13. Publishing im W3C
13
Community
Groups
EPUB 3
Community Group
Publishing
Business Group
Business
Groups
Publishing
Working Group
Digital Publishing
Interest Group
Working/Interest
Groups
Neu!
14. „Wo“: Publishing Business Group
} Chairs: Rick Johnson (VitalSource), Paul Belfanti
(Ascend), Cristina Mussinelli (Associazione Italiana Editori)
} Baut Brücken zwischen den Communitys (IDPF ó W3C)
} Konzentriert sich auf Business-Aspekte
} Treibt Charters von Gruppen voran
} Beaufsichtigt die Arbeit der EPUB 3 CG
} Planung der Strategie, z.B. zur Zukunft von EPUB3
} Business Group hat Lenkungskreis
} Mitglieder werden gewählt
} Besteht initial aus dem IDPF Board of Directors
14
16. „Wo“: EPUB 3 Community Group
} Chairs: Dave Cramer (Hachette Livre),
Rachel Comerford (Macmillan Learning)
} Community Group – so offen wie möglich
} Technische Arbeiten zu EPUB 3.1, z.B.
} Aktualisiert die „EPUB for Education“ Profile für EPUB 3.1
} Korrekturen an und für EPUB 3.1 (evtl. Neuveröffentlichung)
} Exploriert Möglichkeiten zur Pflege des EPUB Checker,
Test-Suite für EPUB-Reader, EPUB 3-Beispiele
} Sonstige relevante Arbeiten
} z.B., Neuveröffentlichung von EPUB 3.1 als ISO-Standard
16
18. „Wo“: Digital Publishing IG
} Chairs: Garth Conboy (Google), Tzviya Siegman
(John Wiley & Sons., Inc.)
} Baut(e) Brücken zwischen den Communitys
} Seit einigen Jahren aktiv, hat Reports publiziert, zu
DPUB ARIA und mit der CSS WG gearbeitet etc.
} Hatte großen Einfluss auf die technischen Aspekte
der Digital Publishing WG Charter
} Charter läuft im Oktober 2017 aus
} Wird wegen der Working Group wohl nicht erneuert
18
19. „Wo“: Publishing WG
} Working Group kürzlich gegründet (9. Juni 2017)
} Chairs: Garth Conboy (Google), Tzviya Siegman
(John Wiley & Sons., Inc.)
} Umfangreiche Charter – läuft bis 1. Juli 2020.
} Testing spielt eine wichtige Rolle
} Erstes Meeting der WG in New York nächste Woche
} Nicht nur digitale Bücher, sondern arbiträre digitale
Publikationen (Journale, Artikel, Proceedings etc.)
19
20. „Wo“: Publishing WG – Charter
} Web Publications mit all ihren Spezifika und Traditionen
sollen „first-class entities“ im Web werden
} WG wird alle notwendigen Technologien auf Basis der
Open Web Platform spezifizieren, um traditionelles
Publishing und World Wide Web zu kombinieren
} Wichtige Themen: Barrierefreiheit, Usability, Portabilität,
Distribution, Archivierung, Offline-Zugriff, Verlinkung.
} EPUB4 als Profil von Web Publications (Accessibility)
} Version 2 des ARIA Vokabulars für Digital Publishing
} Version 1 (Candidate Recommendation) wurde erstellt
von der Digital Publishing IG und der ARIA WG
20
23. Publishing@W3C Gruppen
23
Publishing Business Group
Steering Group
(gewählt)
Publishing
Working Group
Digital Publishing
Interest Group
EPUB 3
Community Group
AufsichtStrategische Ausrichtung für
Publishing@W3C
Entwicklung von Standards, um
Publikationen zu „first class entities“
im World Wide Web zu machen
EPUB 3.1 bezogene,
technische Aktivitäten
Diagramm inspiriert von Murata Makoto
Brückenbildung zwischen
den Communitys
24. Publishing@W3C Gruppen
24
Publishing Business Group
Steering Group
(gewählt)
Publishing
Working Group
Digital Publishing
Interest Group
EPUB 3
Community Group
Leitete das Chartering
Technischer Input
zur Charter
Diagramm inspiriert von Murata Makoto
W3C Advisory Committee
Finale Abstimmung der Charter
25. „Wer“: Teilnehmer der Gruppen
25
} Digital Publishing Interest Group: 107
} EPUB3 Community Group: 130
} Publishing Business Group: 67
} Publishing Working Group: 31
(existiert seit 9. Juni 2017)
26. IG CG BG WG Summe
<Ohne Affiliation> – 28 5 – 33
DAISY Consortium 6 6 3 6 21
VitalSource | Ingram Content Group 3 8 2 4 17
Hachette Livre 6 3 3 2 14
Vivliostyle Inc. 6 2 2 – 10
Pearson plc 6 1 2 – 9
University of Illinois at Urbana-Champaign 4 1 – 4 9
Wiley 4 1 3 1 9
Google, Inc. 3 2 1 2 8
Apple, Inc. 4 3 – – 7
Book Industry Study Group 3 1 2 1 7
EDRLab 2 1 2 2 7
NIC.br - Brazilian Network Information Center 2 – 2 3 7
Voyager Japan, Inc. 2 4 1 – 7
Educational Testing Service 2 2 – 2 6
Penguin Random House – 4 – – 6
Beyond Perspective Solutions ltd 4 – – – 4
C-DAC 4 – – – 4
Department of Information Technology, Government of India 4 – – – 4
MITRE Corporation 3 1 – – 4
W3C 4 – – – 4
Adobe 3 – – – 3
Benetech 1 1 – 1 3
Bookwire GmbH – 2 1 – 3
27. Teilnahme in Gruppen
} Community Groups:
} Interessierte Personen können kostenfrei teilnehmen
} Working Groups und Interest Groups:
} Teilnahme von W3C-Mitgliedern
} W3C-Mitglieder können beliebig viele Teilnehmer schicken
} Business Groups:
} Teilnahme von W3C-Mitgliedern oder
} speziellen „Business Group“-Mitgliedern; geringere
Gebühr als volle Mitgliedschaft (gilt nur für BG)
27
28. IDPF und Publishing@W3C
} (Ehemalige) IDPF-Mitglieder können W3C schrittweise bei-
treten – TPI-Mitgliedschaft (Transitional Publishing Industry)
} Ähnliche Gebührenstruktur wie seinerzeit bei IDPF
} Gilt für Publishing Business Group und Publishing Working Group
} Und natürlich für die EPUB3 Community Group (ohnehin kostenfrei)
} Kein spezielles Setup für die Digital Publishing IG
} Digital Publishing Interest Group läuft 2017 aus.
} Die genannte Übergangsphase dauert zwei Jahre.
28
30. „Was“: Web Publikationen
} Ziel: Publikationsinhalte in einen Browser oder Lesegerät
laden, abhängig von den Präferenzen der Nutzer
} Ziel: Ein Buch offline oder online lesen
} Ziel: Authoring der Inhalte sollte unabhängig vom
Nutzungskontext sein
30
Ziel: Publikationen – mit all ihren Spezifika und Traditionen –
sollen „first class entities“ im Web werden.
31. Beispiel: Buch im Browser,
sichtbar offline und online
31
http://dauwhe.github.io/epub-zero/acme-publishing/
32. Beispiel: Buch im Browser,
sichtbar offline und online
32
https://hpbn.co/
33. Noch experimentelle Beispiele!
} Nutzung brandneuer Browser-Technologien
} Aktuell noch manuell kodiert via Javascript, Service-
Worker und Manifest-Dateien.
} Wenn der Browser auf das Buch per URL zugreifen
möchte, erkennt der im Browser laufende Service-
Worker den HTTP-Request und liefert einen Teil des
beim ersten Zugriff angelegten Buch-Cache aus.
} Viele Details müssen noch geklärt werden.
} Publishing-, Browser- und Web-Technologien
müssen aligniert werden!
33
34. Ziel: Konzept einer „Publikation“,
die aus vielen Ressourcen besteht
} Eine Publikation kann aus vielen Ressourcen
bestehen (Text, Bilder, Videos, etc.)
} Im Web sind diese verlinkt, behalten jedoch ihre
völlige Unabhängigkeit
} Für das Publizieren eines abstrakten Werks sollte es
eine einzige, konzeptuelle Einheit im Web geben:
} Die Web Publication (WP)
34
35. Warum brauchen wir WPs?
} Integrität der Publikation als Ganzes muss gewährleistet
sein (z.B. in einer juristischen Publikation)
} Geschäftsmodelle im Bereich Publishing und
Bibliotheken basieren auf dem Konzept „Werk“
} Zähler für Einheiten (Kapitel, Abschnitte, Fußnoten etc.)
sollten über Publikationen hinweg konsistent sein
} Jede Such-, Textanalyse, IR-Anwendung sollte Zugang
zur vollständigen Publikation haben
} Nutzerpräferenzen sollten sich auf das gesamte „Werk“
beziehen und nicht nur auf einzelne Webseiten
35
36. Was bedeutet dies für das Web?
} Das Web basiert derzeit auf
dem Ansatz einzelner
Ressourcen:
} HTML-Quelltext, Metadaten,
CSS-Stylesheets, etc.
} Jede Ressource besitzt ihre
eigene URL
} Das Rendering basiert auf
dem Zusammenspiel der
Ressourcen
36
blockquote.quote
{
URL des
Contents
URL der
Metadaten
URL des
Bildes
<section>
<h1>Introduction</
h1>
<p>We dream of a
world where books,
and indeed all
kinds of
publications, are
first-class
citizens of the
web. </p>
…
“metadata” : {
“dc:title”: “WP”,
“dc:creator”: [
“Markus
Gylling”,
“Tzviya
Siegman”,
“Dave Cramer”,
…
37. Was bedeutet dies für das Web?
} WP als Sammlung von
Web-Ressourcen,
betrachtet als eine
einzelne Web-Ressource
} Es gibt also eine eindeutige
Webadresse für diese
Kollektion von Ressourcen
} Webpublikationen sind
Teil des Web!
37
blockquote.quote
{<section>
<h1>Introduction</
h1>
<p>We dream of a
world where books,
and indeed all
kinds of
publications, are
first-class
citizens of the
web. </p>
…
“metadata” : {
“dc:title”: “WP”,
“dc:creator”: [
“Markus
Gylling”,
“Tzviya
Siegman”,
“Dave Cramer”,
…
URL der Webpublikation
38. „Was“: Einige Bestandteile der Charter
} Spezifikation – Was ist eine Webpublikation?
} Erstellung eines formalen Konzepts
} Metadaten, Manifest, etc., kompatibel mit Webtechnologien
} Sollte von allen Browsern und Lesegeräten unterstützt werden
} Packaged Web Publication
} Ein (oder mehrere?) Web Packaging Formate – Charakteristika
} EPUB 4
} Eine Art Profil von Web Publications mit zusätzlichen Anforderungen
(z.B. für Barrierefreiheit)
} Ziel: Reduktion der Inkompatibilitäten mit EPUB 3
38
40. Was ist schon getan worden?
} Die Digital Publishing Interest Group existiert seit
vier Jahren, die Charter läuft bis 1. Oktober 2017
} Die EPUB 3 Community Group und die Publishing
Business Group sind gestartet (seit Februar 2017)
} Die Publishing Working Group ist am 9. Juni 2017
gestartet
40
41. Events 2017 und 2018
} Publishing BG Meeting, London, 13. März
} Buchtage – IG Digital Session, Juni, jetzt J
} PUB WG Meeting, New York City, Juni
} Outreach, Frankfurter Buchmesse, Oktober
} W3C TPAC 2017 mit PUB BG/WG Meeting,
Burlingame (Kalifornien), November
} W3C Publishing Strategie Summit, Burlingame,
November
} W3C AC 2018, 14./15. Mai, Berlin
41
42. 42
Publikationen im Web – gepackt und
auch für Offline-Nutzung – nutzen die
gleiche technologische Architektur, in
der die gleichen Tools und Technologien
anwendbar sind.
Anforderungen an Publishing werden
durch die Open Web Platform
vollständig unterstützt und zwar sowohl
für Online-Webseiten als auch für
Container-Publikationen (packaged
publications).
43. Publishing im W3C
} Publishing im W3C Landing Page:
} http://www.w3.org/publishing/
} Publishing Working Group:
} https://www.w3.org/publishing/groups/publ-wg/
} EPUB 3 Community Group:
} https://www.w3.org/community/epub3/
} Publishing Business Group:
} https://www.w3.org/community/publishingbg/
} Digital Publishing Interest Group:
} https://www.w3.org/dpub/IG/
} Web Publication (Draft Interest Group Note):
} http://w3c.github.io/dpub-pwp/
43