Mais conteúdo relacionado PDF/UA Real Life Check 2016 | Eine Studie zum Stand der PDF-Barrierefreiheit auf den Internetseiten deutscher Bundesministerien1. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1
PDF Days Europe 2016
PDF/UA Real Life Check 2016
Eine Studie zum Stand der PDF-Barrierefreiheit auf den
Internetseiten deutscher Bundesministerien
Markus Erle
axes4
1
2. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
I | Ein paar Worte vorweg
■ Was wollten wir wissen?
■ Studiendesign
■ Welche Limitierungen haben wir bewusst in Kauf
genommen?
2
3. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
Was wollten wir wissen?
■ Wie ist der Stand der PDF-Barrierefreiheit am Beispiel der 14
Bundesministerien (Menge und Qualität barrierefreier PDF-
Dokumente)
■ Ist PDF/UA bei den deutschen Ministerien angekommen?
■ Ist PDF/UA erreichbar?
■ Welches sind die häufigsten PDF/UA-Probleme?
■ Wie lassen sich große Mengen an PDF-Dokumenten schnell und
effizient prüfen („Monitoring“) und damit eine gleichbleibende Qualität
sicherstellen?
■ Wie lassen sich Dokumente mit massiven Mängeln („schwarze
Schafe“) schnell identifizieren?
■ Wie lassen sich Erfolge im Bereich PDF-Barrierefreiheit messbar
machen und kommunizieren (nach innen und nach außen)?
■ Basis für Vergleiche zwischen Organisationen und Stand zu einem
bestimmten Zeitpunkt
3
4. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
Studiendesign
■ 14 Bundesministerien:
http://www.protokoll-inland.de/PI/DE/
RangTitulierung/AmtlicheReihenfolgen/Bundesministerien/
bundesministerien_node.html
■ Zeitraum: 1 Jahr: Alle PDF-Dateien, die Google Crawler für den
Zeitraum 01.05.2015 bis 30.04.2016 findet
■ Prüfkriteren: Alle Maschinen prüfbaren PDF/UA-Anforderungen
gemäß Matterhorn-Protokoll
■ Heuristische Auswertungen, um Indizien für eine ungeeignete
Semantik zu finden (erste Versuche)
■ Stichprobenmäßige Detail- und Plausibilitätsprüfungen zur
Sicherstellung der Datenqualität
■ Alle Dokumente sind dokumentiert mit Downloaddatum, URL und
Testergebnis
4
5. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
Limitierungen
■ Schnelles Prüfen großer Dokumentmengen muss sich auf
automatische Prüfungen fokussieren
■ Google Crawler findet nicht alle tatsächlich veröffentlichten PDF-
Dokumente im entsprechenden Zeitraum
■ Dokumente mit Parsingfehlern wurden übersprungen
■ Keine Berücksichtigung der textlichen Kennzeichnung nicht
barrierefreier PDF-Dokumente
■ Kein Überprüfen, ob Inhalte in einer alternativen zugänglichen Form
vorliegen (beispielsweise als HTML)
5
6. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
II | Ergebnisse
1. Grundlegende Zahlen
2. PDF-Dokumente mit Tags
3. PDF/UA-Qualität gemäß Maschinen-prüfbarer
Anforderungen
4. Einzelne PDF/UA-Anforderungen: Welche
Probleme treten am häufigsten auf?
5. Indizien für „Semantic Richness“
(Heuristische Auswertung)
6. 100% PDF/UA
6
7. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1| Grundlegende Zahlen
■ Anzahl der analysierten Dokumente
■ Dokumentkategorien nach Seitenumfang
■ Grundsprachen
7
8. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1 | Anzahl der analysierten PDF-Dokumente
■ …
8
9. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1 | Anzahl der analysierten PDF-Dokumente
■ …
9
3.279 analysierte
PDF-Dokumente
insgesamt
10. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1 | Dokumentkategorien nach Seitenumfang
Insgesamt
10
Seiten
11. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1 | Dokumentkategorien nach Seitenumfang
Nach Ministerien getrennt (1)
11
Seiten
12. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1 | Dokumentkategorien nach Seitenumfang
Nach Ministerien getrennt (2)
12
Seiten
13. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1 | Dokumentkategorien nach Seitenumfang
Nach Ministerien getrennt (3)
13
Seiten
14. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
1 | Grundsprachen
■ …
14
Deutsch: 45,83%
Englisch: 5,28%
Ohne: 48,09%
Sonstige: 0,80%
15. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
2| PDF-Dokumente mit Tags
■ Wieviele Dokumente weisen bereits Tags auf?
■ Gesamttendenz
■ Unterschiede zwischen den Ministerien
15
16. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
2 | PDF-Dokumente mit Tags (Gesamttendenz)
16
Mit TagsOhne Tags
17. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
2 | PDF-Dokumente mit Tags (pro Ministerium)
■ …
17
Zwischen 84,7% und 29,1%
der PDF-Dokumente weisen
Tags auf
18. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3| PDF/UA-Qualität
■ Wie verstehen wir PDF/UA-Qualität im Rahmen
dieser Studie?
■ Wie haben wir sie berechnet?
■ Gesamttendenz
■ Unterschiede zwischen den Ministerien
18
19. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | PDF/UA-Qualität (Konzept & Berechnung)
Konzept
■ Maschinen-prüfbare PDF/UA-Anforderungen
Algorithmus (pro Prüfpunkt und pro Dokument)
■ Wieviel % eines einzelnen Prüfpunktes sind erfüllt (dieser kann aus
einem Check oder aus vielen Checks bestehen)
■ Gewichtung eines Prüfpunktes für das Gesamtergebnis pro Dokument
gemäß Schwere der Barriere im Hinblick auf WCAG 2-Kriterien
■ Dynamischer Maximalwert als 100% (abhängig vom Dokument), da
nicht alle Prüfpunkte für jedes Dokument relevant sind
■ Die Kennzahl gibt den Restanteil nach Abzug der Strafpunkte in % an
(bezogen auf den Dynamischen Maximalwert)
19
20. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | Kennzahl für die PDF/UA-Qualität
Einschätzung
■ Letztlich sind 100% das Ziel:
Es ist ja nicht die finale Einschätzung der Barrierefreiheit, sondern nur
deren technische, Maschinen-prüfbare Basis
■ unter 95 können die Dokumente nicht als barrierefrei bezeichnet
werden
■ unter 90% weist das Dokument gravierende Barrieren auf: Übersetzt
heißt 90%, dass 10% der Informationen verloren gehen.
20
21. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | PDF/UA-Qualität (pro Ministerium)
21
Die durchschnittliche PDF/UA-Qualität
liegt zwischen 92,7 und 65,1
22. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | PDF/UA-Qualität (Gesamttendenz)
22
Als Gesamtdurchschnitt über alle
Ministerien ergibt sich eine PDF/UA-
Qualität von 78,9
23. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | Was bedeutet 80% Qualität?
23
Stellen wir uns eine Hängebrücke mit 100 Latten vor …
Diese entsprechen 100%.
24. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | Was bedeutet 80% Qualität?
24
80% bedeutet, dass jede 5. Latte fehlt.
25. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | Was bedeutet 80% Qualität?
25
Die Verteilung der Lücken könnte jedoch auch anders sein …
26. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | Was bedeutet 80% Qualität?
26
Noch größer wird die Lücke, wenn die 20% am Stück fehlen …
Vertrauen Sie dieser Brücke noch?
27. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
3 | Vergleich Tags & PDF/UA-Qualität
27
PDF mit Tags PDF/UA-Qualität
Offensichtliche Korrelation zwischen
Anteil an PDF mit Tags und PDF/UA-
Qualität
28. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4| Einzelne PDF/UA-Anforderungen
■ Welches sind die häufigsten PDF/UA-Probleme?
■ PDF/UA-Probleme-Profile
■ Typische Fehler für bestimmte Organisationen
identifizieren (die auf Prozessfehler hinweisen)
28
29. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
29
Rangliste| Nicht erfüllt in %
30. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
30
Rangliste| Warnungen in %
31. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
31
PDF/UA-Identifier | Nicht erfüllt in %
32. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
32
Figure has Bbox | Nicht erfüllt in %
33. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
33
Figure has Alt Text | Nicht erfüllt in %
34. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
34
Sprache für Lesezeichen ist festgelegt | Nicht erfüllt in %
35. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
35
Erste Überschrift ist ein H1 Tag | Nicht erfüllt in %
36. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
36
Caption Tag | Nicht erfüllt in %
37. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
37
Accessible Encrypton Settings | Nicht erfüllt in %
38. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
4 | Einzelne PDF/UA-Anforderungen
38
THead Tag & TBody Tag | Nicht erfüllt in %
39. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
5| Indizien für „Semantic Richness“
■ Anzahl der getaggten Wörter im Vergleich zu
Artefakten
■ Anzahl Tags (außer Containerelemente und Span)
im Vergleich zu Formatierungsänderungen
39
40. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
5 | Anteil getaggter Wörter vs Artefakte in %
■ …
40
Potenzielles Indiz für ein „schwarzes Schaf“:
ein Wert von exakt 100 oder ein Wert unter 70.
41. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
5 | Anzahl Tags vs Formatierungsänderungen
41
In der Regel bewegt sich dieser Wert
zwischen 1 und -1 wie beispielsweise bei
fast allen Dokumenten dieses
Diagrammausschnittes.
42. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
5 | Anzahl Tags vs Formatierungsänderungen
42
Potenzielles Indiz für ein „schwarzes Schaf“:
ein hoher negativer Wert wie beispielsweise
beim ersten Dokument dieses
Diagrammausschnittes (-16)
43. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
6| 100% PDF/UA
■ Wieviele Dokumente erfüllen bereits alle
Maschinen-prüfbare PDF/UA-Anforderungen?
43
44. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
6 | 100% PDF/UA
■ …
44
45. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
III | Fazit und Ausblick
■ Zusammenfassung der wichtigsten Ergebnisse
■ Ausgangsfragen aufgreifen
■ Neue Möglichkeiten, die sich eröffnen
45
46. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
Fazit
■ Stand der PDF-Barrierefreiheit
Große Unterschiede zwischen den Ministerien
Maschinen-prüfbare PDF/UA-Qualität insgesamt unter 80%
(Ziel wäre: >95%)
■ Ist PDF/UA angekommen? Ist PDF/UA erreichbar?
Ja, es werden bereits 0-Fehler-Dokumente umgesetzt
■ Die häufigsten PDF/UA-Probleme
Nicht vollständig getagged, fehlende Auszeichnung als Artefakte,
Fehlender PDF/UA-Identifier, Fehlende Bbox, … weisen auf mangelhafte
Werkzeuge hin. Ließe sich relativ einfach beheben.
■ Effizientes Monitoring & „Schwarze Schafe“ schnell identifizieren
Typische Fehler und besonders fehlerhafte Dokumente schnell erkennbar
■ Fortschritte messbar machen & Basis für Vergleiche
Monitoring-Technologie bietet Möglichkeit von regelmäßigen Erhebungen,
um den Stand der PDF-Barrierefreiheit und eventuell erzielte Fortschritte
zu quantifizieren und zu visualisieren
46
47. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
Ausblick
Außenperspektive
■ PDF/UA sichtbar machen (und auch diejenigen, die den DIN-/ISO-
Standard bereits erfüllen)
■ Regelmäßiger PDF/UA Real Life Check für ein Ranking von
Institutionen und Organisationen
Innenperspektive
■ Effizientes internes PDF/UA-Monitoring
(als wesentlicher Baustein der Qualitätssicherung)
■ Typische PDF/UA-Fehler über eine beliebige Dokumentmenge lassen
sich schnell identifizieren
■ Ansatzpunkte für Optimierungen von Prozessen und Werkzeugen
■ Kombinierbar mit Lösungen zum Dokumentenmanagement
47
48. A PDF Association Presentation · © 2016 by PDF Association · www.pdfa.org
www.pdfa.org
2016-06-14
Markus Erle
axes4
48
PDF Days Europe 2016
Danke! Fragen?
Kontakt: m.erle@axes4.com
Internet: www.axes4.com
Twitter: @axespdf
48