DPR THINK TANK
22/29

EPUB4, Web Publications, Readium, Books in Browsers –

die Zukunft des digitalen Lesens?

Erscheinungstermin: Juli 2018

Seit dem Aufgehen des IDPF im World Wide Web Consortium (W3C) bekommt die Diskussion um die Zukunft des E-Book wieder deutliche Dynamik, nachdem die Entwicklung der letzten 2-3 Jahren in diesem Bereich nicht gerade von großen Innovationen geprägt war. Auch der Börsenverein des Deutschen Buchhandels zeigt mit seinem jüngst vollzogenen Beitritt zum W3C ein deutliches Bekenntnis zu den offenen E-Book-Formaten, die in dieser Organisation gepflegt und weiterentwickelt werden. 

Mit den hier jüngst veröffentlichten ersten Entwürfen für EPUB4, die Weiterentwicklung des wenig verbreiteten EPUB3-Formates und den parallel dazu diskutierten „Web Publications“ geht die Diskussion in eine spannende Richtung: Das digitale Lesen wird wohl in Zukunft deutlich mehr als bisher im Browser stattfinden. 


EPUB4 und Web Publications: Das Zwillingsgespann der Formate für das digitale Lesen der Zukunft

Während die aktuellen Dateiformate für eBooks wie EPUB3, 3.1 und 3.2 mit ihrer Architektur als ZIP-basierte Container-Formate ihren Ursprung in der Offline-Welt nicht verheimlichen können, ist die natürlich Heimat der nächsten Generation eBooks nach dem Willen des W3C das Web: Die Web Publications als Nachfolger werden wie Websites unter URLs gehostet und über den Browser aufgerufen, stellen also „nur noch“ eine Art Sonderfall einer Webserver-Anwendung dar. 

Dafür sind allerdings einige konzeptionelle und technische Schritte notwendig, um in sich geschlossene Publikationen in einem Browser sinnvoll zu behandeln:

  • Alle Publikationsinhalte teilen sich eine gemeinsame Web-Adresse oder URL, unter der sie aufgerufen werden (im Gegensatz zum Seitenbasierten Prinzip, das URLs bisher verfolgen).
  • Alle Publikationsinhalte müssen mit identischen Publikations-Metadaten behandelt werden.
  • Validierung und Integritätsprüfung müssen für eine Publikation als Ganzes gelten, nicht nur für einzelne Seiten.
  • Publikationselemente wie Kapitelstrukturen, Fussnoten/Endnoten, Referenzen und ihre Zählung sollten sinnvollerweise über eine ganze Publikation hinweg konsistent sein.
  • Indexierung und Suche finden nicht auf Seiten-Basis, sondern für eine ganze Publikation statt – genauso wie sich Nutzereinstellungen (z.B. für Layout) sinnvollerweise auf das ganze „eBook“ vererben sollten.
  • Nicht zuletzt müssen Browser deutlich dazulernen, was Layout und Design von Publikationsinhalten angeht – insbesondere was die Details von Paginierung, Seiten-Umbruch-Logiken und eine stimmige Positionierung von Reflow-Inhalten angeht.

Alle diese Rahmenbedingungen sind in den aktuellen Webstandards noch nicht ohne weiteres gegeben – Browser werden hier noch vieles lernen müssen, bis sie eBooks und andere Korpus-Publikationen mediengerecht darstellen können. An dieser Stelle setzt die Standardisierung des W3C an, um den Anspruch zu erfüllen, Publikationen wie eBooks zu „first class citizens“ des Netzes zu machen.

Aber selbst dem Web-affinsten W3C-Mitarbeiter ist klar, dass Offline-Szenarien auf lange Zeit nicht vermeidbar sind – deswegen werden die Web Publikations von vorneherein mit EPUB4 als „Geschwisterformat“ konzipiert, dass ähnlich wie die aktuellen EPUB-Generationen eine Nutzung als in sich geschlossenes Containerformat erlaubt. Die beiden Format-Varianten stellen dabei quasi zwei verschiedene Aggregatzustände desselben Content dar:

Identischer Content in verschiedenen „Aggregatzuständen“: als Web Publication für die Online-Nutzung, als EPUB4 für die Offline-Nutzung.

Neben hohen Anforderungen an Themen wie Barrierefreiheit, Internationalisierung und Abwärtskompatibilität zu EPUB2/3 stehen daneben auch noch Themen wie Langzeit-Archivierung, Authentifizierung von Content-Änderungen und Streaming-Fähigkeit mit auf der Agenda der W3C-Arbeitsgruppen – keine einfache Aufgabe für die nächsten Jahre. Aber wenn sich auf diese Weise eine Konvergenz von Offline- und Online-Lesen erreichen lässt, ist dies sicher die Anstrengung wert.

Das Readium-2-Projekt: Referenz-Implementierung für EPUB und die nächste Generation der eBook-Formate

Eine der Haupt-Projekte rund um EPUB ist aktuell die Entwicklung von Readium 2: Als Nachfolger des Readium-Projektes im IDPF ist das Ziel dieses Projektes der französischen Organisation EDRLab, ein quelloffenes Framework für die Implementierung von Lese-Apps und Online-Applikationen für EPUB zur Verfügung zu stellen. Innerhalb relativ kurzer Zeit hat das EdrLab hier erstaunliche Fortschritte gemacht. Über die Projekt-Plattform des EDRLab lassen sich folgende Projekte verfolgen:

  • Das Readium SDK als Baukasten-System von Software-Bibliotheken für den Einsatz in EPUB-Reader-Applikationen hat mittlerweile einen hohen Reifegrad erreicht und deckt alle wesentlichen Funktionen fürs digitale Lesen ab. Die Bibliotheken stehen quelloffen zur Verfügung und können von jedem Interessierten eingesetzt werden. Es stehen dabei auch Implementierungen in Web-Applikations-Sprachen wie TypeScript oder Go zur Verfügung, damit das SDK auch zur Erstellung von Browser-basierten EPUB-Readern und Server-Applikationen genutzt werden kann.
  • Als Referenz-Implementierungen von Readium 2 stehen sowohl Desktop-Applikationen als auch Mobile-Apps für iOS und Android zur Verfügung, die kostenlos getestet werden können. Während die Mobile-Apps nur als Test-Applikationen für das Software-Framework dienen, hat die Desktop-Applikation den Anspruch, eine marktfähige Anwendung für Endkunden zu werden.
  • Mit Readium LCP wird ein neuartiges DRM-System zum Copyright-Schutz von eBooks entwickelt. Im Gegensatz zu den verfügbaren Systemen steht dieses System unter Open Source-Lizenz, eBook-Plattformen sind beim Einsatz insofern nicht mehr an Anbieter wie Adobe oder Sony gebunden.
  • Nicht zuletzt wird im Projekt mit dem Readium CSS ein solides Standard-CSS für das EPUB-Rendering entwickelt, das eine verlässliche Basis für die Darstellung auch komplexer oder fremdsprachiger Texte darstellen wird. Vor allem wird hier erstmals ein öffentliches und gut dokumentiertes Standard-CSS für EPUB-Reader geschaffen, das die Kombination von Verlags-Layouts und Nutzer-Einstellungen auf verständliche Weise regelt – eine Aufgabe, an der Player wie Adobe, Amazon oder Apple bisher grandios gescheitert sind.

Diesem Projekt kann man nur großen Erfolg wünschen – eine unter Open-Source-Lizenz verfügbare Alternative zu den Lese-Applikationen von Adobe, Apple und Amazon wäre ein riesiger Gewinn für das digitale Lesen. Und durch seine hochmodulare Architektur ist Readium 2 optimal gerüstet, um auch neue Dateiformate wie EPUB4 oder die Web Publications innerhalb kürzester Zeit zu unterstützen.

Books in Browsers: Schon heute kein Problem mit Microsoft Edge

Schon früher war mit Browser-Plugins für Chrome oder Firefox das Lesen von EPUB-Dateien im Browser möglich. Seit neuestem bringen Windows-PCs aber die Leseumgebung gleich mit: Mit Edge hat Windows 10 inzwischen eine ausgesprochen intelligent implementierte Standard-Applikation für eBooks an Bord. Mit einer sehr standardkonformen und ausschließlich mit Web-Technologien realisierten Lese-Oberfläche bringt der Browser alles mit, was ein Kunde sich erwartet: responsive Darstellung, vielfältige Layout-Optionen, Suche und Notizen/Annotationen. Und über Cortana ist sogar eine einfache, aber funktionale Text-To-Speech-Engine mit integriert – die Qualität reicht natürlich bei weitem nicht an Hörbücher heran, zeigt aber (z.B. für Blinde und Sehbehinderte), welches Niveau bereits Out-of-the-box-Lösungen in diesem Bereich erreichen können. 

Leider ist die Anwendung aufgrund der vielen untereinander inkompatiblen DRM-Systeme auf DRM-freie eBooks beschränkt. Das Lesen DRM-freier eBooks auf Desktop-Geräten dürfte gerade in Deutschland nicht der allerhäufigste Use Case im Publikums-Markt sein – doch für das „Books in Browsers“-Modell ist hier ein erster Schritt getan. Dazu ist Edge für eBook-Produktioner ein spannendes Tool, weil darin die aus der Web-Entwicklung bekannten Web-Inspector- und Diagnose-Werkzeuge nun auch für EPUB verwendet werden können – im Testing und Debugging von EPUB-Dateien eine wertvolle Arbeitsunterstützung.



Fabian Kern 

ist bei smart digits Experte für digitale Workflows und Produktion. Er verfügt über mehrjährige Erfahrungen als Projektleiter in Medienunternehmen, u.a. in der Entwicklung digitaler Workflows, von Prozess-Designs und System-Architekturen, als Spezialist für XML-Datenhaltung und die integrierte Produktion von Print-Produkten und Online-Datenbanken zur E-Book-Erzeugung und Web-Technologien. Kern ist Dozent an der Akademie der Deutschen Medien und der LMU München.