Kaufen | Unternehmen | 

6. Ausblick: PDF/A in der Zukunft

Die Zukunft beginnt jetzt 1)

PDFs sind ungemein praktisch, und ihre Nützlichkeit in den unterschiedlichsten Einsatzgebieten dürfte kaum zu bestreiten sein. Über inzwischen 14 Jahre „erwachsen“ geworden, liegen das PDF-Format wie auch die zu seiner Verwendung erforderliche Software in mannigfaltiger und sehr ausgereifter Form vor. Durch den PDF/A-Standard wird PDF obendrein zu einem sehr verlässlichen Format, heute genauso wie für die Zukunft. Kann man das Thema „technisches Format bzw. Verfahren zum sicheren Aufbewahren digitaler Dokumente über lange Zeiträume“ damit als abgeschlossen betrachten? Was ist mit PDF/A erreicht worden, und was fehlt noch?

Erweiterungen in PDF/A-2

Durch den PDF/A-Standard ist in jedem Fall ein sehr solides Fundament gelegt worden, insofern es um die visuell eindeutige und verlässliche Reproduktion geht. Sicherlich wird es Weiterentwicklungen des PDF/A-Standards geben, um technischen Verfeinerungen im PDF-Format Rechnung zu tragen und diese auch für die Archivierung nutzbar zu machen. Der zweite Teil des als Normenreihe angelegten PDF/A-Standards – PDF/A-2 – wird für 2009 erwartet. Dabei ist wichtig zu wissen, dass er den ersten Normteil PDF/A-1 keinesfalls ablösen wird, und dass PDF/A-1-Dokumente nicht aufhören werden, gültige und verlässliche Archivdokumente zu sein. Es wird auch keinerlei Grund geben, nach Erscheinen von PDF/A-2 vorhandene PDF/A-1-Archive nach PDF/A-2 zu migrieren – man würde keinen Vorteil davon haben. Für neu zu archivierende Dokumente kann es künftig aber von Fall zu Fall sinnvoll sein, diese gleich als PDF/A-2 zu archivieren. So wird PDF/A-2 zum Beispiel die Bildkompression JPEG2000 unterstützen.

Liegt Bildmaterial bereits als JPEG2000 vor, ist natürlich zu bevorzugen, dieses als JPEG2000 zu archivieren und eine Re-Kompression in JPEG (hier drohen durch Umwandlung – wenn auch geringe – Verluste) oder ZIP (erhöht die zum Speichern erforderliche Datenmenge) zu vermeiden.

Ausblick auf PDF/A-3

Auch ein dritter Normteil wurde im ISO-Komitee bereits erörtert – PDF/A-3 soll sich um „dynamische“ PDF-Dokumente kümmern. PDF/A-1 ist ja ausschließlich auf PDF-Dokumente abgestellt, deren Inhalt und Darstellung sich nicht verändert und auch nicht verändern darf (so wie wir das von Papierdokumenten gewohnt sind). Bei PDF-Dateien, die Audio- oder Video-Daten, selbstablaufende, animierte Präsentationen oder „begehbare“ 3D-Modelle enthalten, oder die eine komplexe Formularlogik einschließlich Datenbankanbindung in sich bergen, kann das Ausdrucken – oder auch die Archivierung als PDF/A-1 – nur einen mitunter recht unbefriedigenden Schnappschuss eines bestimmten „Darstellungsaugenblicks“ oder einer ausgewählten Inhaltsausprägung abbilden. Bis ein wie auch immer geartetes PDF/A-3 erarbeitet worden ist und verabschiedet werden kann, werden sicherlich noch einige Jahre vergehen, da die ungleich komplexer ist als das Einfangen statischer zwei-dimensionaler visueller Inhalte.

Entwicklungen im PDF/A-1-Umfeld

Aber auch zu PDF/A-1 wird es noch Weiterentwicklungen geben – nicht am Standard PDF/A-1 selbst, sondern an dem „Drumherum“.

Eine Unterschrift ist gold wert 2)


Digitale Signaturen

Eine der immer wieder mit großer Aufmerksamkeit verfolgten Fragestellungen ist: Wie kommen PDF/A-1 und digitale Signaturen zusammen? Der PDF/A-Standard erlaubt ja ganz absichtlich das digitale Signieren, hält sich aber (ebenso absichtlich) vornehm zurück, sobald es um die konkrete Umsetzung geht. Ein gewichtiger Grund, dass es bislang keinen ISO-Standard „Digitales Signieren von PDF/A-Dokumenten“ gibt, liegt darin, dass die Anforderungen an digitale Signaturen – sowie auch die Gesetzgebung hierzu – von Land zu Land sehr unterschiedlich sind. Trotz eines ansonsten stark globalisierten Wirtschaftsgeschehens bietet sich diesbezüglich ein Bild größtmöglicher Uneinheitlichkeit und Unsicherheit. Zudem hat die digitale Signaturtechnologie bei weitem noch nicht das Reifestadium und die Verbreitung und einfache Nutzbarkeit durch jedermann erreicht, wie dies für PDF gilt.

Volltextsuche

Ein weiterer wichtiger Aspekt ist die Volltextsuche. Sie funktioniert bereits bei gewöhnlichen PDFs meistens so gut, dass wir ihr jederzeitiges Funktionieren als garantiert annehmen. Die eine oder andere Fundstelle wird allerdings unter den Tisch fallen (was wir oft nicht merken, weil wir die Stelle ja bei der Textsuche nicht finden…). Das kann an einem schlichten Tippfehler liegen – wenn Herr Schmidt als „Schimdt“ geschrieben wurde. Es kann aber auch sein, dass durch unterschiedliche Schreibweisen eine zu findende Textstelle durchrutscht: die Zahl eintausend Komma null kann geschrieben werden als 1.000,0 (in Deutschland), 1‘000,0 (in der Schweiz) oder als 1,000.0 (in den USA). Telefonnummern erfreuen sich einer noch größeren Vielfalt – neben Leerzeichen werden öffnende und schließende Klammern oder Bindestriche eingesetzt, um die Lesbarkeit zu verbessern oder einschlägigen Formatierungsregeln zu entsprechen. Weiterhin ist es zwar so, dass der PDF/A-Standard für die Konformitätsebene PDF/A-1a fordert, dass sämtlicher Text eindeutig in Unicode abbildbar sein muss. Nicht erzwingen kann der PDF/A-Standard, dass die eindeutige Unicode-Zuordnung eines Buchstaben korrekt ist. Nur der Mensch kann entscheiden, ob ihm gerade ein X für ein U vorgemacht wird.

Strukturierte Inhalte

Auch im Hinblick auf die Struktur von Inhalten in einem PDF bestehen noch Potenziale für weitere Verfeinerungen: Es gibt zahllose zu archivierende Dokumente, die nicht nur strukturierten Inhalt – im Sinne eines beabsichtigen Leseflusses sowie wichtiger Auszeichnungen wie Titel, Bildunterschrift oder fortlaufender Grundtext – enthalten, sondern ganz bestimmte, eindeutig identifizierbare Datenangaben. Auf jeder Telefonabrechnung gibt es Felder wie Kundennummer oder Rechnungsnummer, den fälligen Rechnungsbetrag und so fort. Mit Tagged PDF (das auch in PDF/A-1a für die Inhaltsstrukturierung vorgegeben wird) kann man hier schon sehr weit kommen. Noch charmanter wäre es, wenn diese Datenangaben direkt und eindeutig – wie ein Datensatz aus einer Datenbank – ermittelt und ausgelesen (und formatierungsbedingte Uneindeutigkeiten eliminiert) werden könnten. Auf dem jetzigen Technologiestand lässt sich das alles bereits bewerkstelligen – wünschenswert wäre aber auch hier ein Standard, um die Dokumente und die zugehörige Software interoperabel zu machen.

Ein Blick in die Zukunft 3)

PDF/A in hundert Jahren

In den vorgenannten Überlegungen geht es um Aspekte, die uns möglicherweise in den nächsten fünf bis zehn Jahren beschäftigen werden. Wie aber sieht es – mal ganz ehrlich – mit PDF/A in fünfzig oder hundert Jahren aus? Wie wahrscheinlich ist es beispielsweise, dass dieses Buch im Jahre 2107 eher als gedrucktes, (oder mikro-verfilmtes oder ver-TIFF-tes) Buchexemplar oder als PDF/A-1-Dokument gefunden und gelesen werden kann, wenn sich jemand für die Anfänge von PDF/A interessiert? Ein Teil der Antwort folgt einer platten Wahrheit: Geld regiert die Welt. Wenn also PDF/A in größerem Umfang zum Einsatz kommt, entsteht daraus ein Markt, in dem Anbieter von Lösungen und Dienstleistungen Geld verdienen können. Solange dieser Markt selbst eine kritische Masse nicht unterschreitet, mache ich mir wenig Sorgen. Zudem sind unverhoffte Stolpersteine in Gestalt von Patenten und anderen Schutzrechten deutlich weniger zu erwarten (aber leider in unserer Zeit nie vollständig auszuschließen) als bei manch anderem Format – man denke nur an Unisys und das erst vor kurzem ausgelaufene LZW-Patent, Forgent und seine JPEG-Patentansprüche, oder jüngst an Microsoft, das über eineinhalb Milliarden US-Dollar an Alcatel-Lucent überweisen soll, ausgerechnet wegen des weit verbreiteten MP3-Formats. Sicher immerhin ist: in fünfzig oder hundert Jahren sind alle diese Patente ausgelaufen.

Aber: ist die erforderliche kritische PDF/A-Masse heute schon erreicht, oder wann wird diese erreicht sein? Was die Einführung und praktische Umsetzung von PDF/A angeht, stehen wir sicherlich noch am Anfang. Angesichts der Vorzüge von PDF/A besteht aber kein Zweifel daran, dass sich PDF/A bis 2010 so weit verbreiten wird, dass die nötige kritische Masse auf jeden Fall erreicht wird. Die wichtigste Gründe: Um die weiter rasant zunehmende digitale Dokumentenflut aufzubewahren, ist kein anderes Format besser geeignet, praktischer, weiter verbreitet und obendrein als ISO-Norm standardisiert – und damit der Willkür von Herstellern entzogen – als PDF bzw. PDF/A.

Wie vorstehend aufgezeigt, wird sich die PDF/A-Landschaft in vielfältiger Weise weiterentwickeln, um dem technischen Fortschritt oder anwendungsspezifischen Anforderungen Rechnung zu tragen. Wesentlich hierbei ist jedoch, dass daraus keine Notwendigkeit erwachsen dürfte, die Grundlage zu revidieren: der ISO-Standard PDF/A-1 ist ganz klar als diese Grundlage – auch für künftig hinzukommende Teile der PDF/A-Normenreihe – anzusehen. Damit ist ein stabiles Fundament gegeben, das sich auf längere Sicht nicht nennenswert ändern wird, und das damit die strategische und wirtschaftliche Rechtfertigung nötiger Investitionen bei Einführung PDF/A-basierte Archivierungsstrategien erleichtern wird. 



2) Claudia Hautumm; PixelQuelle.de
3) Paul Schubert; PixelQuelle.de