Kaufen | Unternehmen | 

5. Archiv-PDFs im Alltag: Welche Fragen können auftauchen?

Den Überblick behalten 1)

Die Anforderungen an PDF/A können je nach Umfeld und Aufgabenstellung individuell verschieden sein. Der eine Anwender produziert ausschließlich PDF/A-Dateien mit Text, aber ohne Abbildungen, ein anderer benötigt Signaturen und ein dritter möchte barrierefreie PDF-Dokumente herstellen, die zudem archivtauglich sind. Auf den folgenden Seiten werden verschiedene Möglichkeiten und Bereiche von PDF/A im Detail vorgestellt.

Bilder

Alle Bilder, die in PDF/A-Dateien vorkommen, müssen eindeutig reproduzierbar sein. Das wird dadurch gewährleistet, dass sie fest in die Datei integriert sind. Sie können auch über die Zeit nicht verloren gehen, wie es etwa bei Dateiformaten vorkommen kann, die bei Bildern nur ein Verweis auf einen externen Speicherort angeben. Wer hat nicht schon einmal eine Webseite aufgerufen, bei der Abbildungen nicht gefunden wurden und stattdessen nur ein Fragezeichen im Bildrahmen erscheint? Bei PDF/A ist dies ausgeschlossen.

Ein Bild auf einer PDF/A-Seite ist auch deshalb eindeutig reproduzierbar, weil es genau einmal vorhanden ist. Extrem selten – und nur im Druckvorstufenumfeld – kommen sogenannte alternative Bilder vor, die eine gering aufgelöste Variante für den Bildschirm und eine hoch aufgelöste für den Druck enthalten. PDF/A lässt keine Alternativen Bilder zu, auch weil nicht sichergestellt werden kann, dass diese inhaltlich identisch sind.

Geringe Bildauflösung spricht nicht gegen PDF/A: Da es durchaus Motive gibt, die nur eine geringe Auflösung besitzen, ist diese Thematik nicht Bestandteil des PDF/A Standards. 2)

Die Auflösung ist nicht Teil der PDF/A-Norm

Die Bildauflösung ist kein Thema, das bei der Einhaltung des PDF/A-Standards eine Rolle spielt. Das liegt daran, dass es keine allgemeine, „richtige“ Bildauflösung gibt. Als Beispiel können hier Bildschirmfotos (Screenshots) dienen, die eine Auflösung von 72 ppi haben (pixel per inch, Bildpunkte pro Zoll. Ein Zoll entspricht 2,54 Zentimeter). Eine gebräuchliche Auflösung für den Druck ist 300 ppi. Doch ein Hochrechnen eines Bildschirmfotos auf eine Druckauflösung ist nicht sinnvoll, weil dadurch kein „mehr“ an Informationen entsteht. Schlimmstenfalls können durch ungünstige Hochrechnungseinstellungen unscharfe Kanten entstehen. Die maximale Bildauflösung von Screenshots liegt nun mal bei 72 ppi.

Ein anderer Aufgabenbereich, der oft mit geringen Auflösungswerten zu tun hat, ist die astronomische Fotografie. Unter den Bildern, die Weltraumteleskope wie das bekannte Hubble-Teleskop zur Erde senden, sind extrem grobe Detailaufnahmen keine Seltenheit, wenn weit entfernte Sterne oder Galaxien aufgenommen werden. Diese gering aufgelösten Bilder sind das erreichbare Optimum, und mit solchen Fotografien lassen sich selbstverständlich gültige PDF/A-Dokumente erstellen.

Die Bildauflösung wird nicht durch die PDF/A-Norm geregelt, sie liegt im Ermessen des Erzeugers der PDF/A-Datei. Die Entscheidung, ob eine vorliegende Bildauflösung den optimalen Wert hat, muss der Anwender selbst treffen.

Strich- bzw. Schwarzweißbilder bieten nur zwei Abstufungen, Halbtonbilder sind je nach Farbmodell (Graustufe, RGB, CMYK) unterschiedlich detailliert abgestuft. Die Kompressionsmöglichkeiten für Schwarzweißbilder und Halbtonbilder unterscheiden sich.

Erlaubte und verbotene Kompressionen

Nicht komplett im Ermessen des Anwenders liegt die Wahl der Bildkompression, also der Verfahrensweise für die Minimierung von Bilddatenmengen. Pixelbilder lassen sich in zwei Gruppen einteilen: Halbtonbilder (Graustufen und Farbe) sowie Strichbilder, die nur aus zwei Farben bestehen. Strichbilder lassen sich für die Verwendung in PDF/A per „CCITT-Gruppe-4” komprimieren, einer Technologie, die verlustfrei und effektiv ist. Diese Einstellung verwendet unter anderem der Acrobat Distiller ebenso wie Acrobat Professional.

Bei Halbtonbildern ist die Auswahl der Kompressionsverfahren größer und nicht alle sind PDF/A-konform.

Unter den verlustfreien Kompressionen ist die schon etwas ältere LZW-Kompression untersagt. Da es eine Zeit gab, in der die Verwendung von LZW lizenzrechtlich beschränkt war, hat man sich dazu entschieden, diesen Weg zu untersagen. Weil die erlaubte, verlustfreie Kompressionsart ZIP moderner ist, gilt die Faustregel: „Wenn man sich für eine verlustfreie Kompressionsmethode von Halbtonbildern entscheidet, dann für ZIP“.

ZIP unterliegt keinerlei lizenzrechtlicher Einschränkung. Auch nachträglich lässt sich in PDF eine LZW- durch eine ZIP-Kompression ersetzten. Dafür ist die PDF-Optimierung in Acrobat geeignet.

JPEG war das erste Verfahren, das trotz verlustbehafteter Kompression eine relativ hohe Qualität aus vergleichsweise kleinen Bildern erzeugen konnte. Ohne JPEG wäre daher der Siegeszug von PDF unter Umständen gar nicht möglich gewesen. JPEG erlaubt unterschiedliche Dateigrößen. Die Bildqualität lässt sich einstellen, von „minimal“ über Zwischenstufen bis „maximal“. Wird stark komprimiert, so können Klötzchen-Artefakte entstehen, die man – je nach Motiv – am Bildschirm gut erkennen kann. Bei Motiven mit scharfen Kanten, etwa Text, sind hohe Kompressionsraten besonders heikel.

Grundsätzlich gibt es zwei Kompressionsarten: Die verlustfreie Kompression und Techniken, die die Bildqualität mehr oder weniger beeinträchtigen können („verlustbehaftet“ genannt).

Doch ähnlich wie bei der Bildauflösung gilt für die Stärke der JPEG-Kompression: Der Anwender entscheidet; der PDF/A-Standard macht hier keine Vorschriften. Verboten ist jedoch JPEG2000, ein Verfahren, das von der gleiche Gruppe (Joint Photographic Experts Group), entwickelt wird. JPEG2000 wurde erst mit Acrobat 6 (PDF 1.5) für PDF eingeführt. Da PDF/A-1a und -1b nur auf PDF 1.4 basieren, ist JPEG2000 untersagt, schlicht weil es zu spät eingeführt wurde. Das bereits in Arbeit befindliche PDF/A-2 wird JPEG2000 berücksichtigen. Sind im PDF-Dokument JPEG2000-komprimierte Bilder vorhanden, so kann man diese über die PDF-Optimierung durch JPEG oder ZIP ersetzen, um eine PDF/A-Kompatibilität zu erreichen.

Kästchen: JPEG-Artefakte, wie sie durch starke Kompression entstehen, in der Vergrößerung.



Die Checkliste für Bilder in PDF/A umfasst die folgenden Punkte:

  • Alle Bilder müssen Bestandteil der PDF-Datei sein.
  • Alternativbilder sind verboten.
  • Über Bildauflösung und Kompressionsstärke (beides beeinflusst die Bildqualität) muss der Anwender entscheiden.
  • Die beiden Kompressionsarten LZW und JPEG2000 sind untersagt
  • Mehr zum Thema Farbe (auch bei Bildern) finden Sie weiter unten.

JPEG-Kompressionen


Die JPEG-Kompressionsrate wirkt sich auf die Bildqualität aus. Sie liegt im Ermessen des Anwenders und wird nicht durch den PDF/A-Standard geregelt.
BeispielQualitätsstufeDateigröße (A4-Seite)
JPEG niedrig285 KB
JPEG mittel325 KB
JPEG hoch405 KB
JPEG maximal509 KB

Transparenz

Transparente Objekte sind in PDF/A unzulässig. Adobe hatte zu dem Zeitpunkt, als PDF/A verabschiedet wurde, die Algorithmen zur Transparenzberechnung nicht ganz eindeutig formuliert. Aufgrund dieser Missverständlichkeit bleibt Transparenz in PDF/A bislang verboten. Das wird sich mit PDF/A-2 ändern.

Transparenz: Das Bild rechts ist transparent. Die Transparenz kann man gut erkennen, da der Hintergrund durch das Bild hindurchscheint. Links ist das Vordergrundbild deckend.

Transparenzen können Bilder, Grafiken und Text betreffen. Transparente Objekte sind nicht 100-prozentig deckend, der Hintergrund scheint hindurch, etwa wie bei Glas oder sehr dünnem Pergamentpapier. Transparenzen sind nicht immer mit bloßem Auge zu erkennen, etwa wenn die Deckkraft bei 99 Prozent liegt. Transparente Elemente treten nicht nur auf, wenn man diese gezielt erstellt. Beliebte Gestaltungsfunktionen wie Schlagschatten oder weiche Kanten können Transparenzen in eine PDF-Datei „einschleppen“. So enthalten etwa viele PowerPoint-Präsentationen Transparenzen, auch wenn man diese auf den ersten Blick nicht erkennen kann. Werden Text oder andere Elemente mit Schlagschatten ausgestattet, so bringen diese bei der PDF-Erstellung Transparenzen in eine PDF-Datei. Ein weiteres, weit verbreitetes Hilfsmittel in Office-Umgebungen ist das Hervorheben von Text mit einem digitalen Marker, wie es auch in Acrobat Professional möglich ist. Auch über das Hervorheben-Werkzeug gelangt Transparenz in eine PDF-Datei.


Transparenzgefahr: Schlagschatten und weiche Objektkanten bringen transparente Elemente in eine PDF-Datei, hier zum Beispiel aus einer PowerPoint-Präsentation.

Wie lassen sich Transparenzen nun vermeiden oder auch nachträglich beseitigen? Das Mittel der Wahl heißt Transparenzreduzierung oder auch Transparenzverflachung. Bei diesem Verfahren werden der durchscheinende Bereich und der Hintergrund zusammengerechnet, so dass das Erscheinungsbild erhalten bleibt.

Neben einigen professionellen Layoutprogrammen, die die Transparenzreduzierung im Vorfeld beherrschen, kann auch die PDF-Optimierung in Acrobat Professional diese Aufgabe erledigen. 

Bei der Transparenzreduzierung kann der Anwender zwischen verschiedenen Qualitätsstufen wählen, von niedriger Auflösung bis zu einer hohen Auflösung, weil bei diesem Vorgang auch neue Bilder aus sich überlagernden Grafik-Objekten erzeugt werden.

Vorsicht ist übrigens geboten bei der Entfernung von markiertem, per Leuchtmarker hervorgehobenen Text. Anstatt der Transparenzreduzierung, die die gelbe Markerfarbe deckend und damit den Text unleserlich macht, sollte man in Acrobats PDF-Optimierung auf die Funktion „alle Kommentare, Formulare und Multimediadaten verwerfen“ zurückgreifen. Diese wird in der Rubrik „Benutzerdaten verwerfen“ aufgeführt.

Transparenz durch Marker: Die Markierung mit dem Hervorheben-Werkzeug bringt eine Transparenz in das PDF-Dokument.
Text verdeckt: Die Transparenzreduzierung ist für makierten Text nicht geeignet. Besser funktioniert die Funktion „alle Kommentare, Formulare und Multimediadaten verwerfen“, da das Hervorheben-Werkzeug ein Kommentarwerkzeug ist.
PDF-Optimierung: Diese Acrobat-Funktion erlaubt die Transparenzreduzierung mit verschiedenen Qualitätseinstellungen. Für die Einhaltung von PDF/A sollte man hier darauf achten, dass die Kompatibilität nicht höher als Acrobat 5 (PDF 1.4) gewählt wird.

Farben

Welche Farbe darf‘s denn sein? Ohne Farbmanagement mit Farbprofilen ist die Farbtreue von Firmenlogos Glückssache.

Ob am eigenen Bildschirm oder am Monitor des Kollegen oder als Ausdruck, die Farben der Abbildungen und Grafiken eines Dokuments sollten immer gleich aussehen. Nichts ist ärgerlicher, als ein Firmenlogo, das bei einer Präsentation oder in einer Broschüre nicht der Corporate Identity entspricht, wenn das Logo zum Beispiel orange erscheint anstatt in einem dunklen Magentarot.

Solche Pannen gehören mit PDF/A der Vergangenheit an, denn der PDF/A-Standard garantiert eine verlässliche Wiedergabe von Farben, egal ob bei Text, Bild oder grafischen Elementen.

Farbmanagement

PDF/A bedient sich bei der Aufgabe der sicheren Farbe einer Technologie, die Farb- oder Colormanagement genannt wird. Der Trick bei dieser Farbverwaltung liegt in der Verwendung von Farbprofilen, die wie eine Art Betriebsanleitung Bilddateien, Grafik-Dokumenten oder PDF-Dateien beigefügt werden.

In Office-Umgebungen ist der RGB-Farbraum weit verbreitet. Um die Darstellung auf verschiedenen Geräten und den Ausdruck auf unterschiedlichen Druckern möglichst farbgetreu zu realisieren, hat sich sRGB (die Abkürzung steht für „standard RGB“) durchgesetzt. Das sRGB-Profil ist geeignet für Bilder, Grafikelemente und Text in Office-Dokumenten. Es wurde 1996 von Hewlett-Packard und Microsoft entwickelt, damit Dokumentseiten am Bildschirm sich möglichst nicht von der gedruckten Seite unterscheiden. Gängige, aktuelle Monitore und Drucker verstehen sich auf eine sRGB-Farbanpassung.

Ein weiteres, verbreitetes RGB-Profil ist Adobe RGB. Dieses wurde 1998 von Adobe Systems veröffentlicht. Von diesem Profil profitieren vor allem Anwender, die mit digitalen Fotografien arbeiten, weil eventuell auftretende Cyan- und Grüntöne mit Adobe RGB natürlicher erscheinen, als mit sRGB. Für Dokumente, die von vorn herein für den Vierfarbdruck gedacht sind (Auflagendruck oder Digitaldruck), ist das Farbprofil ISO Coated eine gute Wahl.

Verfälschte Farben verfälschen unter Umständen die Bildaussage: War der Abend am See nun warm oder eher kühl?

OutputIntent (Ausgabebedingung)

OutputIntent: Für welchen Zweck ist das PDF/A-Dokument gedacht? Hier wird „sRGB“ gewählt. Acrobat (Preflight) und andere Konverter liefern eine Reihe von Profilen mit, und der Anwender hat zudem Zugriff auf weitere Profile, die sich auf dem Rechner befinden.

Die genannten (und andere Profile) können einerseits jedem einzelnen im Dokument platzierten Objekt mitgegeben werden, es gibt aber auch ein weiteres, praktischeres Verfahren, das eine PDF/A-Datei als ganzes betrifft. Bei der Konvertierung nach PDF/A lässt sich ein OutputIntent (die beabsichtigte Ausgabebedingung) mitgeben. Soll das PDF/A zum Beispiel für die Anzeige am Monitor archiviert werden, so empfiehlt sich das sRGB-Profil, das bei PDF/A-Konvertern wie Acrobat, Preflight oder pdfaPilot zur Standardausrüstung gehört. PDF/A für den Druck könnte zum Beispiel ein ISO-Coated-Profil enthalten.

Sollte sich in naher oder ferner Zukunft die Ausgabebedingung der PDF/A-Datei ändern, so können nachträglich Farbumrechnungen vorgenommen werden. 

Sichere Farbe in PDF/A
  • Wenn geräteabhängige Farben vorkommen, muss ein OutputIntent mitgegeben werden.
  • Wenn für alle Farben bereits ein Quell-Profil vorhanden ist, wird kein OutputIntent benötigt.
  • Wenn ein OutputIntent vorkommt, muss er über genau ein Ausgabeprofil verfügen.
  • Objekte wie Bilder und Grafiken können grundsätzlich in verschiedenen Farbräumen vorliegen (RGB, CMYK, Sonderfarben, Graustufen oder Lab).
  • Oder es wird genau ein geräteabhängiger Farbraum verwendet (dieser hat kein ICC-Profil).
  • Geräteabhängiges CMYK und geräteabhängiges RGB dürfen nicht gleichzeitig vorkommen. Wenn geräteabhängige Farben vorkommen, muss ein OutputIntent für den gleichen Farbraum (RGB, CMYK oder auch Gray) vorhanden sein. Es ist aber nur ein OutputIntent-Farbraum möglich.

Schriften

Kein Buchstabensalat 3)

Enthält eine PDF-Datei Text, der über Schriften realisiert wird – also nicht in Pfade umgewandelt wurde, oder als Pixelbild vorliegt – so gelten für die Einhaltung von PDF/A eine Reihe von Vorgaben. Dabei ist zu unterscheiden zwischen PDF/A-1a und PDF/A-1b. Doch zuerst zu den Gemeinsamkeiten.


Schriften einbetten

Für beide Konformitätsebenen – PDF/A-1a und -1b – gilt: Alle verwendeten Schriften müssen in die PDF-Datei eingebettet sein. Wäre dies nicht der Fall, so würde der Text an einem Rechner, der die beabsichtigte Schrift nicht zur Verfügung stellt, unter Umständen nur unvollständig dargestellt werden. Dies ist mit der angestrebten visuellen Reproduzierbarkeit nicht vereinbar. Dabei muss nicht die komplette Schrift eingebettet werden, sondern es reicht aus, dies mit allen im Dokument verwendeten Zeichen zu tun. Der Fachterminus lautet „Untergruppen einbetten“.

Gerade im internationalen Austausch von Dokumenten mit Schriftzeichen, die der Empfänger möglicherweise nicht im Zugriff hat, bringen eingebettete Schriften Vorteile. Zwar liefern moderne Betriebssysteme immer häufiger zum Beispiel kyrillische, asiatische oder auch osteuropäische Fonts mit, um internationale Internetseiten anzeigen zu können, doch müssen diese nicht mit den Fonts identisch sein, die der Ersteller des PDF-Dokuments beabsichtigt hat.

Das Einbetten von Schriften ist mit aktuellen Programmversionen von Acrobat und mit vielen weiteren professionellen PDF-Erstellungs-Tools kein Problem, wie es etwa in der Anfangszeit von PDF war. Doch gibt es auch heute noch Lösungen – auch auf industrieller Ebene – die im Schriften-Handling nicht den Anforderungen von PDF/A entsprechen.

Global: PDF/A sorgt für die korrekte Darstellung internationaler Texte, da über die Einbettung von Schriften alle benötigten Zeichen im PDF-Dokument selbst enthalten sind.
Da komplette Schriften eine sehr hohe Datenmenge bedeuten können, erlaubt PDF/A die Verwendung von Untergruppen. Das sind nur die Zeichen, die im PDF-Dokument tatsächlich vorkommen. So lässt sich die Dateigröße in Grenzen halten.

Schriften müssen eindeutig kodiert sein

Fehlendes Zeichen: Ob die Überweisung nun 100 €, £ oder ¥ beträgt, lässt sich hier nicht feststellen. Mit PDF/A kann das nicht passieren.

Probleme mit Zeichensatzkodierungen können in Dokumenten wie Word oder auch in E-Mails dazu führen, dass einzelne Glyphen fehlen oder falsch dargestellt werden. Als Glyphen bezeichnet man die grafische Gestaltung von Zeichen.

Was kann bei Unstimmigkeiten mit der Zeichensatzkodierung passieren? In der Zeit, als der Euro eingeführt wurde, gab es häufig Probleme mit dem €-Zeichen. Die Zeichen „ä“, „ü“ und „ö“ machen unter Umständen Schwierigkeiten in der Kommunikation mit Partnern in Übersee. PDF/A verlangt nun, dass die verwendeten Glyphen in eindeutigen Kodierungen vorliegen, so dass eine korrekte Wiedergabe garantiert ist.

Auch ineinanderlaufende Buchstaben, wie es etwa bei Kopieren von Text vorkommen kann, ist mit PDF/A kein Thema mehr. Dieser Buchstabensalat kommt durch fehlende Laufweiteninformationen zustande, ein Umstand der bei PDF/A ausgeschlosssen ist.

Laufweiteninformationen: Bei den übereinanderliegenden Buchstaben sind die Informationen zur Laufweite verloren gegangen.
Buchstabe „O“ oder Ziffer „0“? Dieses Beispiel zeigt, dass die rein optische Zuweisung zum „richtigen“ Zeichen nicht immer möglich ist. Hier hilft Unicode, das für jedes Zeichen eine sogenannte Unicode-Entsprechung festlegt. 4)

Eindeutige Zeichen dank Unicode bei PDF/A-1a

Für PDF/A-1a gilt – zusätzlich zu den genannten Punkten – eine weitere Anforderung an Schriften. Alle in einer PDF/A-1a-Datei eingebetteten Schriftzeichen müssen sich eindeutig einer Unicode-ID zuordnen lassen. Bei Unicode handelt es sich um einen internationalen Standard, der regelt, dass für jedes Zeichen oder Zeichensymbol, das weltweit existiert (das gilt auch für historische Schriften), eine eindeutige Identifikationsnummer vorliegt. Das Unicode Consortium und die ISO arbeiten an dieser Aufgabe zusammen. Über Unicode werden lediglich die abstrakten Zeichen kodiert, nicht Glyphen (die gestalteten Buchstaben).

Für PDF/A-1a hat die Nutzung der Unicode-Zuordnung den Vorteil, dass Texte auf der Zeichenbasis absolut eindeutig sind. So lassen sich Texte exakt und verlässlich nach Inhalten durchsuchen, oder oder auch Inhalte wiederverwenden.

U+0061: Gleichgültig, wie der Buchstabe „a“ in den verschiedenen Fonts gestaltet ist, alle Beispiele haben dieselbe Unicode-ID.

Dies wäre bei PDF/A-1b-Dokumenten nicht hundertprozentig garantiert, auch wenn es im Alltag eine hohe Übereinstimmung geben sollte. 


Metadaten

In vielen gängigen Dateiformaten lassen sich Metadaten unterbringen. Unter Metadaten versteht man grundsätzlich Daten, die einem Dokument über die reinen Nutzdaten hinaus mitgegeben werden. Dabei kann es sich zum Beispiel um technische Informationen handeln (jede aktuelle Digitalkamera speichert in eine aufgenommene Bilddatei zusätzliche Angaben, etwa zur Belichtung, zur Blende oder zur Ausrichtung in die sogenannten EXIF-Daten). Desweiteren kann der Anwender nachträglich Beschreibungen wie Stichwörter oder Copyright-Vermerke in eine Datei einfügen. Ein schon seit Jahren hierfür verwendetes Verfahren sind die IPTC-Metadaten, auf das vor allem professionelle Fotografen zurückgreifen.

In vielen Programmen lassen sich in der Rubrik „Dokumentinformationen“ Metadaten zu einer Datei abfragen oder auch ändern. Das sind in der Regel Kerninformationen wie Dokumenttitel, Verfasser und Erstellungsprogramm.

Metadaten geben wertvolle Hinweise, die das Organisieren großer Mengen digitaler Dokumente erleichtern, sei es über Datenbanklösungen oder Suchfunktionen. Gerade für die Archivierung sind Metadaten von Bedeutung, können sie doch zum Beispiel Auskunft darüber geben, welche Person oder welcher Ort auf einem Bild zu sehen ist, wer der Urheber ist und welche Copyright-Bedingungen gelten.

XMP nutzt RDF, um die Metainformationen in die Binärdaten einzubetten. RDF bedeutet Resource Description Framework also „System zur Beschreibung von Bezugsquellen“ und ist eine formale Sprache zur Bereitstellung von Metadaten im Internet. Um die XMP-Verbreitung voranzutreiben, stellt Adobe die XMP-Spezifikationen sowie ein Software-Developer-Kit unter einer OpenSource-Lizenz zur freien Verfügung. Internet: www.adobe.com/products/xmp

Analoge Metadaten: Metadaten kommen auch in der analogen Welt vor, etwa in einem Impressum für Bücher oder Zeitschriften.

PDF/A und Metadaten

Vieles im Umgang mit Metadaten für die Erstellung gültiger PDF/A-Dokumente bleibt dem Anwender überlassen. Es gelten jedoch folgende formale Richtlinien:

  • Ein einziges Metadatenfeld ist Pflicht: die PDF/A-Kennung. Diese wird in der Regel bei der PDF/A-Erstellung automatisch vom jeweiligen PDF/A-Konverter in der korrekten Form in das dafür vorgesehene Feld geschrieben.
  • Alle in der PDF-Datei vorkommenden Metadaten müssen in einer bestimmten Form vorliegen, sie müssen XMP-konform kodiert sein.

Obwohl es bei PDF/A nur ein einziges Pflichtfeld gibt, empfiehlt es sich, die Möglichkeiten von XMP zu nutzen, gerade im Hinblick auf eine effektive Archivierung mit leistungsfähigen Such- und Sortierfunktionen.

Was ist XMP?

Beim Thema Metadaten bewegt man sich auf dem Gebiet der Standards. Metadaten können nur dann allgemein effektiv eingesetzt werden, wenn nicht jeder Anwender, oder jede Anwendergruppe ein eigenes System zur Art und Verwaltung dieser Zusatzinformationen entwickelt. Bei bereits parallel existierenden Metadatensystemen müssen zumindest verlässliche Übersetzungsmöglichkeiten angeboten werden.

Um nun die Vereinheitlichung von Metadaten-Systemen voranzutreiben, setzt Adobe Systems die Technik der „Extensible Metadata Platform“ – kurz XMP – ein. XMP ist ein Verfahren, das wie eine Art Klammer bereits etablierte Metadatenformate (wie IPTC oder EXIF) zusammenhält. Unter anderem Acrobat Professional und der Adobe Reader zeigen XMP-Metadaten an, mit Acrobat Professional können diese auch editiert werden. Auch andere Hersteller verwenden XMP, diese Technologie ist nicht auf Adobe beschränkt.

Dokumenteigenschaften: Vier grundsätzliche Metadatenfelder sind im Einstiegs­dialog zu sehen: Der Titel (dieses Feld ist meistens basierend auf dem Ursprungs­dokument vorausgefüllt), der Verfasser, das Thema und ein Feld für die Stichwörter. Wichtig ist hier der Button „Zusätzliche Metadaten…“, der zum Dialogfenster unten führt.

PDF-Metadaten in Acrobat ansehen und editieren

Zu den Metadaten gelangt man über das Menü: „Datei; Eigenschaften“. Die Rubrik „Beschreibung“ hält Felder für Angaben zum Titel (der im übrigen nicht identisch sein muss mit dem Dateinamen), zum Verfasser, zum Thema und für frei zu vergebenden Stichwörter bereit. Der Titel wird meist über den Dateinamen der Ursprungsdatei vorausgefüllt. Die weiteren Felder können dann Metadaten aus der Ursprungsdatei übernehmen, falls diese bereits vom Anwender ausgefüllte, XMP-konforme Einträge enthalten haben und falls die PDF-Erstellung nicht über den Distiller geht. Programme aus der Adobe Creative Suite reichen XMP-Metadaten an PDF-Dokumente weiter, wenn diese via Export erstellt werden. Inwieweit Metadaten aus aus Word- oder Excel-Dateien mit in das PDF übertragen werden, hängt unter anderem von den verwendeten Programmversionen ab.

Über die Schaltfläche „Zusätzliche Metadaten“ bekommt der Anwender Zugriff auf eine ganze Reihe weiterer Kategorien, die unter anderem für Copyright-Informationen, individuelle Verarbeitungshinweise und weitergehende Beschreibungen gedacht sind. Für die massenhafte Vergabe von Metadaten in PDF empfehlen sich andere Programme als Acrobat, etwa die Adobe Bridge oder auch Produkte und Lösungen anderer Hersteller.

Zusätzliche Metadaten: Hier stehen weitere Felder für XMP-basierte Metadaten bereit. Diese lassen sich für das PDF ausfüllen, hier können aber auch Einträge stehen, die aus dem Ursprungsdokument übernommen wurden.

Barrierefreiheit

Grenzenlose Möglichkeiten 5)

Unter den Stichworten Barrierefreiheit oder Accessibility sind grundsätzlich technische Hilfen zusammengefasst, die es Menschen mit Behinderungen erleichtern sollen, umfassend am täglichen Leben teilzunehmen. Rollstuhlgerechte Eingänge zur U-Bahn oder mit Brailleschrift versehene Knöpfe im Aufzug sind Beispiele für erfolgreich beiseite geräumte Barrieren. In unserer Informationsgesellschaft darf die Teilhabe an allgemeinen Informationen niemandem aus Gründen körperlicher Behinderungen vorenthalten werden. So muss der Zugang zu den vermehrt digital vorliegenden Informationen auch für ein Publikum mit Sehbehinderung oder Einschränkungen im motorischen Bereich gewährleistet sein.

PDF bietet für die barrierefreie Inhaltsvermittlung eine Reihe an interessanten Funktionen: So kann etwa der kostenlose Adobe Reader Texte vorlesen. Vergrößerungen oder Kontrastverstärkungen ermöglichen das Lesen von Texten, auch wenn der Anwender nur eine eingeschränkte Sehfähigkeit besitzt.

Ausgabehilfe: Der Adobe Reader kann PDF-Dateien vorlesen, inklusive Formularfelder. Für den deutschsprachigen Einsatz muss eine digitale, deutsche Stimme zugekauft werden, da die Betriebssysteme nur englische Stimmen mitliefern.
Im Jahr 2002 ist das Behindertengleichstellungsgesetz in Deutschland in Kraft getreten. Diese Regelung schreibt vor, dass die Bundesverwaltung ihre öffentlich zugänglichen Internet-Angebote barrierefrei gestalten muss.
gesetze-im-internet.de/bgg

Strukturiert: PDF/A-1a und barrierefreies PDF

Tags: Jedes Element in Tagged PDF verfügt über eine Marke, die Informationen über Art, Position und Inhalt enthält. So wird eine exakte Struktur erreicht.

Barrierefreies PDF und PDF/A-1a haben viele Gemeinsamkeiten und es ist möglich, Dateien zu erstellen, die den Ansprüchen beider Anforderungen genügen. Sowohl PDF/A-1a als auch barrierefreie PDF-Dokumente verlangen eine eindeutige, inhaltliche Struktur.

Struktur wird durch das sogenannte „Tagged PDF“ realisiert. Diese Marken oder Anhänger statten jedes PDF-Element mit Zusatzinformationen zu Inhalt, Position und Art des Elements aus.

Per Tag wird der genaue Ablauf von Inhalten festgelegt, was bei Seitengestaltungen mit mehreren Spalten wichtig ist. Zudem kann über Tags genau zwischen Inhalt und zusätzlicher Gestaltung unterschieden werden, etwa Kopf- und Fußzeilen oder anderen Hintergrundelementen, die nicht direkt zum Content gehören.

Tagged PDF in Acrobat: Strukturiertes PDF gibt ganz genau vor, in welcher Reihenfolge Inhalte angeordnet sind. Gerade bei mehrspaltigen Layouts kann eine Reihenfolge oft nicht automatisch von einer Software erkannt werden. Hier muss der Ersteller Vorgaben leisten.

Hilfreich sind Tags zudem für Grafiken und Bilder, die auf PDF-Seiten platziert sind. Wie soll eine Vorlese-Software mit einem Bild umgehen? Wenn der Ersteller dem Bild einen „alternativen Text“ mit einer erklärenden Bezeichnung mitgibt, so erfährt der Nutzer nicht nur, dass im Textfluss irgendeine Grafik eingefügt ist, sondern auch, dass diese beispielsweise eine Gitarre zeigt.

Es ist relativ einfach möglich, aus einem barrierefreien PDF-Dokument eine PDF/A-1a-Datei zu generieren, und umgekehrt. Im Herstellungsprozess ist aber darauf zu achten, dass die PDF/A-Konvertierung ganz am Ende des Arbeitsablaufs stattfindet. Eine gültige PDF/A-Datei darf nicht mehr verändert werden, sonst verliert sie ihren Status.

Reflow: PDF lässt sich gut auf mobilen Geräten anzeigen, wenn ein Neuumbruch der Inhalte dank Tagged PDF fehlerfrei ausgeführt wird.

Vorteile von barrierefreiem PDF

Barrierefreie PDF-Dateien bieten dank Tagged PDF handfeste Vorteile. Strukturierte PDF-Dateien lassen sich viel besser weiterverweden, als herkömmliche Dokumente. So können bei Formatkonvertierungen – PDF nach HTML, TXT oder auch RTF – verlässliche Ergebnisse erzielt werden.

Bei PDF-Dokumenten, die auch auf mobilen Geräten wie Handhelds oder Mobiltelefonen angezeigt werden sollen, ermöglicht die Reflow-Funktion eine bessere Lesbarkeit auf kleinen Monitoren. Diese Neuumbrechung von Text ist erst mit Tagged PDF fehlerfrei möglich.

Schließlich erlaubt barrierefreies PDF eine sichere Volltextindizierung beziehungsweise Volltextsuche, da Unklarheiten im Textablauf vermieden werden.

Automatisch sinnvolle Strukturen?
Weder barrierefreies PDF noch PDF/A-1a können bei der Prüfung auf „Tagged PDF“ untersuchen, ob die vorliegenden Strukturen sinnvoll oder korrekt sind. Beide Prüfmechanismen ermitteln lediglich, ob überhaupt Strukturinformationen gemäß der Vorgabe in der PDF-Datei vorhanden sind, nicht ob diese sinnvoll sind.

Der Standard schreibt daher auch vor, dass die Strukturinformationen nicht nachträglich automatisiert eingefügt werden dürfen. Sie müssen also entweder bei der PDF-Erzeugung mit importiert, oder anschließend manuell ergänzt werden.

Eine automatische Herstellung von Strukturen kann zwar bei ganz einfach aufgebauten (PDF-) Dateien ohne Probleme möglich sein. Kommt jedoch ein Automatismus für die Rekonstruktion einer Struktur zum Einsatz, so hat auch hier der Anwender dafür zu sorgen, dass dieser Prozess validiert ist.

Barrierefreie PDF-Datei aus Word

In diesem Beispiel kommen Word 2003 und der PDFMaker zum Einsatz, der auf die PDF-Settings von Acrobat 8 zugreift. Folgende Schritte sind für eine erfolgreiche Herstellung zu beachten:

  • Um die Zugänglichkeit zu gewährleisten, muss man die Sprache für das Word-Dokument festlegen. Der entsprechende Eintrag lässt sich über den Menüpunkt „Extras; Sprache“ vornehmen. Der PDFMaker überträgt diese Informationen allerdings nicht immer in die PDF-Datei.
  • Der Text im Word-Dokument sollte über Formatvorlagen (etwa „Überschrift“, „Textkörper“, „Aufzählungszeichen“) gegliedert werden.
  • Ein Aufbau mit mehreren Spalten sollte über den Menüpunkt „Format; Spalten“ und nicht über Tabulatoren realisiert werden.
  • Um Grafiken und Bilder in Word mit Alternativtexten auszustatten, nutzt man den Befehl „Grafik formatieren“ in der Sparte „Web“, der sich als Kontextmenü aufrufen lässt. Diese Bildbeschreibungen werden bei der PDF-Erstellung via PDFMaker ins PDF-Dokument übernommen.
  • Im Word-Menü „Adobe PDF“ wählt man den Eintrag „Konvertierungseigenschaften ändern“ aus. Im Register „Konvertierungseinstellungen“ kann der Anwender die Option für „PDF/A-1a“ per Ankreuzfeld aktivieren, oder aus dem Pulldown-Menü eine der beiden PDF/A-1b-Einstellungen auswählen. Damit die PDF/A-1b-Dateien den Anforderungen an Tagged PDF genügen, muss man im Bereich „Word“ darauf achten, dass die Vorgabe „Erweiterte Tag-Erstellung aktivieren“ eingeschaltet ist (diese ist standardmäßig aktiv).

Wird nun unter „Adobe PDF“ der Befehl „In Adobe PDF konvertieren“ gewählt, so wird über den PDFMaker aus der Word-Datei ein PDF/A-1a- oder -1b-Dokument erstellt, das die besten Voraussetzungen für eine barrierefreie PDF-Datei mitbringt.

Grafik formatieren in Word: Per rechter Maustaste wird die Option geöffnet, der alternative Text lässt sich im Register „Web“ eintragen.
Barrierefrei und PDF/A: Entweder man wählt in den „Einstellungen“ per Ankreuzfeld die PDFMaker-Voreinstellung PDF/A-1a…
…oder eine der beiden PDF/A-1b-Varianten für RGB oder CMYK aus dem Menü. Bei PDF/A-1b muss man unter „Word“ die Checkbox „Erweiterte Tag-Erstellung“ aktivieren, um barrierefreie PDF-Dateien zu generieren.

Anpassungen in Acrobat Professional

Ein- und Ausgabehilfe: Hier befinden sich in Acrobat Professional die Werkzeuge für barrierefreies PDF.

In Acrobat Professional sind unter Umständen nun noch weitere Schritte vorzunehmen:

Die Datei wird für die Barrierefreiheit angepasst. In den „Dokumenteigenschaften“ muss gegebenenfalls unter „Erweitert“ die Sprache eingestellt werden, damit eine Vorlese-Software korrekt funktioniert.

Abschluss: Zuletzt wird die PDF-Datei nach PDF/A gewandelt oder auf diesen Standard validiert.

Unter dem Acrobat-Menüpunkt „Erweitert“ finden sich Funktionen für die Ein- und Ausgabehilfe. Hier sollte man die „vollständige Prüfung“ durchführen. Ergeben sich Probleme mit der vorliegenden Datei bezüglich der Barrierefreiheit, so wird dies – samt Vorschlägen zur Reparatur – von Acrobat gemeldet. Werden nachträgliche Reparaturen bezüglich der Struktur und dem alternativen Bildtext erforderlich, so kann man diese über das Werkzeug „TouchUp-Leserichtung“ durchführen.

Nach erfolgreich geprüfter Barrierefreiheit wird das PDF-Dokument abschließend im Acrobat-Werkzeug Preflight bezüglich PDF/A-Kompatibilität validiert beziehungsweise dahingehend gewandelt. Die PDF/A-Wandlung oder Validierung wird immer als letzte Aktion durchgeführt.

Nur einen Mausklick entfernt? 6)

Interaktive PDF-Dateien

Der Funktionsumfang und die Einsatzmöglichkeiten von PDF-Dokumenten lassen sich mit interaktiven Elementen enorm ausweiten. Ob Navigation innerhalb oder zwischen Dokumenten oder Interaktion zwischen Firmen und Kunden beziehungsweise Verwaltung und Bürgern, interaktive Elemente schaffen Verbindung.

PDF-Dokumente lassen sich mit Hyperlinks, mit Kommentaren oder Formularelementen ausstatten. Doch inwieweit sind diese interaktiven Funktionen mit PDF/A vereinbar? Der PDF/A-Standard verlangt, dass die Datei nur zukunftssichere Elemente beinhaltet, die die Eindeutigkeit nicht beeinträchtigen.

Notiz in einer PDF/A-Datei: Kommentare sind in PDF/A grundsätzlich erlaubt. Doch Multimedia-Kommentartypen wie Audio-Anmerkungen sind untersagt. Bei den grafischen Anmerkungen muss der Anwender bezüglich Farbe und Transparenz aufmerksam sein.

Kommentare und Anmerkungen

PDF/A hat das Ziel, alle Inhalte einer PDF-Datei reproduzierbar und stets zugänglich zu machen. Das betrifft auch die Kommentare. Sie dürfen weder unsichtbar, noch auf „nicht druckend“ gesetzt sein. Wenn man einer PDF-Datei tatsächlich Kommentare für die Ewigkeit mitgeben möchte – also die Kommentare in PDF/A erhalten will – so ist dies technisch gesehen möglich. Es ist kein Problem, in Acrobat einen Kommentar in Form einer Notiz zu hinterlegen und daraus eine gültige PDF/A-Datei zu erzeugen.

Entfernen oder Reduzieren: Preflight-Korrekturen erlauben es, Kommentare zu entfernen oder zu reduzieren. Im zweiten Fall sind diese Anmerkungen optisch noch vorhanden, ihre Merkmale als Kommentare haben sie jedoch eingebüßt.

Da die Notiz-Symbole und Eingabemasken mit RGB arbeiten, muss die PDF/A-Datei eine RGB-Ausgabebedingung verwenden, also etwa „sRGB“.

Es gibt aber auch Kommentartypen, die nicht zulässig sind. Dass Textbearbeitungs-Kommentare nicht erlaubt sind, ist nachvollziehbar. Wenn diese Anmerkungen vorkommen, ist anzunehmen, dass eine Textkorrektur versehentlich nicht ausgeführt wurde.

Vorsicht ist auch mit Kommentaren geboten, die für ihr Aussehen Transparenz verwenden, die also durchscheinend sind. Dazu zählen unter anderem das Hervorheben-Werkzeug (der Leuchtmarker) und die von Acrobat mitgelieferten Stempel á la „Genehmigt“.

Was aber, wenn gerade solche Kommentare wichtig sind und man diese mit in die zu erstellende PDF/A-Datei überführen möchte? Das Acrobat-Werkzeug Preflight bietet für diese Aufgabe eine Lösung. Führt man vor der PDF/A-Wandlung Korrekturen zum Reduzieren von Kommentaren und Transparenzen durch, so lässt sich die rein visuelle Darstellung der Kommentare erhalten, die Kommentar-Funktionalität geht allerdings komplett verloren. Eine Stempel-Notiz lässt sich beispielsweise nach dem Reduzieren per Preflight nicht mehr per Doppelklick öffnen.

Nicht alle Kommentare sind PDF/A-tauglich: Korrekturanweisungen und Anmerkungen mit Transparenzen gehören dazu.

Auf den ersten Blick mag es erstaunen, aber auch bei Hyperlinks handelt es sich technisch gesehen um Kommentare. Und zwar dergestalt, dass sie für eine angestrebte PDF/A-Konformität nicht in ihrer ursprünglichen Form erhalten bleiben können, sondern dass sie reduziert werden müssen. Versucht man, eine PDF-Datei, die Links enthält, in PDF/A zu wandeln, so erhält man pro Hyperlink zwei Fehlermeldungen: „Kommentar enthält keinen Flags-Eintrag“ und „Kommentar ist nicht auf druckend gesetzt“. Als Preflight-Korrekturprofile kommen hier „Alle Kommentare entfernen“ oder „Kommentare reduzieren“ in Frage. In diesem Fall ist das Ergebnis das gleiche. Nach der Entfernung der Links kann Preflight die PDF-Datei in der Regel ohne Probleme in eine PDF/A-Datei umwandeln.

Hyperlinks sind Kommentare: Die PDF/A-Konvertierung in Preflight ist wegen der Links nicht durchführbar.

Formulare

Der PDF/A-Standard verbietet keineswegs Formulare als solche, doch gibt es Formularfeldtypen, die mit Aktionen arbeiten, und diese können die Langzeitarchivtauglichkeit von PDF-Dateien gefährden. Probleme sind bei folgenden Punkten zu erwarten:


Formulare sind, wenn sie von interaktiven Funktionen Gebrauch machen, in der Regel nicht eins zu eins in PDF/A abzubilden. PDF/A-Konformität erreichen vor allem „einfach“ aufgebaute PDF-Formulare ohne Berechnungsfunktionen, Auswertungen und dergleichen.

  • Aktionen vom Typ „Formular-Senden“, „Formular-Import“ und „Formular Zurücksetzen“ sind verboten. Das ist nachvollziehbar, denn diese Aktionen ändern Inhalte.
  • Sogenannte „zusätzliche Aktionen“ sind nicht erlaubt, ebenfalls weil sie Content ändern können.
  • JavaScript-Aktionen sind unzulässig, weil sie die Reproduzierbarkeit des Ist-Zustands der Datei gefährden.
Formulare und PDF/A: Nicht die Formularfelder „an sich“ vereiteln die Wandlung dieser Daten nach PDF/A, sondern hierfür verbotene Aktionen und JavaScript. Font- und Farbprobleme kommen hinzu.

Der Versuch, mit Preflight ein Formular-PDF nach PDF/A-1b zu wandeln, könnte zu dem abgebildeten Ergebnis führen. Kritisch sind Aktionen wie „Formular zurücksetzen“ und der „Senden“-Knopf.

Geräteabhängig: DeviceRGB benötigt als OutputIntent „sRGB“.

Wie das Preflight-Ergebnis zeigt, sind aber auch Probleme mit nicht eingebetteten Schriften aufgetaucht, die nachträglich nicht so ohne weiteres zu beheben sind (dazu weiter unten mehr). Zudem werden unter Umständen „DeviceRGB“-Farben (geräteabhängige Farben) angemahnt, die aus den farbig hinterlegten Formularfeldern resultieren. (Acrobat Professional bietet nur geräteabhängiges RGB für die Einrichtung von Formularfeldern und Schaltflächen an). Was ist zu tun?

Das Ursprungsformular muss zuerst von Aktionen und JavaScript befreit werden, was einige Einschränkungen im Funktionsumfang zur Folge hat.

Sollen die geräteabhängigen RGB-Farben die Einhaltung des PDF/A-Standards nicht verhindern, so muss man bei der Konvertierung als OutputIntent „sRGB“ bestimmen. Dermaßen „abgespeckt“ und vorkonfektioniert kann das Formular-PDF nach PDF/A-1b konvertiert werden. Doch für die Schrifteinbettung in die Formularfelder muss ein neuer Weg gefunden werden.

Schrifteinbettung für PDF/A-Formulare

Preflight: Die PDF/A-Konvertierung des Formulars kann nicht durchgeführt werden, da das Werkzeug die benötigten Schriften nicht in die Datei einbetten kann.

Schriften in PDF-Formularfelder einzubetten, ist mit vielen gängigen Tools derzeit nicht möglich. Die Fonts müssen aber in der PDF-Datei enthalten sein, damit die PDF/A-Konformität erreicht wird. Mit dem Acrobat-Werkzeug Preflight ist die Font-Einbettung in Formularfelder nicht realisierbar. Das Werkzeug meldet nach dem vergeblichen Versuch der PDF/A-Wandlung: „Schrift nicht eingebettet“.

//**PDF/A-Formular:**// pdfaPilot ist in der Lage, gültige PDF/A-Formulare samt eingebetteten Schriften zu generieren. Für diese Aufgabe gibt es jetzt das Acrobat-Plug-In pdfaPilot von callas software. Damit lassen sich (neben vielen anderen Korrekturfunktionen) Formular-PDF-Dateien gezielt zu PDF/A-konformen Dokumenten wandeln. Voraussetzung ist, das alle vom PDF-Dokument benötigten Schriften auf dem Rechner vorliegen und zugänglich sind.

Neben der Funktion des Font-Embedding löst pdfaPilot auch die in Formularen häufig auftretenden Probleme bezüglich der Farben.

Für die erfolgreiche Font-Einbettung muss die Schrift auf dem Rechner vorhanden sein.

PDF/A konstruktiv

Planen und realisieren 7)

Konstruktionszeichnungen wie CAD-Pläne und Landkarten sind dankbare Kandidaten für eine Langzeitarchivierung in Form von PDF/A-Dateien. In den Bereichen Architektur und Statik zum Beispiel gilt oft eine langjährige Aufbewahrungspflicht für Bauzeichnungen. Auch technische Entwürfe müssen häufig über Jahre verfügbar bleiben.

Die im Bereich technische Zeichnungen häufig auftretenden großen Seitenformate mit Abmessungen von mehreren Metern Länge lassen sich auch in PDF 1.4 realisieren. PDF 1.4 – die PDF-Spezifikation, auf der PDF/A-1a und -1b basieren – erlaubt eine maximale Seitengröße von 200 mal 200 Zoll, was 5,08 mal 5,08 Meter entspricht. Seit PDF 1.7 liegt die virtuelle Seitengrößen bei bis zu 381 Kilometer Kantenlänge, doch der PDF/A-Standard erlaubt eben nur PDF 1.4.

Die Konstruktionszeichnungen lassen sich aus gängigen CAD-Programmen als PDF oder sogar als gleich als PDF/A ausgeben – dabei ist häufig der PDFMaker an der PDF-Wandlung beteiligt. Gegebenenfalls findet die PDF/A-Wandlung in Acrobat oder einem anderen PDF/A-Konverter statt. Ältere Pläne liegen häufig in Form von Strichscans – etwa im TIFF-G4-Format – vor. Diese lassen sich über Acrobat Professional (oder andere Lösungen für die PDF-Konvertierung) in PDF und schließlich in PDF/A wandeln. Häufig ist es dabei auch möglich, über die Texterkennungsfunktion, die Zeichnungen mit durchsuchbarem Text auszustatten.

Konstruktionspläne: Für Schaltpläne, Bauzeichnungen, Stadtpläne und vieles mehr ist PDF/A als Langzeitarchivierungsformat geeignet.

Keine 3D-Modelle in PDF/A

Konstruktionen, die in 2D angelegt sind, lassen sich problemlos als PDF/A archivieren. Anders sieht es für 3D-Modelle aus. Dreidimensionale Entwürfe können erst seit Acrobat 7 (PDF 1.6) in PDF-Dokumente integriert werden. Damit sind sie in PDF/A nicht zugelassen.

Elektronische Signaturen

Unterschrieben und besiegelt 8)

Der Alltag ist digital geworden. Innerhalb weniger Jahre hat sich E-Commerce stark ausgebreitet, ebenso werden geschäftliche Vereinbarungen oftmals ausschließlich online per E-Mail getroffen und die digitale Kommunikation zwischen Bürger und Behörden ist keine Zukunftsmusik mehr, man denke nur an die elektronische Steuererklärung ELSTER.

Da sich bei diesen Transaktionen die Partner nicht mehr Auge in Auge, geschweige denn im Beisein von Zeugen gegenüberstehen, ist die nachprüfbare Echtheit der digitalen Dokumente selbst wichtiger denn je. Erst elektronische Signaturen ermöglichen einen durchgängig digitalen Ablauf von Kommunikation und Transaktionen mit Vertragscharakter.

Der Echtheitsbeweis per Zeichen oder Unterschrift ist nahezu so alt wie die ersten schriftlichen Zeugnisse der Menschheit. Schon die Mesopotamier signierten ihre Aufzeichnungen per Siegel oder Stempel. Die noch heute in China und Japan praktizierte Tradition, Urkunden per Stempel statt handschriftlich zu unterzeichnen hat eine Jahrtausende alte Geschichte. Prunkvolle Siegel aus Wachs sind aus dem Mittelalter bekannt. Die eigenhändige Unterschrift unter einen Vertrag zu setzen, ist ein relativ neues Verfahren, ist die allgemeine Kenntnis des Schreibens doch gerade in unserem Kulturkreis eine relativ junge Errungenschaft.

Doch wie können nun Dokumente im digitalen Schriftverkehr zu rechtssicheren Urkunden gemacht werden?

Die einfachste Möglichkeit, eine elektronische Datei digital zu unterzeichnen, besteht darin, eine eingescannte Unterschrift als Bilddatei auf eine Seite des Dokuments zu platzieren. Dieses Verfahren kann durchaus rechtsgültig sein, etwa in den Vereinigten Staaten. Dass diese Lösung überhaupt keine Sicherheit gegen Fälschungen bietet, liegt auf der Hand. Daher kommt der Entwicklung leistungsfähiger und vertrauenswürdiger Systeme für digitale Signaturen eine wichtige Bedeutung zu.


Die Begriffe „digitale Signatur“ und „elektronische Signatur“ werden häufig synonym verwendet. Doch der Begriff „digitale Signatur“ bezeichnet kryptographische, technische Verfahren, wohingegen „elektronische Signatur“ eine rechtliche Bezeichnung ist.

Identität, Integrität und Zeitstempel

Zahlreiche Vereinbarungen und Verträge werden inzwischen auf digitalem Weg abgeschlossen. Das Internet hat die Kommunikationswege über Kuriere und die Post zu einem hohen Anteil ersetzt. So erledigen Anwender Transaktionen wie etwa Angebote, Bestellungen oder Rechnungen im E-Business oder Anträge und Bescheide im E-Government auf rein digitale Art und Weise.

Einige Grundvoraussetzungen müssen bei diesen Interaktionen erfüllt sein. Der Empfänger der Daten muss einwandfrei feststellen können, dass es sich beim Absender tatsächlich um die angegebene Person handelt. Des weiteren muss sichergestellt sein, dass die Inhalte nicht nachträglich geändert beziehungsweise verfälscht wurden. Die Anforderungen beziehen sich also auf die Identität (Feststellung des Verfassers) und die Integrität (intakter Inhalt).

Fortgeschrittene Elektronische Signaturen sorgen dafür, dass diese beiden Anforderungen erfüllt werden. Sie erlauben einem Empfänger mittels kryptographischer Technologien zu erkennen, ob Manipulationen am Inhalt durchgeführt wurden. 

Über einen kryptographischen Schlüssel kann der Empfänger zudem einer signierten Nachricht zweifelsfrei einen Urheber zuordnen.

Ein weiteres Kriterium für eine rechtlich sichere digitale Transaktion oder eine Abmachung ist in vielen Fällen der Zeitpunkt. Für diese Aufgabe lassen sich Zeitstempel verwenden, die ein Datum und eine Uhrzeit festhalten, zu dem Inhalte in einer bestimmten Fassung vorlagen.

Elektronische Signaturen und Verschlüsselungen sind im übrigen nicht dasselbe. Während Elektronische Signaturen dafür sorgen, dass Inhalte, Beteiligte und der Zeitpunkt einer digitalen Transaktion eindeutig und umveränderbar feststellbar sind, schützen Verschlüsselungen vertrauliche Daten vor unbefugtem Einblick, etwa dadurch, dass sich Dokumente nur per Passwort öffnen lassen.

Das Signaturgesetz
In Deutschland setzt das Signaturgesetz (kurz SigG; Erstfassung 1997) die Rahmenbedingungen für elektronische Signaturen. Das Gesetz reguliert den Markt der Zertifizierungsdiensteanbieter, kurz ZDA. Die Regelungen des Signaturgesetzes beruhen auf der „Richtlinie 1999/93/EG des Europäischen Parlaments und des Rates über gemeinschaftliche Rahmenbedingungen für elektronische Signaturen“.

Bundesnetzagentur
Ein Zertifizierungsdiensteanbieter muss bei der Bundesnetzagentur die Aufnahme des Betriebes anzeigen oder sich von ihr akkreditieren lassen. Hersteller von Signaturlösungen müssen zu ihren Produkten eine Herstellererklärung bei der Bundesnetzagentur hinterlegen oder ihr Produkt prüfen und bestätigen lassen. Die Bundesnetzagentur fungiert als oberstes Trust Center.

Auf alles vorbereitet 9)

Stufen der Sicherheit

Es gibt verschiedene, gebräuchliche Verfahren, um Dokumente digital zu signieren. Sie unterscheiden sich deutlich in ihrem Leistungsumfang und in der Sicherheit, die sie dem Anwender im Zweifelsfall beziehungsweise Streitfall bieten.

Einfache elektronische Signaturen

Das wäre zum Beispiel die Bilddatei einer eingescannten Unterschrift. Einfache elektronische Signaturen haben nur einen sehr geringen Beweiswert.

Fortgeschrittene elektronische Signaturen

Für diese Signaturen gelten höhere Anforderungen: Sie müssen Manipulationen an den Inhalten erkennbar machen, und die Authentizität des Unterzeichners muss über ein elektronisches Zertifikat zuzuordnen sein. Die fortgeschrittene elektronische Signatur hat eine geringere Beweiskraft vor Gericht als die qualifizierte elektronische Signatur.

Qualifizierte elektronische Signaturen

Bei dieser höchsten Sicherheitsstufe wird die elektronische Signatur ihrem Urheber über ein qualifiziertes Zertifikat zugeordnet, das von einem Zertifizierungsdiensteanbieter (ZDA) signiert wird. Der ZDA muss die Anforderungen gemäß Signaturgesetz erfüllen, unter anderem, dass er die Zertifizierungsdienste in einer geschützten Umgebung (Trust Center) betreibt.

Zertifizierungsdiensteanbieter unterliegen in Deutschland der Aufsicht durch die Bundesnetzagentur (BNetzA). Jeder Hersteller, der Geräte oder Software für die digitale Unterschrift anbietet, muss eine so genannte Herstellererklärung abgeben. Die Bundesnetzagentur ist zuständig für die Aufsicht über die Einhaltung des Signaturgesetzes. Im Streitfall kann ein bei der Bundesnetzagentur hinterlegtes Sicherheitskonzept zur Klärung der Rechtswirksamkeit einer digitalen Signatur herangezogen werden. Eine weitere Variante ist die „Qualifizierte elektronischen Signatur inklusive Anbieterakkreditierung“, die schon vor Betriebsstart den Zertifizierungsdiensteanbieter überprüft und zertifiziert. Sie ist für die Zertifizierungsdiensteanbieter sehr aufwändig.

Internationale Anerkennung

In den EU-Staaten existieren weitgehend übereinstimmende Regelungen für den Einsatz und zur Gültigkeit elektronischer Signaturen, sie werden gegenseitig anerkannt. Zertifizierungsdiensteanbieter aus anderen Mitgliedsstaaten sind inländischen Anbietern gleichgestellt, wenn sie die Vorgaben der EU-Richtlinie erfüllen.

Common Criteria

Unter der Überschrift „Common Criteria“ sind in einem internationalen Standard die Kriterien der Bewertung und Zertifizierung der Sicherheit von Computersystemen in Bezug auf Datensicherheit und Datenschutz zusammengefasst. Mit dem Common Criteria Standard lässt sich vermeiden, dass Komponenten beziehungsweise Systeme in verschiedenen Ländern mehrfach zertifiziert werden müssen. Auch digitale Signatur-Lösungen können per Common Criteria zertifiziert werden.

Mit dem Adobe Reader 8 können auch digitale Unterschriften vorgenommen werden, sofern diese Funktion zuvor in Acrobat aktiviert wurde.

Digitale Signaturen in PDF mit Acrobat

Digitale Signaturen in PDF-Dokumenten sind seit Acrobat-Version 4.0 und Adobe Reader 5.1 möglich. Während ältere Reader-Versionen nur das Ansehen und Prüfen der digitalen Signaturen vorsehen, können Anwender mit Adobe Reader 8 Dokumente auch unterzeichnen, wenn das Dokument zuvor in Acrobat dafür freigeschaltet wurde.

Beim Signieren in Acrobat wird die Signatur im PDF-Dokument selbst eingebettet. Maximal wird hierbei die „Fortgeschrittene elektronische Signatur“ unterstützt. Möchte man die weitergehenden „Qualifizierten elektronischen Signaturen“ verwenden, so ist der Einsatz spezieller Software notwendig, etwa „Openlimit PDF Sign for Adobe“. Weitere Informationen sind unter www.openlimit.com im Internet zu finden.

Auch eine digitale Signatur stellt zwar streng genommen eine Änderung des PDF-Dokuments dar. In diesem Ausnahmefall wird weder der PDF/A-Status noch der Inhalt des Dokuments beeinträchtigt. Daher ist es zulässig (und sinnvoll) eine PDF/A-Datei abschließend digital zu unterzeichnen.




PDF/A und digitale Signaturen

Nicht selten kommt man beim Thema PDF/A und digitale Signaturen in PDF in ein Dilemma, was die korrekte Abfolge der Schritte betrifft: Sowohl die Erstellung von PDF/A als auch die digitale Unterzeichnung stehen eigentlich am Abschluss einer Tätigkeit. Als PDF/A wird ein PDF dann gespeichert, wenn es in genau in dem vorliegenden Zustand archiviert werden soll – eine Änderung des PDF/A-Dokuments ist damit vom Prinzip her nicht (mehr) wünschenswert. Eine digitale Signatur soll ein PDF-Dokument exakt im aktuell vorliegenden Zustand zertifizieren, hier sind Änderungen unzulässig.

Signierte PDF/A-Dateien sind in der Praxis jedoch kein Problem. Es ist zulässig, PDF/A-Dateien mit einer digitalen Unterschrift zu versehen, ohne dass durch diesen Vorgang die PDF/A-Gültigkeit verloren gehen würde.

Es wird zuerst die PDF/A-Datei erzeugt, die abschließend mit einer digitalen Unterschrift signiert wird. Eine Signatur stellt nicht eine Dokumentveränderung im engeren Sinne dar, sondern ermöglicht vielmehr den Nachweis, dass das Dokument genauso wie signiert zum Zeitpunkt des Signierens vorgelegen hat.

Insofern stört oder beeinträchtigt das digitale Signieren die PDF/A-Gemäßheit eines PDF-Dokumentes nicht, sondern verstärkt diese vielmehr, sofern die digitale Signatur selbst sich an die Vorgaben des PDF/A-Standards hält.

Herausforderungen in der Praxis

Es gibt praktische Einsatzgebiete, bei denen digitale Signaturen entweder aus formalen Gründen an Grenzen stoßen, oder bei denen der Anwender ganz genau planen muss, wie der Ablauf einzelnen Verarbeitungsschritte aussehen soll.

Mehrfachsignieren

Aus dem Geschäftsleben und aus der Politik ist das Mehrfachsignieren von Urkunden und Dokumenten bekannt. So unterzeichnen etwa alle Mitglieder des Aufsichtsrates einen Beschluss, Minister ratifizieren eine Resolution mit ihrer Unterschrift. Bei digitalen Signaturen gibt es hier ein technisches Problem. Jede erneut unter ein PDF-Dokument gesetzte Signatur hebt die Gültigkeit der zuvor platzierten digitalen Unterschrift auf, da ja streng genommen das PDF-Dokument jedes Mal geändert wird. Dies betrifft vor allem PDF, da hier die Signatur eingebettet ist; bei anderen, externen Arten von Signaturen, gibt es das Problem verfahrensbedingt nicht.

Nachverfolgung von Änderungen in Acrobat: Will man wissen, ob, und wenn ja welche, Änderungen an einem PDF-Dokument nach dem Setzen einer Signatur vorgenommen wurden, so hilft ein Blick auf die „Unterschriftseigenschaften“. Diese öffnen sich per Mausklick auf eine Signatur. In den „Unterschriftseigenschaften“ kann sich der Anwender die Option „Unterschriebene Versionen anzeigen“ nutzen, um die jeweils mitgespeicherten Versionen der PDF-Datei durchzusehen.

Re-signieren

Aus Sicherheitsgründen wird digitalen Signaturen eine nur begrenzte Haltbarkeit zugemessen. Da man davon ausgehen kann, dass sich die Leistungsfähigkeit von Computersystemen stetig steigern wird, werden heute kaum überwindbare Sicherheitscodes in zehn Jahren vielleicht in wenigen Stunden durch reines Ausprobieren von einem Rechner geknackt. Ein Nach- oder Re-signieren ist also in bestimmten Intervallen notwendig, um Signaturen regelmäßig aufzufrischen. Dabei wird die bisherige digitale Unterschrift ungültig, da – wie oben erwähnt – jede neu zugefügte digitale Signatur die bereits platzierten Unterschriften ungültig macht.

Signierte PDFs als PDF/A archivieren

Vor praktischen Problemen stehen Anwender, die signierte, jedoch (noch) nicht PDF/A-konforme PDF-Dokumente erhalten haben, und diese dann in Form von PDF/A-Dokumenten archivieren wollen. Hier bleibt nur der Weg, dass man den Erzeuger nach der PDF/A-Konvertierung das Dokument erneut unterzeichnen lässt.

Kompliziert wird es auch, wenn ein PDF-Formular, das digital signiert werden muss, um gültig zu sein (etwa bei einem Vertrag), letztendlich als PDF/A in einem Archiv abgelegt werden soll. Auch hier muss der Workflow so aufgebaut sein, dass bereits vor der Unterzeichnung des Formulars die Speicherung als PDF/A stattfindet. So müssten beispielsweise in dem Formular hinterlegte JavaScript-Funktionen im Zuge des digitalen Signierens entfernt werden, oder für die in ausgefüllten Textfeldern vorkommenden Texte müsste unter Umständen die dafür verwendete Schrift eingebettet werden.



1) Markus Hein; PixelQuelle.de
2) „X-Ray Stars in M15“. N. White & L. Angelini (LHEA), GSFC, CXO, NASA; www.nasa.gov
4) Abbildung: Linotype FontExplorer X
5) Jens Goetzke; PixelQuelle.de
9) Die Grafik basiert auf einer Schemadarstellung des Bundesamts für Sicherheit in der Informationstechnik (BSI, Internet: www.bsi.bund.de).