Erstellen von archivtauglichen PDF-Dateien

PDF/A (der ISO-Standard für die langfristige Archivierung von PDF-Dokumenten) ist zunehmend das bevorzugte Format für die Archivierung von Unterlagen. pdfaPilot ist ein Experte in der Erstellung von archivtauglichen PDF/A-Dokumenten. Lesen Sie weiter und erfahren Sie mehr über Ihre Möglichkeiten und Verfahrensweisen.

Unterschiedliche Versionen und Varianten

Die erste Frage vor der Erstellung eines PDF/A-Dokuments ist üblicherweise, welche Version und Variante des PDF-Standards benötigt wird. Dies ist die vollständige Liste:

  • PDF/A-1a, PDF/A-1b
  • PDF/A-2a, PDF/A-2b, PDF/A-2u
  • PDF/A-3a, PDF/A-3b, PDF/A-3u

Versionen

PDF/A-1 war die ursprüngliche Version des Standards. Er erlaubt nicht alle modernen PDF-Funktionen wie Transparenz, Bildkompressionsformate oder Ebenen. PDF/A-2 unterstützt diese Funktionen und die Möglichkeit, andere PDF/A-Dateien in einer PDF/A-2-Datei zu speichern (lässt ein PDF/A-2 gewissermaßen selbst als kleines Archiv fungieren).
PDF/A-3 ist die neueste Version und eröffnet die Möglichkeit jede beliebige Datei in einer PDF/A-3-Datei zu speichern. Dadurch können beispielsweise E-Mail-Anhänge in ihrem Originalformat innerhalb der Archiv-E-Mail gespeichert werden oder elektronische Rechnungen als PDF/A-3-Dateien, in denen die Rechnungsdaten als XML eingebettet sind.

Varianten

Die Variante „b“ oder „basic“ konzentriert sich gänzlich auf die visuelle Reproduktion. Alles, was zählt, ist, dass das Dokument auf einem Bildschirm oder im Druck genauso ausgegeben wird, wie es archiviert wurde.
Die Variante „a“ oder „advanced“ (erweitert) fügt weitere Anforderungen hinzu. Text muss auf eine Weise eingebettet werden, mit der einfach extrahiert werden kann (die Bedeutung muss klar ersichtlich sein, nicht nur die visuelle Erscheinung), Bilder müssen mit Alternativ-Text verknüpft sein (wiederum um ihre Bedeutung zu klären) und alle Elemente des PDF/A müssen mit Tags versehen werden (um zwischen verschiedenen Überschriftenebenen, Text, Absätze und Tabellen usw. unterscheiden zu können).
Die Variante „u“ oder „Unicode“ liegt zwischen „b“ und „a“. Sie ist hauptsächlich auf visuelle Reproduktion konzentriert, erfordert jedoch, dass der gesamte Text leicht extrahiert oder durchsucht werden kann.

Welche Variante sollten Sie verwenden?

Das hängt davon ab, welche Arten von Dokumenten Sie archivieren und welche Funktionen Sie in Ihrem Archiv aktivieren möchten. Bedenken Sie, dass es sehr viel einfacher ist, eine PDF/A-Datei der Variante „b“ zu erstellen als eine PDF/A-Datei der Variante „a“ (aufgrund der zusätzlichen Anforderungen).
Die gute Nachricht ist, dass der pdfaPilot alle Versionen und Varianten des Standards unterstützt und Ihnen diesbezüglich somit komplette Freiheit bietet.

Interaktive Prüfung oder Konvertierung von PDF/A

pdfaPilot Desktop stellt unterschiedliche Möglichkeiten zur Verifizierung der Compliance eines PDF mit Ihrer bevorzugten PDF/A-Version und unterschiedliche Möglichkeiten der Konvertierung (oder des Konvertierungsversuchs) eines PDF in Ihre bevorzugte PDF/A-Version bereit. Die einfachste Art und Weise stellt jedoch das „PDF/A mit einem Klick“-Fenster dar.


Abbildung 1: das Fenster „PDF/A mit einem Klick“ in pdfaPilot Desktop

Mit der Aktionsschaltfläche (die Schaltfläche mit dem Zahnradsymbol rechts oben) können Sie die PDF/A-Version und -Variante auswählen, mit der Sie arbeiten möchten. Das Fenster zeigt zwei Schaltflächen. Eine, um eine geöffnete PDF-Datei gegen den von Ihnen gewählten PDF/A-Standard zu prüfen, die andere, um sie in diesen Standard zu konvertieren.
Anhand der Einstellungen des pdfaPilots können Sie festlegen, ob Sie Ausweichmethoden aktivieren möchten, falls die reguläre Konvertierung nach PDF/A nicht funktioniert.

Ausweichmethoden für die Konvertierung

Ausweichmethoden werden verwendet, wenn der Konvertierungsversuch durch den pdfaPilot nach PDF/A fehlgeschlagen ist. Als Ausweichmöglichkeit besteht:

  • die Konvertierung des vollständigen Dokuments in eine PostScript-Datei und danach zurück in ein PDF. Dadurch wird die Konvertierung einiger neuer PDF-Funktionen zu älteren Funktionen erzwungen und die PDF-Datei wird von Grund auf neu erstellt, wodurch manchmal Probleme behoben werden können.
  • die Umwandlung von Seiten in Bilder. Wenn bestimmte Seiten Probleme bereiten, konvertiert pdfaPilot nur diese Seiten zu Bildern und fügt sie statt der Originalseite in das PDF ein.
  • die Umwandlung aller Seiten in Bilder. Wenn nichts anderes funktioniert, kann der pdfaPilot ein völlig neues PDF-Dokument erstellen und eine Bildversion aller Seiten des Original-PDF in dieses neue PDF-Dokument einfügen. Es stellt einen letzten Ausweg dar, die Probleme des Original-PDF-Dokuments zu lösen.

Diese Ausweichmethoden erfordern natürlich mehr Zeit und ziehen häufig eine Qualitätsminderung für das zu archivierende Dokument nach sich. Es ist Ihre Entscheidung, ob Sie diese Ausweichmethoden nutzen. Wenn Ihnen Kunden Dateien einreichen und Sie unbedingt etwas archivieren müssen, haben Sie manchmal keine andere Wahl, als mit einer Ausweichkonvertierung bei problematischen PDF-Dokumenten zu arbeiten.

Den Prozess automatisieren

In den meisten Fällen ist die Zahl der Dateien, die archiviert werden müssen, enorm. Der pdfaPilot Server kann große Volumen leicht handhaben und PDF-Dokumente automatisch und unbeaufsichtigt verarbeiten.

Abbildung 2: ein Job im pdfaPilot, anhand dessen nach PDF/A-1b konvertiert wird

Der pdfaPilot Server ermöglicht Ihnen die Einrichtung von Jobs. Jeder Job verfügt über einen überwachten Ordner, ein zugehöriges Profil und mehrere Ausgabeordner. Alle Dateien, die in einem überwachten Ordner eingehen, werden automatisch abgeholt und mit dem ausgewählten Profil verarbeitet. Das Ergebnis wird in einem der Ordner je nach Erfolg der Konvertierung ausgegeben.

Integriertes Preflight

Häufig ist es effizienter, die Compliance von PDF-Dateien mit Ihrem PDF/A-Standard zu prüfen oder sie in dieses zu konvertieren, wenn dies in eine umfassendere Lösung wie beispielsweise ein Delivery Portal oder eine Web-to-Print-Lösung eingebunden ist. callas stellt für diese Einsatzbereiche sowohl eine Kommandozeilen-Lösung als auch ein Software Development Kit (SDK) zur Verfügung.

Integration über die Kommandozeile

pdfaPilot CLI ist eine Kommandozeilen-Anwendung. Sie lässt sich in einem Terminal- oder Befehlszeilenfenster starten, wird jedoch üblicherweise aus einer Anwendung oder einem Script, in das sie integriert ist, aufgerufen. Diese Anwendungsversion unterstützt alle PDF/A-Funktionen und kann automatisch detaillierte Berichte (als PDF- oder XML-Datei) zur weiteren Automatisierung erstellen.

Das SDK

Die Lösung pdfaPilot SDK ermöglicht eine Integration auf Bibliotheksebene. Das SDK enthält die notwendigen Bibliotheken, Header, Dokumentationen und Muster, um die PDF/A-Unterstützung eng mit einer C-, C++-, Java- oder .Net-Anwendung zu verzahnen. Dafür sind Entwicklungsressourcen erforderlich, es sorgt jedoch für die letztendlich durchgängigste Integration.

Fragen?

Viele weitere Informationen über die erwähnten Produkte finden Sie auf den Produktseiten der Website. Kontaktieren Sie uns, um eine maßgeschneiderte Demo-Vorstellung zu vereinbaren, oder teilen Sie uns einfach Ihre eingehenderen Fragen mit.