Archiefklare PDF-bestanden maken

In steeds meer omgevingen is PDF/A (de ISO-norm voor lange-termijn archivering van PDF-documenten) aan het uitgroeien tot het populairste bestandsformaat om documenten te archiveren. pdfaPilot is een expert in het maken van archiefklare PDF/A-documenten. Lees verder voor achtergrondinformatie over wat wordt ondersteund en hoe het wordt aanpakt.

Verschillende versies & niveaus

De eerste vraag bij het overwegen van het maken van PDF/A-documenten is meestal: welke versie en welk niveau van de norm is aangewezen? Dit is de volledige lijst:

  • PDF/A-1a, PDF/A-1b
  • PDF/A-2a, PDF/A-2b, PDF/A-2u
  • PDF/A-3a, PDF/A-3b, PDF/A-3u

Versies

PDF/A-1 is de oorspronkelijke versie van de norm en biedt geen ondersteuning voor moderne PDF-functies zoals transparantie, vormen van compressie voor afbeeldingen en lagen. PDF/A-2 voegde ondersteuning toe voor die functies en introduceerde de mogelijkheid om ín een PDF/A-2-bestand andere PDF/A-bestanden te bewaren, waardoor een PDF/A-2-bestand een klein archief op zich wordt.

PDF/A-3, de meest recente toevoeging, maakt het mogelijk om eender welk bestand te bewaren in een PDF/A-3-bestand. Concreet betekent dit bijvoorbeeld dat e-mailbijlagen in hun oorspronkelijke vorm kunnen worden bewaard in de gearchiveerde e-mail en dat factuurgegevens in XML kunnen worden ingesloten in elektronische facturen in PDF/A-3-formaat.

Niveaus

Bij het niveau 'b' (basic level) ligt de focus volledig op behoud van de visuele weergave. Het enige wat telt, is dat het document exact moet kunnen worden weergegeven of afgedrukt zoals het kon worden weergegeven of afgedrukt toen het werd gearchiveerd.

Het niveau 'a' (advanced level) voegt extra eisen toe. Tekst moet zodanig ingesloten zijn dat deze gemakkelijk kan worden uitgepakt. Dat betekent dat niet alleen de visuele weergave juist moet zijn maar ook dat de betekenis duidelijk moet zijn. Afbeeldingen moeten bijhorende Alt-tekst hebben die de betekenis ervan duidelijk maakt. Alle elementen in het PDF/A-bestand moeten gecodeerd zijn: ze moeten documentstructuurcodes hebben om een onderscheid te kunnen maken tussen de verschillende kopniveaus, de tekst, alinea’s, tabellen ...).

Het niveau 'u' (Unicode level) houdt het midden tussen 'b' en 'a'. Dit niveau focust vooral op behoud van de visuele weergave maar vereist dat alle tekst gemakkelijk kan worden uitgepakt of doorzocht.

Welke versie en welk niveau kiezen?

Wat de juiste keuze is, hangt sterk af van welke soorten documenten je archiveert en welke functies je wilt ondersteunen in je archief. Denk eraan dat het veel gemakkelijker is om een PDF/A-bestand van niveau 'b' te maken dan een PDF/A-bestand van niveau 'a' (vanwege alle extra eisen).

Belangrijk om te weten is dat pdfaPilot álle versies en alle niveaus van de norm ondersteunt. Wat dat betreft heb je complete keuzevrijheid.

Interactieve controle of conversie naar PDF/A

pdfaPilot Desktop biedt verschillende manieren om te controleren of een PDF voldoet aan de gewenste PDF/A-versie en verschillende manieren om een PDF te converteren naar de gewenste PDF/A-versie (of een poging daartoe te ondernemen). De gemakkelijkste manier is het venster 'PDF/A in one click'.

Afbeelding 1: Het venster PDF/A in one click in pdfaPilot Desktop

Met behulp van de actieknop (de knop met het tandwielpictogram in de rechterbovenhoek) kan je selecteren met welke versie en welk niveau van PDF/A je wilt werken. Het venster geeft dan twee knoppen weer: de ene om voor het geopende PDF-bestand te controleren of het voldoet aan de geselecteerde PDF/A-norm, de andere om het bestand te converteren naar die norm.

Via de pdfaPilot voorkeuren kan je kiezen of je fallbackmethoden inschakelt, die een alternatief bieden als de normale conversie naar PDF/A niet lukt.

Fallbackmethoden voor de conversie

Fallbackmethoden worden gebruikt wanneer pdfaPilot heeft geprobeerd om het bestand te converteren naar PDF/A en die conversie is mislukt. Als fallback kan je:

  • Het complete document eerst naar PostScript converteren en vervolgens terug naar PDF. Daardoor wordt een aantal nieuwere PDF-functies gedwongen geconverteerd naar oudere functies en wordt een nieuw PDF-bestand geschreven. Soms zorgt dat ervoor dat problemen worden hersteld.
  • Pagina’s met problemen converteren naar afbeeldingen. Als specifieke pagina’s problemen hebben, zal pdfaPilot alleen die pagina’s converteren naar afbeeldingen en deze in plaats van de oorspronkelijke pagina invoegen in de PDF.
  • Alle pagina’s converteren naar afbeeldingen. Als er niets anders werkt, kan pdfaPilot een volledig nieuw PDF-document maken en een afbeeldingsversie van alle pagina’s van de oorspronkelijke PDF invoegen in dat nieuwe PDF-document. Dit is een laatste poging om de problemen in het oorspronkelijke PDF-document te herstellen.

Uiteraard vergen deze fallbackmethoden tijd. En vaak hebben ze als consequentie dat het gearchiveerde document inboet aan kwaliteit. Het is aan jou om te beslissen of je deze fallbackmethoden wilt gebruiken. Als je bestanden ontvangt van klanten en deze absoluut moét archiveren, heb je soms geen andere keuze dan te werken met fallbackconversie voor PDF-documenten met problemen.

Het proces automatiseren

In de meeste omgevingen moet een enorme hoeveelheid bestanden worden gearchiveerd. Geen nood: pdfaPilot Server kan gemakkelijk dergelijke volumes aan. Het verwerkt PDF-documenten automatisch, zonder dat er toezicht nodig is.

Afbeelding 2: Een pdfaPilot job voor automatische conversie naar PDF/A-1b

Met pdfaPilot Server kan je jobs aanmaken. Voor elke job wordt een actieve map (hot folder), een bijhorend profiel en een aantal uitvoermappen gedefinieerd. Alle bestanden die terechtkomen in de actieve map, worden automatisch opgehaald en verwerkt aan de hand van het geselecteerde profiel. Afhankelijk van het verwerkingsresultaat, wordt het resultaat gerouteerd naar de map 'Success' of 'Error'.

Geïntegreerde PDF-controle

Integratie in een grotere oplossing, zoals een webportaal of DMS-systeem (Document Managment System), is vaak de meest efficiënte manier om voor PDF-bestanden te controleren of ze voldoen aan je PDF/A-norm of deze ernaar te converteren. Voor dergelijke scenario’s biedt callas zowel een CLI-oplossing (command-line interface) als een echte SDK (Software Development Kit).

Command-line integratie

pdfaPilot CLI is een command-line toepassing. Het kan worden gestart vanuit een terminal- of opdrachtvenster, maar meestal wordt het gelanceerd vanuit de toepassing of het script waarmee het is geïntegreerd. Deze versie ondersteunt alle PDF/A-mogelijkheden van de andere toepassingen en kan automatisch gedetailleerde rapporten genereren (in PDF of XML) voor verdere automatisering.

Gebruikmaken van de SDK

pdfaPilot SDK is een oplossing die integratie op bibliotheekniveau mogelijk maakt. De SDK bevat de nodige bibliotheken, headers, documentatie en voorbeelden om PDF/A-ondersteuning naadloos te integreren in een C-, C++-, Java- of .Net-toepassing. Dat vereist weliswaar kennis van scripten maar levert de beste integratie op.

Vragen?

Op de productpagina’s op de website kan je veel meer lezen over alle vermelde producten. Aarzel niet om contact met ons op te nemen voor een demo op maat of een antwoord op specifieke vragen.