Création de fichiers PDF prêts à archiver

Le format PDF/A (la norme ISO relative à l'archivage à long terme des documents PDF) devient de plus en plus le choix de prédilection pour l'archivage des documents. pdfaPilot est un expert dans la création de documents PDF/A prêts à archiver. Les pages qui suivent expliquent ce qui est pris en charge et détaillent les manières de procéder.

Différentes versions et variantes

La première question à se poser lorsque l'on envisage de créer des documents PDF/A est: quelle version et variante du standard utiliser? La liste complète est:

  • PDF/A-1a, PDF/A-1b
  • PDF/A-2a, PDF/A-2b, PDF/A-2u
  • PDF/A-3a, PDF/A-3b, PDF/A-3u

Versions

PDF/A-1 fut la version d'origine du standard. Elle ne reconnaît pas toute la liste des fonctionnalités modernes en matière de PDF, comme la transparence, les formes de compression d'images et les calques. PDF/A-2 a étendu la prise en charge de ces fonctionnalités et également ouvert la possibilité de stocker d'autres fichiers PDF/A à l'intérieur d'un PDF/A-2 (un PDF/A-2 pouvant ainsi se comporter lui-même comme une petite archive, en quelque sorte).

PDF/A-3 est la nouveauté la plus récente; il ouvre la possibilité de stocker n'importe quel fichier à l'intérieur d'un PDF/A-3. Il est ainsi possible de conserver des pièces jointes dans leur forme native avec l'e-mail archivé, par exemple, ou encore des factures électroniques au format PDF/A-3, avec leurs détails de facturation incorporés en XML.

Variantes

La variante 'b', ou 'de base', est entièrement axée sur la reproduction visuelle. Une seule chose compte: pouvoir afficher le document à l'écran, ou l'imprimer, exactement tel qu'il a été archivé.

La variante 'a', comme 'avancée', y ajoute quelques exigences. Le texte doit être incorporé de manière à pouvoir être extrait facilement (sa signification doit être claire, et pas uniquement son apparence visuelle), les images doivent avoir un texte associé (encore pour la clarté du sens) et tous les éléments du PDF/A doivent être balisés (pour rendre possible la distinction entre les différents niveaux de titre, le corps du texte, les paragraphes et tableaux ...).

La variante 'u', comme 'Unicode', se situe quelque part entre 'b' et 'a'. Elle se focalise essentiellement sur la reproduction visuelle, mais sans poser d'exigences quant à la facilité d'extraction ou de recherche du texte.

Quel standard utiliser?

Le choix dépend très fort des types de documents à archiver et des fonctionnalités souhaitées pour les archives. N'oubliez pas qu'un fichier PDF/A 'b' est beaucoup plus facile à créer qu'un 'a' (à cause de toutes les exigences supplémentaires).

La bonne nouvelle est que pdfaPilot prend en charge l'ensemble des versions et variantes de la norme, ce qui vous laisse toute liberté de ce point de vue.

Vérification ou conversion interactive de PDF/A

pdfaPilot Desktop fournit différentes manières de vérifier la conformité d'un PDF avec la version PDF/A de votre choix, et également plusieurs façons (d'essayer) de convertir un PDF dans votre version de PDF/A de prédilection. La méthode la plus aisée est toutefois la fenêtre 'PDF/A d'un seul clic'.

Figure 1: Fenêtre 'PDF/A d'un seul clic' de pdfaPilot Desktop

En agissant sur le bouton d'action (l'icône de roue dentée dans le coin supérieur droit), vous pouvez sélectionner les versions et variante de PDF/A avec lesquelles vous souhaitez travailler. La fenêtre vous propose alors deux boutons : l'un pour simplement contrôler un fichier PDF ouvert par rapport au standard PDF/A, et l'autre pour la convertir dans ce standard.

Dans les Préférences de pdfaPilot, vous pouvez indiquer si vous souhaitez activer des méthodes de secours en cas d'échec de la conversion normale en PDF/A.

Méthodes de secours pour la conversion

Les méthodes de secours sont utilisées après que pdfaPilot a effectué une tentative de conversion en PDF/A, mais que celle-ci a échoué. Les possibilités de repli sont alors les suivantes:

  • Conversion du document complet en PostScript, puis de nouveau en PDF. Cette opération force la conversion d'un certain nombre de nouvelles fonctionnalités PDF en fonctionnalités anciennes et elle récrit le fichier PDF à partir de zéro, ce qui suffit parfois à corriger les problèmes.
  • Conversion en images des pages qui posent problème. Si certaines pages spécifiques posent problème, pdfaPilot convertit uniquement ces pages en images et insère celles-ci dans le PDF à la place des pages d'origine.
  • Conversion de toutes les pages en images. Si aucune solution alternative ne fonctionne, pdfaPilot peut, dans un tout dernier effort pour corriger les problèmes du document PDF, créer un document PDF totalement nouveau et insérer une version image de toutes les pages du PDF d'origine dans un nouveau document PDF.

Ces méthodes de secours prennent évidemment du temps et elles impliquent souvent une dégradation de la qualité du document qui sera archivé au final. Il vous appartient de décider si vous souhaitez ou non y avoir recours. Si des clients vous envoient des fichiers et que vous devez absolument mettre quelque chose en archives, vous n’aurez parfois pas d'autre choix, avec des documents PDF particulièrement problématiques, que de procéder une conversion de secours.

Automatisation du processus

Dans la plupart des cas, le volume de fichiers que vous archivez est énorme. pdfaPilot Server peut toutefois facilement prendre en charge de tels volumes et traiter les documents PDF de manière automatique et non surveillée.

Figure 2: Tâche pdfaPilot job organisant la conversion automatique en PDF/A-1b

pdfaPilot Server vous permet de créer des tâches, et de définir pour chaque tâche, un dossier actif, un profil associé et un certain nombre de dossiers de sortie. Tous les fichiers qui arrivent dans le dossier actif y sont automatiquement prélevés pour être traités avec le profil sélectionné. Le résultat est envoyé dans le dossier de réussite ou d'erreur selon l'issue du traitement.

Contrôle en amont intégré

Souvent, la manière la plus efficace de contrôler la conformité des fichiers PDF au standard PDF/A choisi, ou de les convertir dans ce format, consiste à intégrer l'opération dans une solution plus large, comme un portail Web ou un système de gestion documentaire. callas fournit à la fois une solution en ligne de commande (CLI) et un véritable atelier de développement logiciel (SDK) pour assurer la prise en charge de ces scénarios.

Intégration par ligne de commande

pdfaPilot CLI est une application en ligne de commande. Il peut donc être exécuté à partir d'un terminal ou d'une fenêtre de commande, mais en général, il se lance à partir de l'application ou du script avec lesquels il a été intégré. Cette version de l'application prend en charge l'ensemble des capacités de PDF/A et elle peut générer automatiquement des rapports détaillés (en PDF ou XML) en vue d'une intégration plus poussée.

Intégration par le SDK

pdfaPilot SDK est une solution qui autorise une intégration au niveau bibliothèque. Le SDK contient les bibliothèques, en-têtes, documentations et exemples nécessaires pour intégrer étroitement la prise en charge de PDF/A dans une application C, C++, Java ou .Net. L'intégration de l'archivage par le SDK demande des ressources de développement, mais elle peut être la plus aboutie au final.

Des questions?

Vous pouvez en apprendre beaucoup plus sur tous les produits mentionnés en consultant les pages de produits sur le site web. Ou contactez-nous simplement pour bénéficier d'une démonstration personnalisée, ou obtenir des réponses à des questions plus approfondies.