Creación de archivos PDF listos para almacenar

Cada vez más, PDF/A (el estándar ISO para almacenamiento de documentos PDF a largo plazo) se está convirtiendo en el formato de archivo preferido para almacenar documentos. pdfaPilot es experto en crear documentos PDF/A listos para ser almacenados. Siga leyendo para obtener información exhaustiva sobre qué admite este formato y cómo actuar al respecto.

Diferentes versiones

La primera pregunta cuando se trata de crear documentos PDF/A suele ser qué versión del estándar se debería usar. La lista completa es:

  • PDF/A-1a, PDF/A-1b
  • PDF/A-2a, PDF/A-2b, PDF/A-2u
  • PDF/A-3a, PDF/A-3b, PDF/A-3u

Versiones

PDF/A-1 fue la versión original del estándar; no permite muchas de las funciones modernas de PDF disponibles como, por ejemplo, transparencias, formas de compresión de imágenes y capas. El formato PDF/A-2 incorporó la compatibilidad con estas funciones y también hizo posible el almacenamiento de otros archivos PDF/A dentro de un archivo PDF/A-2 (permitiendo con ello que un archivo PDF/A-2 actúe como un repositorio de tamaño reducido, por así decirlo).

PDF/A-3 es la adición más reciente y amplía la forma de almacenar cualquier archivo dentro de un archivo PDF/A-3. Esto permite que los archivos adjuntos de correo electrónico se almacenen en su formato nativo dentro del correo electrónico archivado por ejemplo, o que las facturas electrónicas en formato PDF/A-3 lleven los datos de facturación incrustados como XML.

Variantes

La versión 'b' o 'básica' se centra por completo en la reproducción visual: lo único que cuenta es poder ver el documento en la pantalla o imprimirlo exactamente igual que como se puso en el repositorio.

La versión 'a' o 'avanzada' añade requisitos adicionales. El texto se debe incrustar de tal forma que se pueda extraer con facilidad (el significado debe ser claro, no solo la apariencia visual), las imágenes deben tener texto alternativo asociado con ellas (una vez más, para que su significado sea claro) y todos los elementos del PDF/A deben estar etiquetados (para poder distinguir entre los distintos niveles de titulación, texto del mensaje, encontrar párrafos y tablas, ....).

La versión 'u' o 'Unicode' se sitúa entre las versiones 'b' y 'a'. Se centra principalmente en la reproducción visual, pero requiere que todo el texto se pueda extraer o buscar con facilidad.

¿Qué versión debe usar?

Eso depende en gran medida de los tipos de documentos que vaya a almacenar y qué funciones desee habilitar en su repositorio. Tenga en cuenta que es mucho más fácil crear un archivo PDF/A 'b' que un archivo PDF/A 'a' (por todos los requisitos adicionales que este conlleva).

La buena noticia es que pdfaPilot admite todas las versiones del estándar, para que tenga plena libertad en ese sentido.

Verificación interactiva o conversión de PDF/A

pdfaPilot Desktop proporciona varias formas de verificar el cumplimiento de un PDF con la versión de PDF/A que elija y varios métodos para convertir, o intentar convertir, un PDF a la versión de PDF/A que le interese. La forma más fácil es, no obstante, la ventana 'PDF/A en un clic'.

Figura 1: Ventana PDF/A en un clic de pdfaPilot Desktop

Mediante el botón de acción (el botón con el icono de rueda dentada situado en la esquina superior derecha) puede seleccionar con qué versión de PDF/A desea trabajar. La ventana ofrece seguidamente dos botones: uno para comprobar simplemente si el archivo PDF abierto cumple con el estándar PDF/A seleccionado, y el otro para convertirlo a ese estándar.

En las preferencias de pdfaPilot puede seleccionar si desea habilitar métodos alternativos si fallara la conversión normal a PDF/A.

Métodos alternativos para la conversión

Los métodos alternativos se usan cuando pdfaPilot ha intentado realizar una conversión a PDF/A y ha fallado. Como medida alternativa puede:

  • Convertir todo el documento a PostScript y luego de vuelta a PDF. Este proceso fuerza la conversión de una serie de funciones PDF más nuevas a funciones más antiguas y reescribe el archivo PDF desde cero, lo cual consigue a veces reparar los problemas.
  • Convertir páginas con problemas en imágenes. Si hay páginas específicas con problemas, pdfaPilot convertirá a imágenes solamente esas páginas, e insertará las imágenes en el PDF en lugar de las páginas originales.
  • Convertir todas las páginas a imágenes. Si nada de lo anterior funciona, pdfaPilot puede crear un documento PDF totalmente nuevo e insertar una versión de imagen de todas las páginas del PDF original en este documento PDF nuevo, en un último esfuerzo por reparar los problemas presentes en el documento PDF original.

Evidentemente, estos métodos alternativos tardan tiempo en ejecutarse y a menudo implican la degradación de la calidad del documento que se incluirá en el repositorio. Por tanto, es decisión suya si desea usar estos métodos alternativos o no. Si los clientes le envían archivos y es absolutamente imperativo poner algo en el repositorio, a veces no queda más remedio que trabajar con los métodos de conversión alternativos cuando los documentos PDF dan problemas.

Automatización del proceso

En la mayoría de los casos, el volumen de archivos que se debe poner en un repositorio es enorme; pdfaPilot Server puede trabajar fácilmente con este tipo de volúmenes y procesar documentos PDF de manera automática y sin supervisión.

Figura 2: Trabajo de pdfaPilot para convertir a PDF/A-1b automáticamente

pdfaPilot Server le permite crear trabajos, donde cada trabajo tiene una carpeta de inspección, un perfil asociado y un número de carpetas de salida definido. Todos los archivos que llegan a la carpeta de inspección se toman automáticamente y se procesan con el perfil seleccionado. El resultado se coloca en la carpeta designada para archivos con errores o archivos correctos, en función del resultado de procesamiento.

Verificación previa integrada

A menudo, la forma más eficaz de comprobar si los archivos PDF cumplen con el estándar PDF/A o convertirlos a él, está integrada en una solución más potente, como un portal web o un sistema de gestión de documentos. callas las proporciona las dos: una solución de líneas de comandos y un SDK auténtico para admitir ambos escenarios.

Integración de líneas de comandos

pdfaPilot CLI es una aplicación de líneas de comandos que se puede iniciar desde una ventana de comandos o un terminal, pero que se suele iniciar desde la aplicación o el script donde está integrada. Esta versión de la aplicación admite todas las funciones de PDF/A y puede generar automáticamente informes detallados (en formatos PDF o XML) para mayor automatización.

Utilización de SDK

pdfaPilot SDK es una solución que ofrece la integración en un nivel de librerías. El SDK contiene las librerías, encabezados, documentación y muestras necesarios para integrar perfectamente la compatibilidad con PDF/A en una aplicación C, C++, Java o .Net. Esto requiere recursos de desarrollo pero, en definitiva, hace posible la mejor integración posible.

¿Alguna pregunta?

Puede encontrar mucha más información sobre todos los productos mencionados en las páginas de productos del sitio web. Si lo prefiere, puede ponerse en contacto con nosotros para conseguir una demostración personalizada o hacernos preguntas más específicas.