Hace un tiempo, encontré en la Red una colección de notas sobre el uso del formato PDF en artes gráficas que se llamaba “El Rincón del PDF” (PDF Corner). Su autor era un preimpresor belga llamado Laurens Leurs que amablemente me permitió hacer y publicar una versión en español.
Ahora he reunido muchas más notas y páginas sobre el tema (la mayoría son traducciones), ya que el uso de PDF en artes gráficas se ha vuelto muy común. Por eso, he decidido reunirlas aquí todas en este apartado, estructurándolas y ordenándolas para que su consulta sea más sencilla.
Muchas de las notas originales de Leurs han quedado obsoletas, ya que se remontan a finales de los años noventa y primeros años del siglo XXI. Sin embargo, otras mantienen su validez. Por eso, aunque su consulta puede aclarar muchas veces a quien esté buscando una información, conviene mirar siempre la fecha de publicación original de cada página y estar atento a qué versiones de qué programas se hace referencia.
El FAQ sobre PDF/X de Martin Bailey me parece una lectura tan necesaria que le he dado un lugar aparte.
A continuación, una lista del contenido de este apartado sobre el uso de PDF en artes gráficas:
Por Gustavo Sánchez Muñoz, septiembre de 2006
Como un un pdf es un fichero que sigue unas reglas determinadas en su estructura, cualquier procedimiento de construcción de ficheros que sea capaz de observar esas reglas podrá crear PDFs.
La calidad de los PDFs resultantes dependerá de cuáles sean los criterios usados para construirlos y de las necesidades que tenga el usuario final. No es igual de fácil crear un PDF para ver en pantalla e imprimir en aparatos caseros, que hacer uno destinado a imprenta comercial en cuatricromía, por ejemplo (donde los requisitos son más estrictos).
Hacer una lista de los métodos y programas capaces de crear PDFs y de sus posibilidades es una misión imposible: cada día hay más y su calidad es mejor (por no decir que las especificaciones del formato también avanzan).
Por eso, esta página no pretende ser una lista, sino sólo mencionar los principales programas que el usuario medio de artes gráficas, principalmente diseñadores gráficos, tiene a su disposición para cear PDFs válidos para imprenta.
Su origen es una página creada hace pocos años Laurens Leurs para su PDF Corner, que me permitió traducir y publicar en español. En esta revisión, he aprovechado lo que he podido de aquel original. Espero que sirva para hacerse una idea de cómo está la situación general, sobre todo en lo que respecta a crear PDFs para artes gráficas.
Cada día hay más programas que son capaces de crear directamente PDFs sin necesidad de añadidos (plug-ins) o terceros programas (como Acrobat Distiller).
Estos programas se pueden dividir en dos categorías: Aquellos cuyos PDFs son de alta calidad y los que simplemente crean PDFs.
Los primeros suelen ser programas relacionados con las artes gráficas, donde los requisitos son más exigentes y estrictos. Por eso sus fabricantes han incluido librerías de programación para PDF bastante complejas. Los más destacados son InDesign, Illustrator, Photoshop, PageMaker, FrameMaker (de Adobe), CorelDraw,o Freehand. También hay algunos de código abierto que comienzan a abrirse camino, como Scribus. En sus versiones más recientes, la mayoría de ellos son capaces de crear directamente PDFs conforme a los estándares PDF/X.
Los segundos suelen ser programas del mundo ofimático, donde las necesidades son menores e interesan más capacidades como las de crear PDFs ligeros o indexables.
En ambos casos, hay que tener en cuenta que no es intención de los programadores crear programas cuyo formato nativo sea PDF, ya que no es un formato pensado para la reedición.
Son programas cuya finalidad es tomar documentos de otras aplicaciones y crear PDFs a partir de ellos. La mayoría funcionan como impresoras virtuales; es decir: Programas que simulan ser impresoras y que imprimen PDFs. De hecho, algunos de ellos son casi simples controladores de impresora.
Otros son verdaderos intérpretes PostScript y otros funcionan como servidores de impresión, capaces de procesar gran cantidad de documentos de diverso origen para crear PDFs de forma automatizada.
Como en el caso de los programas capaces de generar PDFs por si mismos, podemos dividirlos en dos categorías: Aquellos cuyos PDFs son de alta calidad y los que simplemente crean PDFs. En cada caso, hay dos subcategorías: Los que funcionan de forma aislada en un ordenador (como programa o como controlador de impresión) y los que hacen de servidores para crear PDFs.
En la primera categoría, se encuentran programas como Acrobat Distiller, Jaws PDF Creator, SpeedFlow Check y Asura (ambos de OneVision), a Colour Chameleon o Nitro PDF. De ellos, destacaría Acrobat Distiller, por ser el más extendido entre todo tipo de usuarios profesionales, y Asura, por ser una solución de alto nivel para artes gráficas.
En la segunda categoría, se encuentran utilidades como GhostScript, PDFCreator, CutePDF, Primo PDF, PDF995, eDocPrinter. Muchos de ellos son shareware o pertenecen a la corriente de código abierto.
Antiguamente existía PDFWriter, de la propia Adobe, pero hoy se puede considerar desaparecido.
Mención aparte merece el sistema OS X de Apple,que incluye un modelo de representación visual llamado Quartz 2D que, entre otras cosas, permite convertir PostScript a PDF directamente desde el mismo sistema a todos los programas. Si un programa incluye capacidades PDF pertenecientes a las últimas especificaciones de ese formato, es posible que la versión de Quartz 2D que haya en el sistema no sea capaz de generar el PDF adecuadamente.
Existen algunos sitios web que gratuitamente o a cambio de una cuota de suscripción, permiten crear PDFs a través de Internet: Se carga el fichero original al servidor y éste devuelve el PDF. Dos servicios así que existen en la actualidad son PDF Online (de la firma BCL Technologies) y Create Adobe PDF Online, de la propia Adobe. Sobre la calidad y rapidez del servicio no tengo referencias de momento.
Existen unas cuantas librerías y herramientas de programación que permiten incluir la capacidad de crear ficheros PDF en diversos programas. Como en el caso de los programas, cada vez hay más y es imposible describirlas a todas. Las más destacables desde el punto de vista de las artes gráficas (aparte de las que usa la propia Adobe) son Jaws PDF Library (esta es la opción elegida por Quark para poder crear PDFs directamente con Quark XPress a partir de su versión 6) y PDFlib.
Además de las funciones para crear o tratar PDFs que se incluyen en las últimas versiones del lenguaje PHP, existen algunas clases en lenguaje PHP para poder generar PDFs sobre la marcha en sitios web. En sistemas de gestión de contenido (como Drupal, usado en este mismo sitio web) eso es bastante útil. Dos ejemplos de esas clases son FPDF y TCPDF. Las posibilidades de creación de estas clases es bastante limitada, como su calidad final.
Mediante un vocabulario especializado para formateo de objetos con hojas de estilo XSL-FO, es posible crear directamente PDFs a partir de datos XML, que son absolutamente independientes de ese formato.
La potencia de esta vía XSL-FO es grande, sobre todo en lo que a formateo y entrega instanea de datos se refiere. Cada vez hay más productos que permiten crear o tratar las reglas necesarias para ese formateo mediante XSL-FO (Visual Stylesheet Designer de Altova o XEP Engine de RenderX, Xml2PDF de AltSoft, por ejemplo) o para generar los PDFs.
Ese es el caso del proyecto Apache FOP (Formatting Objects Processor), un formateador de datos basado en lenguaje Java capaz de generar PDFs (además de otros formatos).
Se abre el documento en Acrobat (debe ser la versión Professional 7 o superior).

En el menú "Documento - Extraer páginas", marcas de la primera a la última. Además, marcas la casilla "Extraer páginas como archivos independientes".
Acrobat pedirá una carpeta de salida para los documentos. Se la indicas y ya está, Acrobat dejará allí los 200 PDFs de páginas individuales.
Tarda muy poco.
Acrobat respeta las marcas de geometría de página (TrimBox, BleedBox, etc…) de cada una de las páginas. Así que cualquier programa de imposición que se rija por ellas podrá usar los documentos resultantes (si el documento padre las tenía bien ajustadas, claro está).
Si el documento original era un PDF/X-1a:2001, por ejemplo, ninguno de los documentos hijos lo será: Faltan las claves de PDF/X-1a y el propósito de impresión (OutputIntent). El documento no se ha deteriorado. Simplemente, Acrobat no incrusta esos valores en los documentos nacidos de esa fragmentación.
Acrobat entiende las dobles páginas como páginas simples. Por eso, si quien creó el PDF lo hizo por dobles páginas, Acrobat no podrá fragmentar automáticamente esas dobles páginas con este método. Para eso habrá que usar otros sistemas.
¿Alguna vez has recibido un PDF con imágenes y no sabes cómo extraerlas adecuadamente para usarlas en otro trabajo? Si intentas abrirlo con Photoshop para extraer las imágenes te vas a meter en un lío: No puedes saber qué resolución tienen hasta que lo abres y para abrirlo necesitas indicarle a qué resolución van… O sea, que lo más posible es que te equivoques abriéndolas con más resolución de la que tienen o con menos… Y cada una puede ser distinta a la otra.

Necesitas Adobe Acrobat Pro (o sea: La versión de pago). En las versiones 6 o 7, ve al menú "Avanzadas - Exportar todas las imágenes". Se elige una carpeta y un formato que no degrade las imágenes (*.TIFF es la opción más adecuada). La clave está en las opciones que se marquen en el boton "Configuración…":

En la zona "Configuración de archivo" elegimos la compresión. Para escala de grises y color lo mejor es "Ninguna", la verdad (aunque LZW o Zip son válidas), en monocromo da igual. En "Administración de color" de RGB y CMYK lo mejor sería marcar "Incrustar perfil", pero si tenemos dudas de cuál es el correcto, lo podemos dejar desactivado (podemos asignárselo luego en Photoshop).
La parte esencial está en la zona "Conversión". Allí podemos marcar el "Espacio de color" y la "Resolución" con la que queremos que se guarden las imágenes extraidas. Es sencillo: Aunque podemos forzar una conversión de color (todo a "Escala de grises", por ejemplo) y un ajuste de resolución (que todas se guarden a "72 ppp", por ejemplo), lo recomendable es dejar ambas opciones en "Determinar automáticamente". De esa forma, Acrobat las exportará tal cual son. Es decir, que si una está a 325 ppp en escala de grises y otra a 800 ppp en bitmap (imagen de línea), las guardará así, sin modificarlas en absoluto.
En Acrobat 5, esta orden estaba en el menú "Archivo - Exportar - Extraer imágenes como…".
El inconveniente es que está orden no permite seleccionar zonas del documento, ya que obliga a una exportación total. Por eso, si se trata de un documento muy largo, te recomiendo que hagas una copia y borres las páginas de las que no quieres nada antes de extraer las imágenes.
Acabo de leer en el estupendo sitio CreativeTech Tips, sobre el que pienso tener puesto el ojo desde que lo he encontrado que desde Photoshop CS2 sí se puden extraer bien las imágenes de mapas de bits (las fotografías, vaya). Es sencillo, aunque esté un poco escondido (en Photoshop CS3 es un poco más evidente).
Al ir a abrir un PDF en photoshop, aparece un cuadro de diálogo como el que ves arriba que, aparentemente, te obliga a rasterizar todos los elementos de la página del PDF que abras, imágenes incluidas. De ese modo es imposible saber cuál es la resolución nativa del original en el PDF.

En el cuadro de diálogo "Importar PDF" (menú "Archivo - Abrir", pincha en la lengüeta superior donde pone "Seleccionar: Página" y elige la opción "Imagen". Ese es el truco. La lista de viñetas cambia de páginas a todos los elementos de mapas de bits que aparezcan en el PDF. Las opciones de rasterizado se quedan en gris ya que no son aplicables y cada objeto se abre a la resolución, perfil de color y modo de color que tengan en el PDF. Pincha la imagen que quieras y se abre tal cual esté incrustada en el PDF.
Pero, ¡espera! ¡Aun hay más
Puedes Pinchar más de una imagen (seguidas con Mayúsculas o salteadas con Ctrl) y se abrirán todas las seleccionadas. No tienes que ir una a una.
[por escribir bien. Esto es un borrador]
Por Gustavo Sánchez Muñoz, septiembre de 2006
Los PDFs son documentos que siguen unas reglas de estructura y código fijadas por Adobe en sus especificaciones para el formato PDF.
En principio, como Adobe hace públicas esas especificaciones, cualquier programador capaz de crear un programa que genere nuevos PDFs a partir de PDFs ya existentes puede crear un programa para modificar PDFs.
Sin embargo, como PDF no es en origen un formato pensado para la reutilización, modificar PDFs no es una tarea fácil y las posiblidades son más limitadas que en el caso de otros documentos.
Por eso, y porque hay casi tantos tipos de PDFs como necesidades de usuarios, los programas capaces de modificar PDFs no son tantos como los capaces de crearlos. Además, de los que existen muchos son bastante limitados y su uso es más un recurso que una de las intenciones de los programadores originales.
Igual que ocurría con los programas para crear PDFs, la calidad de los PDFs modificados dependerá de cuáles sean los criterios usados para alterarlos y de las necesidades que tenga el usuario final. No es igual cambiar un PDF para ver en pantalla e imprimir en aparatos caseros, que hacerlo con uno destinado a imprenta comercial en cuatricromía, por ejemplo (donde los requisitos son más estrictos).
El origen de esta página es es una creada hace pocos años Laurens Leurs para su PDF Corner, que me permitió traducir y publicar en español. En esta revisión, he aprovechado lo que he podido de aquel original. Espero que sirva para hacerse una idea de cómo está la situación general, sobre todo en lo que respecta a crear PDFs para artes gráficas.
Hacer una lista de los métodos y programas capaces de modificar PDFs es más fácil que en el caso de los que son capaces de crear PDFs. Pero aun así es un mercado muy cambiante y esta página no pretende ser una lista completa (lo más cercano a eso es la lista actualizada de programas relacionados con PDF que existe en Planet PDF). Los más destacables son:
Cuando se habla de PDFs, éste es "el programa" (de hecho, hay quien no logra entender la diferencia entre PDF y Acrobat). Acrobat es el programa creado por Adobe para ver, imprimir y modificar (hasta cierto punto) los documentos en formato PDF.
Existe en dos versiones principales: El lector de PDFs (Acrobat Reader) y el programa completo, que a su vez tiene cuatro versiones: 3D, Professional, Standard y la Elements (de más compleja y cara a más sencilla). Si trabajas en artes gráficas con PDFs, la segunda es la que te interesa.
La gran virtud de Acrobat es que es posible su ampliación mediante o extensiones (plug-ins) de otros fabricantes que le permiten convertirse en un potente editor-procesador-filmador de PDFs.
[Falta por escribir].
[Falta por escribir].
Una herramienta gratuita de código abierto que permite manipular PDFs. Parece que no funciona con PDFs de nivel 1.6. (No necesita Acrobat). Algunas personas lo usan para añadir metadatos al PDF o usar estos de algún modo [Atención: Datos no comprobados].
Éste dos programas son añadido (plug-ins) para Adobe Acrobat que permiten analizar y modificar la estructura y datos de un PDF desde el punto de vista de un programador y de su estructura de código. Permiten analizar y manipular cosas como el árbol de objetos que componen su estructura, los diccionarios internos, los XObjects y cosas similares. Son de interés para programadores, por ejemplo. PDFCanOpener parece un poco más completo (aunque sólo les he podido echar un vistazo por encima a las demos de ambos).
[Falta por escribir].
[Falta por escribir].
Éste es el editor de PDFs (sobre todo para artes gráficas) por excelencia. Existe en tres versiones: Pro, Server y Automate. La primera es un eficiente añadido (plug-in) para Adobe Acrobat que lo convierte en una máquina de editar PDFs de forma manual y automatizada. La versión server sirve para tratar de forma automatizada PDFs mediante secuencia de órdenes creadas en la versión Pro. La versión Automate es además capaz de conducir flujos automatizados de tratamiento y corrección de PDFs.
Si quieres saber más sobre ellas y PitStop en general, existe una subsección aquí dedicada a PitStop y a su automatización mediante acciones globales.
La empresa alemana Callas fabrica varias soluciones de alto nivel para el tratamiento automatizado de PDFs en artes gráficas: pdfColorConvertCLI, pdfCorrectCLI y pdfInspektorCLI.
Esas versiones CLI (Command Line Interface o "interfaz de línea de comandos") son programas independientes para el tratamiento masivo y automatizado de PDFs destinados a artes gráficas (especialmente los dos primeros): Son servidores masivos, visualmente muy poco atractivos, muy avanzados, flexibles y rápidos para transformar y procesar PDFs.
Su punto fuerte es que se pueden configurar con línea de órdenes al estilo UNIX (de aspecto parecido al antiguo MSDOS de Microsoft). Gracias a esto, se pueden enganchar a sistemas de trabajo completamente automatizados (como los controlados con programas como FullSWITCH, de Gradual Software).
Ademas, incorporan un interfaz grafico llamado pdfAutomator que simplifica y facilita el uso sin líneas de órdenes.
Sus elevados precios (unos dos mil y pico euros pdfColorConvertCLI, por ejemplo) van a la par con su potencia y prestaciones (pdfColorConvertCLI y su versión plug-in de Acrobat permiten trabajar con perfiles DeviceLink, por ejemplo, para la reconducción de un CMYK a otro conservando el canal del negro).
En el sitio web de Callas hay versiones de prueba.
[Falta por escribir].
[Falta por escribir].
[Falta por escribir].
Como ya se ha indicado arriba, PitStop Pro es un eficiente añadido (plug-in) para Adobe Acrobat que lo convierte en una máquina de editar PDFs de forma manual y automatizada. Si tuviera que elegir un único añadido para trabajar con PDFs en artes gráficas (a un precio razonable), PitStop Pro sería mi primera elección.
Existe una versión de prueba en el sitio web de Enfocus.
Un sencillo pero muy flexible plug-in para Adobe Acrobat que permite solucionar fallos puntuales en un PDF como que las imágenes o textos estén en RGB (en vez de en negro o CMYK). No es tan flexible como PitStop pero es muy rápido. Bastante práctico para cosas sencillas.
Un plug-in para hacer imposición con Adobe Acrobat. Bastante flexible y mucho más potente de lo que pudiera parecer a primera vista, aunque no sé si puede competir con un verdadero programa de imposición de los que admiten PDFs.
Otro sencillo y potente plug-in de la firma Quite Software para Adobe Acrobat que permite inspeccionar cosas como las planchas de un PDF, incrustar y desincrustar fuentes, fusionar planchas, cambiar a cutricromía y similares. Tampoco pretende competir con PitStop pero es bastante interesante.
Esta es la versión como plugin para Acrobat de su equivalente PDFColorConvertCLI. Es obviamente mucho más sencillo, limitado y barato (unos 300 euros). En su ámbito es bastante práctico (hay una demo en el sitio web de Callas). También es capaz de usar perfiles DeviceLink para reconvertir de un tipo de CMYK a otro (pero, al igual que la versión CLI, no los construye).
[por escribir]
Puede abrir PDFs. Puede modificar PDFs. Puede guardar PDFs y volverlos a abrir. De hecho, los documentos de Illustrator se pueden guardar como PDFs.
Por eso, muchos creen que PDF es el formato nativo de Illustrator y que este programa es "el editor" de PDFs.
No es así. Los PDFs de Illustrator son un una especie de variante. Son ficheros mixtos de PDF e Illustrator y entre editar un PDF, por ejemplo, con Acrobat+Pitstop y hacerlo con Illustrator, es mejor opción (desde el punto de vista estructural del PDF), hacerlo con los primeros y no con Illustrator.
Pero, como muchas personas disponen de Illustrator, es una práctica muy usual editar PDFs con él ya que es un programa muy potente. En cualquier caso, sus PDFs son siempre monopágina (aunque hay un plug-in que hace algo parecido a multipágina con las capas). Eso limita mucho más sus capacidades editoras.
[Falta por escribir].
[Falta por escribir].
[Falta por escribir].
Esta sección pretende ser una recopilación de páginas sobre cómo se comportan distintos programas con respecto al formato PDF. Aunque no está muy al día, puede seguir mereciendo la pena.
Una pequeña lista de enlaces a sitios de fabricantes, programas, tutoriales y artículos técnicos sobre PitStop, similares o PDF en artes gráficas (Aviso: La aparición de una empresa o firma en esta lista es sólo a título informativo. No supone recomendación o crítica alguna).
ACCHSH. Firma polaca especializada en productos de artes gráficas de alto nivel basados en PDF. Muy interesante.
Adobe. Los creadores y fabricantes del formato PDF.
Apago. Empresa especializada en productos para el uso de PDF en artes gráficas como PDFEnhancer, PDF/X Checkup y otros.
Arts PDF. Empresa especializada en productos para modificación y tratamiento de PDF. Son los actuales poseedores de ARTS PDF Crackerjack, entre otros. Tienen una interesante oferta de un paquete que incluye PitStop Pro.
Artwork Systems Group. Los fabricantes de ArtPro y propietarios de Enfocus (fabricantes a su vez de PitStop).
Callas Software. Fabricantes de extensiones para PDF relacionadas con la preimpresión.
DAliM Software (distribuidores en España: Cibergraf).
Enfocus. Los creadores y fabricantes de PitStop.
Gradual. Fabricantes de productos destinado a la automatización de sistemas de trabajo con especial énfasis en el uso de PDF y grandes volúmenes de gestión. Hasta hace poco hacían CaslonFlow (que ha cedido paso a FullSwitch y PowerSwitch).
Integrated Color Solutions (ICS). Una empresa especializada en el tratamiento del color que desarrolla junto con Enfocus una herramienta de pruebas remotas llamada "Remote Director".
Impressed. Una firma alemana de extensiones para Adobe Acrobat relacionadas con la preimpresión.
Markzware. Fabricantes (entre otras cosas) de Flightchek, un programa para revisión previa (preflight) de PDFs y ficheros nativos.
Quite Software. Fabricantes de Quite Imposing, Quite Revealing y Quite-a-Box of-Tricks; tres plug-ings para Adobe Acrobat bastante interesantes.
Ultimate. Fabricantes de soluciones para imposición (Impostrip) o control de tinta (InkReady).
3DAP (Digital Data Delivery for Australian Publications). El sitio web de un comité australiano para estandarizar el envío de ficheros digitales destinados a CTP.
Certified PDF de Febelgra. Unas indicaciones sobre el uso estandarizado de PDF en artes gráficas de la Federación Belga de Artes Gráficas (Febelgra). Dado el uso intensivo y avanzado que se hace del PDF en Béligica es de interés (tiene versiones en francés e inglés).
Ghent PDF Workgroup La sede de un grupo internacional de expertos europeos dedicados a desarrollar los parámetros y valores necesarios para PDF/X-3 Plus.
Medibel. Proyecto para el progreso tecnológico de medios impresos en Bélgica (desarrollan sus especificaciones PDF/X Plus y las publican con mucho detalle).
PDF Corner. Un apartado con soluciones a problemas, explicaciones generales y algo de historia. Casi todo ha sido traducido al español aquí mismo.
PDF/X-3. Un sitio web sobre pdf/x de Olaf Drümmer.
PDF-X.com. Un sitio de la DDAP dedicado al PDF/X.
PDF-X.de. Un sitio web alemán (en alemán) con instrucciones muy detalladas sobre cómo construir ficheros con distintos programas.
PDFX-ready. Un grupo de trabajo suizo relacionado con UGRA (todo en alemán
).
Planet PDF. Un sitio sobre todo lo relacionado con el PDF. Excelente. Tiene un foro en inglés con bastante movimiento.
PDF Reference. Los manuales de referencia (en inglés) de las distintas versiones de las especificaciones del formato PDF.
UGRA.
Grupo de noticias de usuarios de Enfocus PitStop. Hay que suscribirse, ya que es por correo y está en inglés, pero es probablemente la mejor fuente de información actualizada y el sitio en el que obtener ayuda cualificada (no pagada) más fiable que hay en este momento sobre este programa. Imprescindible para cualquier persona interesada en trabajar con PitStop. No se pide identidad como usuario registrado. Un correo válido sirve.
Por el PDF/A Competence Center, 10 de julio de 2006
Este FAQ se ha preparado como apoyo del estándar ISO 19005-1:2005 (Gestión de documentos — Formato de archivo de documentos electrónicos para conservación a largo plazo, Parte 1: Uso de PDF 1.4 (PDF/A-1) ["Document management — Electronic document file format for long-term preservation — Part 1: Use of PDF 1.4 (PDF/A-1)"].
Este documento es una publicaciónde Grupo de trabajo Conjunto de PDF/A (PDF/A Joint Working Group) que trabaja bajo los auspicios del Subcomité TC-171 para Programas de Gestión de Documentos, Cuestiones de Aplicación (TC-171 Document Management Applications Subcommittee 2 Application Issues) con representantes de los Comités Técnicos 42, 46, 130 y 171 de la ISO. Se puede conseguir directamente de la ISO o de las distintas organizaciones nacionales encargadas de la estandarización (ANSI, BSI, DIN, AFNOR, AENOR, etc…).
La siguiente declaración debe acompañar a cualquier distribución de este FAQ:
Este FAQ se puede distribuir y o traducir libremente en su totalidad. La versión autorizada vigente de este FAQ se halla en NPES y AIIM.
El estándar ISO 19005-1:2005 (Gestión de documentos — Formato de archivo de documentos electrónicos para conservación a largo plazo, Parte 1: Uso de PDF 1.4 (PDF/A-1) ["Document management — Electronic document file format for long-term preservation — Part 1: Use of PDF 1.4 (PDF/A-1)"] es el primero de una nueva familia de estándares ISO pensados para responder a la creciente necesidad de poder conservar la información en documentos electrónicos a través de largos periodos de tiempo.
Como la versión inicial de PDF/A se basa en el nivel 1.4 del formato PDF, éste estándar se irá especificando por partes, de forma que las nuevas se vayan añadiendo sin que las anteriores queden obsoletas.
Así, por ejemplo, PDF/A-1 se refiere al formato definido en la Parte 1 (ISO 19005-1) del estándar (que es PDF 1.4), mientras que la Parte 2 (ISO 19005-2) y otras posteriores se podrían basar en un nivel posterior del formato PDF y podrían también definir requisitos de archivo para clases más complejas de contenido.
La rica naturaleza de las características del formato PDF pueden crear dificultades en la preservación de la información a largo plazo y algunas características útiles del formato PDF son incompatibles con las exigencias de la conservación a largo plazo.
Por ejemplo, los documentos PDF no necesariamente tienen un contenido autosuficiente (not self-contained content), sino que pueden usar fuentes del sistema y otros archivos situados fuera del documento original.
Conforme pasa el tiempo y sobre todo según avanza la tecnología, estas conexiones externas se pueden romper y las dependencias perdidas pueden hacer que se pierda información. Además, debido a la falta de estandarización de las muchas herramientas para el desarrollo de PDF que hay en el mercado, existen incoherencias en la aplicación de ese formato de documento.
Esta falta de estandarización puede ser un caos para los gestores de información en el futuro, en especial si se les hace difícil (por no decir imposible) llegar a las entrañas de los documentos PDF si no se crea una especificación de ese formato que ponga especial atención a las necesidades de conservación a largo plazo.
En todo el mundo se están creando y archivando enormes cantidades de valiosa información en formato PDF y eso hace necesario la especificación de una solución que garantice que los documentos digitales PDF seguirán siendo legibles y accesibles a largo plazo. PDF/A se ha diseñado para ser esa especificación.
El estándar PDF/A-1 (ISO 19005-1:2005) se basa en la referencia de formato PDF de nivel 1.4 hecha por Adobe y especifica como usar un subconjunto de componentes PDF para desarrollar programas que creen, reproduzcan y procesen una forma de PDF que sea más adecuada para la preservación de archivos a largo plazo que el simple formato PDF.
El objetivo de PDF/A-1 es preservar la aparencia visual estática de los documentos electrónicos a lo largo del tiempo, permitir el acceso en el futuro y el trasvase a otros formatos también en un futurp proporcionando el marco para:
La inclusión de metadatos sobre los documentos electrónicos.
La definición de la estructura lógica y las propiedades semánticas de los documentos electrónicos.
El resultado es un formato de fichero basado en el nivel 1.4 del formato PDF que es más adecuado para la conservación a largo plazo. Los documentos PDF/A-1 se describen mejor a si mismos, llevan en si todo el contenido necesario y son más independientes de los dispositivos de reproducción que los PDF 1.4 sin más.
Una de las diferencias esenciales entre el formato PDF y el estándar PDF/A es las restricciones que PDF/A impone a un PDF.
Fuentes incrustadas.
Color reproducible independientemente.
Metadatos XMP.
Encriptamiento.
Compresión LZW.
Ficheros incrustados.
Referencias a contenido externo.
Transparencia PDF.
Multimedia.
Código JavaScript.
En PDF/A, "largo plazo" (long-term) se define como "el período de tiempo lo bastante largo como para que exista interés o preocupación por los impactos de las tecnologías cambiantes, incluyendo respaldo a nuevos tipos de medios y formatos de datos y a una comunidad de usuarios cambiante, para la que la información se mantiene almacenada, y que puede extenderse hacia un futuro indefinido".
No. PDF/A-1 no reemplaza otros formatos de documentos para su conservación en archivo (archival format). PDF/A-1 se ha desarrollado para permitir el uso de PDF como formato para preservación de la información de un modo sólido y bien definido.
Entre los objetivos identificados de PDF/A están las siguientes características:
Independencia de los dispositivos. Debe poderse reproducir de forma fiable y consistente son que importe la plataforma de programa o maquinaria que se use.
Autoficiente en contenido. Todos los recursos y datos necesarios para su correcta reproducción se hayan dentro del documento.
Autodocumentado. Lleva dentro de si su propia descripción.
No limitado. No contiene mecanismos de protección o seguridad.
Abierto. Las especificaciones que lo rigen deben ser públicas y conocidas.
Adopción. Su uso extendido será su mejor garantía contra riesgos de preservación.
PDF/A-1 impone que los componentes del un documento sean independientes de los dispotivos, de modo que su apariencia visual se reproduzca e imprima de forma fiable y constante sin importar la maquinaria o programas que se usen. La cláusula sobre gráficos, por ejemplo, incorpora requisitos que garantizan una representación del color predecible. PDF/A-1 también prohibe el uso de componentes que no estén definidos en las especificaciones del nivel 1.4 del formato PDF.
Cualquier cosa que sea necesaria para reproducir o imprimir un documento PDF/A-1 debe estar dentro del documento. La cláusula sobre las fuentes obliga a que todas las fuentes usadas para reproducir el contenido vayan incrustadas en el documento.
Un programa creador de ficheros PDF/A-1 debe incrustar las fuentes siempre, y un programa lector que cumpla el estándar PDF/A-1 debe usar siempre las fuentes incrustadas. Esto quiere decir que el fichero se reproducirá siempre usando las fuentes que se especificaron y no las fuentes residentes en el aparato de turno.
PDF/A-1 obliga al uso de Metadatos incrustados en formato Adobe Extensible Metadata Platform (XMP). Para permitir flexibilidad en la aplicación de este aspecto, PDF/A-1 incluye recomendaciones para documentar atributos como la identificación del documento, su origen, o los metadatos de fuentes tipográficas. Además, permite que se incluyan esquemas xml que no sean XMP siempre y cuando vayan incrustados. Los desarrolladores de soluciones PDF/A-1 pueden usar XMP de muchos modos para incluir la información necesaria sobre los registros electrónicos dentro del mismo documento.
La incrustación de los metadatos en el fichero puede aumentar el valor informativo de los documentos electrónicos y mejorar la compresión por parte de un investigador futuro.
PDF/A-1 prohibe el encriptamiento. Esta prohibición quiere decir que no hacen falta claves o identificaciones de usuario para hacer nada con un documento PDF/A-1. Los documentos PDF/A-1 deben estar abiertos y disponibles a cualquiera con cualquier programa capaz de procesarlo. Los fabricantes de soluciones para PDF/A-1 deben proporcionar cualquier forma de control de manera externa al formato del documento.
PDF/A-1 se basa en una especificación canónica es públicamente conocida y disponible. Cualquiera puede usar las referencias PDF 1.4 y XMP junto con las de PDF/A-1 para crear programas que puedan leer, escribir y procesar documentos PDF/A-1.
Adobe a concedido una licencia general libre de pago de derechos (general royalty free license) para algunas de sus patentes para la creación de programas capaces de procesar documentos PDF/A-1. Además, Adobe a concedido a AIIM y NPES el derecho de publicar estas especificaciones en sus respectivos sitios por un tiempo indefinido.
PDF/A-1 se ha diseñado de forma que se ponga en práctica con flexibilidad para así promover su adopción lo más amplia posible. Si esa amplia adopción ocurre, las herramientas informáticas para PDF/A proliferarán y el mercado apoyará ese formato de fichero mientrás exista su necesidad. El apoyo del mercado a PDF/A asegurará la viabilidad de PDF/A y ampliará el tiempo en el que los documentos PDF se podrán conservar como PDF/A.
Muchas fuentes tipográficas tienen restricciones de uso, incrustación o intercambio. PDF/A obliga a la incrustación de las fuentes en el PDF. Por ello, las organizaciones que usen PDF/A-1 deben de tener especial cuidado en usar fuentes tengan una licencia adecuada que permita esa incrustación.
PDF/A se debe usar como un método de estandarizar el uso de PDF para el almacenamiento de documentos electrónicos y para garantizar que estos documentos estarán disponibles en un futuro a largo plazo. Es importante atender las necesidades comerciales que requieren una reproducción fiable de los documentos electrónicos a largo plazo.
Como especificación de formato de fichero, los usuarios tendrán que establecer su propia metodología de captura para respetar sus procedimientos y políticas específicas con respecto a cosas como fiabilidad, integridad, grado de cumplimiento, alcance, etc…
Así, por ejemplo para registros permanentes en PDF, las organizaciones de la administración federal de Estados Unidos deberán usar PDF/A-1 además de los requisitos adicionales identificados en las indicaciones de la Administración de Archivos y Registros Nacional de Estados Unidos (NARA) para el traspaso de registros permanentes en forma de PDF a NARA.
Es esencial tener en cuenta que:
PDF/A-1 por si solo no garantiza la preservación.
PDF/A-1 por si solo no garantiza la replica exacta del material original.
PDF/A-1 admite dos niveles de cumplimiento. La idea es promover la creación de documentos PDF/A-1 con buena información estructural y semántica, permitiendo al mismo tiempo ficheros mucho menos complejos como imágenes escaneadas. Ambos niveles de cumplimiento se denominan Nivel A y Nivel B, respectivamente:
En este nivel, se deben cumplir todos los requisitos de la referencia PDF conforme a las modificaciones introducidas por las especificaciones 190005 de la ISO. Las propiedades estructurales y semánticas se deben conservar. En el nivel PDF/A-1a se usa PDF etiquetado (tagged) y mapas de carácter Unicode para preservar la estructura lógica del documento y el flujo de lectura del texto del documento en su orden de lectura natural. En algunos casos, para poder hacer uso de los metadatos incorporados, los usuarios necesitarán reproductores de PDF que cumplan las normas PDF/A-1.
En este nivel se pretende que los requisitos sean los mínimos necesarios para garantizar la apariencia visual de los documentos electrónicos. En el nivel PDF/A-1b se preserva del documento original aquella estructura que permite al usuario que acceda al documento verlo y manipularlo como si estuvieran haciendolo con el mismo original.
Ya se ha comenzado a trabajar en la Parte 2 de PDF/A con la idea de basarla en el nivel 1.6 del formato PDF. Algunos de los que van a tener que ponerla en práctica han pedido que se considere la inclusión en las partes futuras de las siguientes características:
Compresión de imágenes con sistema JPEG2000.
Admisión de firmado digital más avanzado y complejo.
Fuentes OpenType.
Gráficos tridimensionales (3D).
Contenido sonoro (audio) o en movimiento (vídeo).
Coherencia con otros estándares basados en PDF.
La idea es que las partes futuras de PDF/A se escriban de modo que los documentos PDF/A más antiguos cumplan las partes más nuevas del estándar. La decisión final de qué se incluye en las partes más nuevas se decide en última instancia mediante la votación de los miembros de la ISO con derecho a ello.
Es esencial comprender que las partes existentes de PDF/A seguirán existiendo aunque se creen partes suplementarias, por lo que se podrá reproducir los archivos archivados hasta un futuro no definido.
Sí. PDF/A-1 permite el uso de firmas digitales incrustadas en el PDF según se define en la documentación de referencia del formato PDF. Las firmas digitales en un PDF conllevan una apariencia visual, que se debe ajustar a los requisitos marcados por PDF/A-1, lo que incluyen la incrustación de fuentes y el uso de color independiente de los dispositivos.
No todas las herramientas comerciales de firmado digital cumplen estos requisitos.
Muchas organizaciones en todo el mundo están evaluando las ventajas de adoptar PDF/A y proporcionarán información sobre su criterio al respecto. Algunas de ellas ya han declarado su intención de aceptar PDF/A. Entre ellas están:
La Administración Nacional de Archivos y Registros de Estados Unidos (US National Archives and Records Administration (NARA)): NARA aceptará la transferencia de registros permanentes en formato PDF/A que adicionalmente cumplan los actuales requisitos de transferencia de registros electrónicos en formato PDF.
Los Archivos Nacionales Suecos: (Riksarkivet) Aceptarán el estándar PDF/A como una forma apropiada y aprobada de formato de archivo para algunos tipos de documentos. Esto se anunciará con una regulación técnica y de formato específica emitida por los Archivos Nacionales Suecos, que es de obligado cumplimiento para las autoridades ejecutivas suecas.
Los Archivos Nacionales Suecos no recomiendan ningún producto específico con la idea de que la independencia de productos de fabricantes concretos es una necesidad para alcanzar una preservación estable y segura a largo plazo. La política de los Archivos Nacionales Suecos es referirse ante todo a los estándares internacionales reconocidos, en segundo término a otros estándares (ya sean suecos o de otro nivel) y en último término a las especificaciones concretas que preparen los propio Archivos Nacionales Suecos.
PDF/A-1 permite la conservación de ciertas clases de documentos en u forma original. PDF/A-1 no se debe usar primariamente como formato para producir o editar documentos, sino como formato en el que consolidar documentos. Uno de los principales criterios al establecer normas sobre formatos de documentos es la independencia con respecto a programas o maquinaria específica.
Adobe, Apago, Visioneer, Callas, Compart Systemhaus, PDF Tools AG.
El desarrollo de un estándar de acuerdo con los organismos de estandarización nacionales y con la política de la ISO garantiza que se hace en un proceso abierto y basado en el consenso. Varios participantes con experiencia en el área se juntan para contribuir al desarrollo.
Para conseguir que todos las partes interesadas tienen oportunidades suficientes de aportar iniciativas y de expresar sus puntos de vista, se da un proceso de votaciones muy formalizado y determinado por la organización estandarizadora.
Las actividades sobre PDF/A se iniciaron en los Estados Unidos con el patrocinio conjunto de la AIIM, NPES y la Asociación de proveedores de tecnologías de impresión, publicación y conversión. Con los auspicios del Subcomité TC-171 para Programas de Gestión de Documentos, Cuestiones de Aplicación (TC-171 Document Management Applications Subcommittee 2 Application Issues), se formó un un Grupo de Trabajo Conjunto (WG5) con representantes de los Comités Técnicos de la ISO 42, 46, 130 y 171. Un amplio grupo de bibliotecarios, documentalistas, desarrolladores de programas para PDF, organismos gubernamentales, expertos en imagen digital y gráficos y de otros ámbitos colaboraron en el desarrollo de PDF/A.
Los primeros encuentros se celebraron a mediados de 2002 y el estándar se aprobó en junio de 2005. Expertos técnicos de quince organizaciones nacionales de estandarización participaron en todo su proceso de desarrollo.
Entre las organizaciones que actualmente participan están: AIIM, NPES, Adobe, Appligent, Callas, EMC/Documentum, Global Graphics, La Universidad de Harvard, Merck & Co, PDF Sages, la Oficina Administrativa de los Tribunales Estadounidenses, El Servicio de Ingresos Internos de EEUU y la Administración de Archivos y Registros Estadounidense.
Entre los paises que participan en estas actividades de la ISO están: Australia, China, Alemania, Francia, Japón, Holanda, Suiza, el Reino Unido, Los Estados Unidos y Suecia.
Hay gran cantidad de información disponible en el sitio web de AIIM. Allí se encuentran los requisitos iniciales, las actas de los encuentros, notas sobre los mismos y distintos materiales sobre PDF/A. Además, AIIM y NPES han publicado las referencias sobre el nivel 1.4 de PDF y los metadatos XMP.
El estándar PDF/A-1 ya publicado se puede comprar directamente a ia ISO o a cualquiera de las organizaciones nacionales de estandarización de todo el mundo.
AIIM y NPES aceptan con gusto a representantes de fabricantes, organizaciones de usuarios y usuarios individuales. Si cree que puede contribuir al desarrollo de este estándar, no dude en ponerse en contacto con AIIM o NPES.
Por L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
En esta página se explica brevemente cómo se almacena la información en los ficheros de formato PDF:
esta información puede ser de alguna utilidad para quien quiera editar directamente ficheros PDF. Estos documentos son simplemente ficheros de texto ASCII de 7-bits. Se pueden abrir en cualquier editor de texto puro y duro (como el Bloc de notas de Windows, por ejemplo). siempre que el texto no se haya comprimido.
En un fichero PDF, cada línea puede contener hasta 255 carácteres. Cada una de estas líneas debe terminar con un carácter de retorno de carro (que debe ir o no seguido de un carácter de nueva línea dependiendo de la plataforma usada para crear el fichero PDF). En los datos un fichero PDF se establecen diferencias entre mayúsculas y minúsculas (es un formato case-sensitive).
El formato de ficheros PDF usa una estructura fija. Siempre contiene cuatro secciones:
Una cabecera (header): Contiene información sobre qué especificación del estándar PDF sigue el fichero. Esta información es algo parecido a "%PDF-1.2" (donde 1.2 puede ser 1.0 o 1.1 en el caso de las versiones más antiguas).
Un cuerpo (body area): Contiene la descripción de cada uno de los elementos usados en las páginas.
Una tabla de referencias cruzadas (cross-reference table): Contiene la información de qué elementos se usan en las páginas del fichero PDF.
Una coda (trailer): Que le dice al RIP dónde encontrar la tabla de referencias cruzadas y que termina siempre con un "%%EOF" (marca de final de fichero: End Of File). Si esta linea faltara, el fichero estaría incompleto y lo más probable es que un RIP no sea capaz de procesar el fichero. Esto no ocurre así con los ficheros PostScript, donde si falta la parte final del fichero (debido a un error de transmisión a una caída del sistema, etc...) aun es posible imprimir parte de la página (aunque sea de forma errónea). En un fichero PDF esto no ocurre. Se pierde todo.
Cada vez que se añaden nuevos datos a un fichero PDF (al editar por ejemplo un texto o al insertar nuevas páginas), se añaden sendas zonas nuevas de Cuerpo, Tabla de referencias y Coda. Si al guardar ese documento otra vez marcamos la opción "optimizar", Adobe Acrobat limpiará el fichero eliminando esas reduplicaciones de zonas y reorganizando el fichero.
Nota del traductor: Si quieres examinar y modificar la estructura de un PDF, existe un interesante programa llamado PDFCanOpener que te permitirá hacerlo.
Por Gustavo Sánchez, verano de 2006
En el formato PDF se especifican los colores siguiendo diversos sistemas de describir los colores. Estos sistemas se llaman "espacios de color" (colour spaces).
Algunos de ellos se relacionan directamente con la forma en la que los humanos vemos el color. Son lo que se llaman "basados en CIE" o "independientes de los dispositivos".
Otros son valores numéricos cuya representación del color depende del dispositivo que los vaya a representar (son "dependientes del dispositivo"). Un tercer tipo son modos especiales de imprimir o trabajar que se han modelado como espacios de color (tintas directas, duotonos, etc…)
En PDF y PostScript, cada valor de color esta formado por uno o varios componentes que se expresan mediante números. Los valores del color se intepretan según el espacio de color que tengan asignado (en PDF un parámetro del "estado gráfico" (Graphics state). Los espacios de color se pueden agrupar en tres clases:
Aquí cada valor que describe un punto de color describe simplemente una cantidad de colorantes que se deben usar. Es decir: Un valor de porcentaje de tinta, una mezcla de luz en los fósforos de un monitor, etc… Cuando se describe un rojo RGB así, se dice simplemente R=255,G=0,B=0, por ejemplo. Un gris sería Tinta negra=50%. Un rojo CMYK sería 0/100/100/0.
En cada dispositivo el color real variará, por lo que "depende del dispositivo". Es la forma más simple (e imprecisa) de reproducir colores. Es la que usan los aparatos y programas que no disponen de gestión del color (colour management). El formato PDF tiene tres tipos de espacio de color del dispositivo:
Los colores se describen en una escala monocroma neutra (acromática) que va del blanco al negro pasando por una escala de grises. Su intensidad, tonalidad real y gradación depende del dispositivo. El negro es el color tradicional de la forma más básica de reproducción impresa.
Los colores se describen mediante tres colorantes en una mezcla aditiva de colores (o sea: Se mezclan luces). Los colorantes son Rojo (Red), Verde (Green) y Azul (Blue). Son los tres colores básicos de las pantallas.
Los colores se describen mediante cuatro colorantes en una mezcla sustractiva de colores (o sea: Se mezclan pigmentos). Los colorantes son Cian (Cyan), Magenta (Magenta), Amarillo (Yellow) y Negro (Black). Son las cuatro tintas básicas de la impresión comercial.
Al usar definiciones en un PDF el color de forma dependiente, su reproducción variará según qué aparato lo reproduzca. Sin embargo, el formato PDF permite definir (aunque no es obligatorio) una serie de espacios de color predeterminados o por omisión (DefaultGray, DefaultRGB y DefaultCMYK).
El fin de esto es que todos los valores de color definidos como Device… se conviertan a los correspondientes espacios de color predeterminados que suelen ser independientes de los dispositivos.
Cualquier espacio de color que no sea Lab, Indexado o Pattern se puede usar como espacio de color predeterminado. Pese a esta "liberalidad", lo que tiene más sentido es definir los espacios de color predeterminados usando espacios de color basados en perfiles de color ICC que describan comportamientos conocidos o estandarizados.
Esto es útil para modificar el color al reproducir en dispositivos distintos, sistemas que no entienden espacios de color calibrados o al hacer conversiones de color.
En el formato PDF (y parcialmente en el PostScript) se puede definir el color de forma independiente a cómo lo reproducen los dispositivos concretos. Esa forma de describir el color, que se llama color "calibrado" (calibrated) se basan en los estudios de una organización internacional de estudio de la luz y el color llamada CIE. Por eso a estos espacios de color se les llama "espacios de color basados en CIE" (CIEBased colour spaces).
No vamos a describir en detalle cómo se consigue esto ni cual es la teoría de la percepción del color en los humanos (para eso hay otras páginas). Baste saber con el el objetivo es que los colores de reproduzcan igual en distintos aparatos, superando sus diferencias y, en lo posible, sus limitaciones.
En estos espacios, los colores se describen mediante matrices numéricas y fórmulas de transformación que se les aplican para describir los valores de color originarios y finales. Todo ello implica el uso intenso de diccionarios, unas estructuras de datos del formato PDF y PostScript. Los conceptos de punto blanco (color neutro más claro) y punto negro (color neutro más oscuro) son esenciales en estos espacios de color. El formato PDF tiene cuatro tipos de espacio de color independientes del dispositivo (el cuatro sólo existe a partir del nivel 1.3 del formato):
Los colores se describen en una escala monocromática neutra (acromática) que va del blanco al negro pasando por una escala de grises. Su intensidad, tonalidad real y gradación depende de una función decodificadora por la que se le aplica un valor gamma que transforma (o "calibra") su resultado final. Por eso no depende del dispositivo. El negro es el color tradicional de la forma más básica de reproducción impresa.
Los colores se describen mediante tres colorantes en una mezcla aditiva de colores (o sea: Se mezclan luces). Los colorantes son Rojo (Red), Verde (Green) y Azul (Blue). Son los tres colores básicos de las pantallas. Su intensidad, tonalidad real y gradación depende de funciones decodificadoras por la que se le aplica un valor gamma particular a cada uno de los colorantes que transforma (o "calibra") su resultado final. Por eso no depende del dispositivo.
En este espacio de color, que es como los otros espacios, un espacio de color basado en CIE del tipo ABC, los valores A, B y C se asignan a los valores L*, a* y b* del espacio de color CIE L*a*b* 1976.
Este tipo de espacios de color se basan en los trabajos del Consorcio Internacional del Color (ICC) para normalizar la descripción del color en distintas sectores industriales. La diferencia básica con respecto a los espacios de color calibrado anteriores es que no se basa en entradas en los diccionarios de espacio de color sino en perfiles de color ICC (conforme a las especificaciones de dicho organismo), ya sea mediante referencia o inclusión directa del perfil.
La forma en la que los datos se especifican en este tipo de espacios de color ha ido evolucionando conforme han ido cambiando las especificaciones del ICC.
El uso de este cuatro tipo de espacio de color es menor compacto que el de los otros espacios "calibrados", pero a cambio puede representar más tonos de color de forma mucho más fidedigna y fiable.
Estos colores permiten usar métodos especiales de reproducción del color. A esta clase pertenecen Indexed, Pattern (en los que no vamos a entrar), Separation y DeviceN:
Son espacios de color que usan colorantes especiales, que representan cosas como tintas metálicas, fluorescentes, barnices o similares. Este tipo de espacios de color permiten producir separaciones de color adecuadas para esos colorantes especiales adicionales. Por tanto son espacios de color monocromos.
Este tipo de espacios de color (en PDF a partir del nivel 1.3), enfocados hacia la impresión, sirve para especificar imágenes u objetos que usen más colorantes que los procesos de impresión comerciales habituales o que lo hagan de forma distinta.
Ese es el caso de los sistemas de "color de alta fidelidad" (high-fidelity color) como la hexacromía (donde se usan seis colorantes para describir los colores en lugar de los cuatro habituales en CMYK).
También sirve para describir objetos "multitono". Es el típico caso de los duotonos; imágenes en las que un mismo punto de una imagen se reproduce con colorantes distintos usando valores distintos aplicando funciones no lineales (se trata de una imagen en blanco y negro en la que se describe la tinta negra linealmente y la otra aplicando una curva para, por ejemplo, resaltar las sombras).
Los espacios de color DeviceN permiten que los colorantes que haya en el dispositivo se trate como un espacio de color del dispositivo con varios componentes.
Dicho de otro modo, podemos crear "un color" DeviceN compuesto solo de porcentajes de Cian y Magenta (para un trabajo a dos tintas) y tratarlo como si fuera un colorante más.
Un espacio de color DeviceN funciona casi igual que un espacio de color Separación. De hecho, un espacio de color DeviceN que tenga un solo componente equivale a un espacio de color Separación.
Si un colorante asociado a un espacio de color Separación no se corresponden con un colorante disponible en el dispositivo, el programa recurre a lo que se llama "espacio de color alternativo", que permite representar el color por aproximación en un espacio de color del dispositivo o basado en CIE (nunca en otro espacio de color especial).
En otra página puedes ver en una tabla las formas de definir los colores en los distintos niveles del formato PDF y PostScript.
Esta sección pretende ser una recopilación de páginas sobre cómo se comportan distintos programas con respecto al formato PDF. Aunque no está muy al día, puede seguir mereciendo la pena.
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
Si quieres crear un PDF desde Autocad (de Autodesk), hay varias formas de hacerlo:
Crea un archivo PostScript y usa Adobe Acrobat Distiller o una herramienta similar para crear el fichero PDF. La opción de crear ficheros PostScript desde el mismo Autocad está disponible, pero no me preguntes dónde (no dispongo del dinero suficiente para trastear con programa tan caro).
Consigue una herramienta de conversión llamada OttoPDF (de Myndkryme) que sirve para convertir ficheros en formato DWG de Autocad a ficheros PDF. Lo bueno de esta utilidad es que además de funcionar estupendamente es gratuita. [Nota en junio de 2003. El sitio web parece haber quedado un poco parado]
Además, hay en el mercado varias herramientas que pueden convertir ficheros e Autocad en ficheros de Adobe Illustrator o pasarlos a formato PICT (que Macromedia Freehand puede leer). De hecho, Adobe Illustrator y CorelDraw pueden leer directamente ficheros de formato DXF. Así es posible usar ambas aplicaciones para después exportar los ficheros a formato PDF. El problem es que a veces el grosor de las líneas originales se ve afectado por el proceso de conversión.
Si tienes Adobe Acrobat o sólo PDF-Writer, puedes ir al sitio web de FastCad y conseguir allí el visor gratuito CADView/7 para ver archivos DWG y DXF. Una vez conseguido, basta abrir los archivos e imprimirlos con PDF-Writer.
Si tienes más información sobre Autocad y el formato PDF o conoces algún sitio web sobre el tema que sea interesante, por favor, envía un e-mail a mí o a mi traductor.
L. Leurs, 2002
(traducción: Gustavo Sánchez Muñoz)
Muchas personas usan el formato PDF como una forma de imprimir profesionalmente documentos de Microsoft Office. Aunque esta es una idea bastante buena, hay que tener en cuenta algunas limitaciones de Microsoft Word.
La primera es que el uso de PDF-Writer es casi siempre una mala idea, al menos en lo que se refiere a impresión profesional. Lo recomendado es siempre imprimir a un fichero PostScript y después usar Acrobat Distiller o alguna herramienta similar para crear un PDF.
Si se instala Adobe Acrobat en un sistema que ya tenga instalada la suite Microsoft Office, se añaden macros a Word, Excel y Power Point que sirven para automatizar la creación de ficheros PDF. Siempre que se seleccione en estos programas la opción "exportar a PDF", la aplicación procederá a crear el fichero PostScript y después arrancará Distiller para convertir automáticamente ese código a PDF, lo que es algo bastante práctico.
Estos son algunos de los problemas que existen. Buena parte de la información que aquí se explica fue amablemente proporcionada por Dov Isaacs (Adobe) y Jacob Schäffer (Grafikhuset).
Como la mayoría de las aplicaciones de Microsoft Office, Word se basa en el modelo gráfico del sistema sobre el que se esté ejecutando: GDI en Windows y QuickDraw en Macintosh. Al imprimir a un archivo PostScript, Word usa un controlador PostScript para generar el código correspondiente, salvo en el caso de los ficheros EPS, cuya información se limita a transmitir. Esto quiere decir que todos los colores del PDF resultante serán colores RGB y, aunque todos los RIPs PostScript más modernos pueden efectuar la separación de esos colores, el resultado podría no ser el esperado.
Ese código RGB resultante arriba mencionado hace los elementos negros o con un porcentaje de negro (grises) se filmen en las cuatro planchas (CMYK) de una cuatricromía. Para los Windows de la familia 9.x existe una versión (4.4.1 y posteriores) que incluye la opción de forzar la salida de los textos y gráficos de línea con el valor equivalente de Negro (dejando los colores restantes en sus valores RGB). Además, hay en el mercado varias herramientas y extensiones que permiten la conversión de colores RGB a CMYK. Ese es el caso de Quite A Box Of Tricks , (Quite, para PDFs ya hechos) y de Colour Chameleon 2000 (Grafikhuset, para antes de hacer los PDFs).
Cuando trabaja y componen los textos, Word toma los valores de medida de las fuentes (font metrics) de las unidades de resolución del dispositivo de salida que tenga fijado en ese momento, y no de medidas absolutas de alta resolución. Eso quiere decir que cada vez que especifica una impresora nueva (aunque se siga usando el mismo controlador) el texto puede refluir y los saltos de línea pueden ser diferentes. Esto es aún más notable si se altera la resolución del dispositivo. Además, parece que los márgenes de impresión (es decir, la especificación de las zonas no imprimibles en el PPD y los ajustes del dispositivo) también tienen su influencia. Hay un par de medidas que se pueden tomar para evitar estos problemas:
Una solución es trabajar seleccionando el controlador de impresora de Acrobat Distiller y fijándolo a la resolución que se vaya a usar finalmente (1.200 ppp, por ejemplo). Para no alterar nada, las impresiones se deben hacer con los PDFs desde el menú de impresión de Acrobat.
En el menú "Herramientas - Opciones - Compatibilidad", Microsoft Word tiene una opción "Usar las medidas en la impresora para dar formato al documento" que hace que el texto tienda a refluir aún más. Esta opción se debe desactivar antes de crear cualquier documento.
En lo que se refiere al formateo de los textos, no es buena idea mover documentos de Word de una plataforma a otra (Windows a Macintosh o viceversa). Tampoco es buena idea llevarlos de Windows 9.x a Windows NT o Windows 2.000. En ambos casos puede haber redistribuciones, pero no es un aregla fija.
Al fijar el interlineado de los textos es bueno evitar los interlineados automáticos ("sencillo", "multiple", etc…). Es mejor usar un valor fijo ("12 puntos", "14 puntos" …).
Cuando se usan fuentes True Type con documentos de Word y se ha especificado en el controlador de impresora que las fuentes True Type deben enviarse a la impresora como "Fuentes de contorno", pudiera haber pequeñas diferencias en los espaciados de los carácteres tipográficos, especialmente en los finales de línea. Esto se puede solucionar diciéndole al controlador de impresora que incluya las fuentes True Type como fuentes de Tipo 42 (la persona que me informó de este problema, por cierto, estaba usando el PPD de Distiller 4 y el controlador PostScript Adobe PS 4.3.1)
A veces los ficheros de Microsoft Word incluyen gráficos creados en Microsoft Excel. Esta hoja de cálculo ofrece a los usuarios varios grosores de trazo de línea. Uno de ellos es "fino" (hairline), que lo que hace es decirle al dispositivo de impresión que debe trazar la línea con un punto de impresión de anchura (lo que no es 1 punto de pica, por cierto). En una impresora de 300 ppp de resolución, esto es una línea muy fina. En una filmadora de 2.400 ppp es una rayita invisible. Hay en el mercado varias herramientas y extensiones que permiten cambiar el grosor de las líneas. Una es la ya mencionada Quite A Box Of Tricks , (Quite, para PDFs ya hechos). Otra es PitStop (de Enfocus Software).
En el menú "Herramientas - Opciones - Imprimir" existe una opción "Permitir alternar entra A4 y Carta" para redimensionar el documento en determinadas circunstancias. Esta opción se debe desactivar para que el documento no cambie al crear el PDF.
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
Hay unos cuantos formatos de ficheros informáticos cuyos resultados se acercan a los de PDF. Éstos son algunos de ellos, con sus diferencias y similitudes:
Adobe, la compañía que desarrollo PostScript, fue también quien desarrolló PDF. De hecho, PDF está basado en el lenguaje PostScript. PDF Usa el conjunto de intrucciones de PostScript de un modo diferente: Mientras que PostScript es realmente un lenguaje de programación que se puede usar para escribir un juego de ajedrez o un procesador de textos, PDF es de objetivos más limitados. Sólo describe la composición de un documento (usando operadores PostScript). En ese sentido, PDF recuerda más a una base de datos que a un lenguaje de programación.
Las principales ventajas de PDF frente a PostScript son:
Los ficheros PDF tienden a ser más reducidos debido a los eficaces algoritmos de compresión que se pueden usar.
Los ficheros PDF se pueden ver fácilmente con el lector Acrobat Reader u otras herramientas.
Los ficheros PDF se pueden modificar más fácilmente, siempre que se tengan las herramientas apropiadas.
Los ficheros PDF son má independientes de los dispositivos. Los ficheros PostScript suelen estar creados para dispositivos concretos y pueden generar errores PostScript si se envían a otros aparatos.
Los ficheros PDF pueden ser más versatiler que los ficheros PostScript: Pueden contener enlaces a otros ficheros y elementos multimedia.
PDF se suele comparar con HTML (el formato de datos más usual en la creación de páginas web). En principio HTML fue creado para describir la estructura de un documento y no tanto para elaborar su apariencia. El aspecto de una página web viene determinado por el navegador, no por el creador del documento. Con el incremento en la popularidad de la World Wide Web, el énfasis de las nuevas versiones de HTML pasó de más la estructura a la apariencia. En cierto modo, HTML se desplazó hacia los objetivos de PDF.
Al mismo tiempo, Adobe incluyó cada vez más funcionalidades web dentro de PDF (se hizo posible añadir enlaces de Internet dentro de un documento PDF). Al mismo tiempo, se puso a la disposición del público una extensión para los navegadores Netscape Navigator y Microsoft Internet Explorer para poder mostrar ficheros PDF. Acrobat 4 incorporó la capacidad de convertir un sitio web (o parte de él) en un documento PDF. Adobe añadió a PDF la capacidad de descarga incremental de bytes (byte streaming) para que no fuera necesario descargar todo un fichero PDF antes de poder ver su primera página en Internet.
En cierto modo, HTML y PDF se están conviertiendo en estándares en competencia. Ahora mismo, PDF es mucho más potente en lo que se refiere decribir la apariencia de documentos. HTML es más apropiado para accesos de Internet de baja capacidad. Sin embargo, es perfectamente factible usar ficheros PDF en sitios web y usar documentos HTML en un catálogo electrónico distribuido en CD-ROM.
XML (eXtensible Markup Language, "Lenguaje Extendido de Marcas"), es un formato que se puede usar para describir el contenido de un documento (similar a SGML, del que es un subconjunto). Ultimamente está en el centro de atención debido a que su gran flexibilidad permite una fácil integración con bases de datos y el intercambio de grandes masas de datos en Internet. En realidad, XML no compite con PDF. Mientras que XML describe el contenido de un documento, PDF describe su apariencia. No es fácil extraer el contenido de un fichero PDF (o al menos, no sin gran cantidad de trabajo manual) ya que las estructura de un documento se pierde cuando se transforma en fichero PDF.
Es muy interesante que PDF 1.3 incluya un mecanismo en forma de estructura en árbol que permite contener datos tipo XML. De este modo, es teóricamente posible que un fichero PDF contenga un resumen estructurado del contenido además de una representación exacta de su apariencia. Desgraciadamente, los programas necesarios para incluir datos XML en un fichero PDF (usando marcas PDF: pdfmarks) como, por ejemplo, una Xtension para Quark XPress, aun no existen. Si necesitas PDF y XML, de momento el único camino es crear dos ficheros separados a partir de un programa de diseño o de un sistema de plublicación de bases de datos.
Si quieres saber más sobre PDF y XML, hay un artículo muy interesante que Gordon Kent publicó en PlanetPDF.
Muchas personas confunden PDF (el formato de los datos) con Acrobat (el programa que la firma Adobe vende para generar, manipular y ver ficheros PDF). Esta confusión parece surgir del hecho de que casi todas las nuevas versiones de las especificaciones PDF van acompañadas de una nueva versión Acrobat. La versión 1.2 de las especificaciones PDF fueron acompañadas de Acrobat 3. Las especificaciones 1.3 de PDF, lo fueron de Acrobat 4.
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
En los dos ultimos años he estado usando Preps (de Scenisoft) sobre todo para trabajos de imposición de páginas. Aunque echo de menos el interfaz de usuario de PressWise [de Imation, adquirida por Scenicsoft en 1999], Preps ha resultado ser un programa bastante sólido que cuenta con un impresionante equipo de apoyo técnico.
En el momento de escribir estas páginas, Preps se encuentra en la fase beta de su versión 4.0. Scenicsoft ha informado de que esta versión podrá trabajar plenamente con el formato PDF. Afirma que será capaz de leer, analizar e imponer directamente ficheros PDF si necesidad de convertirlos primero a ficheros PostScript. He echado un vistazo a la fase beta de esta versión y veo que es cierto. Desgraciadamente no han alterado el interfaz de usuario de Preps, lo que deberían hacer tarde o temprano.
[Nota del traductor español: L. Leurs escribió estas líneas en 2000. Actualmente (verano de 2002), Preps se encuentra en su versión 4.1.2, que es una actualización para quienes tienen Preps 4.0. Preps tiene versiones en español, por cierto.].
Preps 3.7 contaba con capacidad de reconocer ficheros PDF de nivel 1.3 (los creados por Acrobat 4). Sin embargo, aun necesitab convertir los ficheros PDF a PostScript antes de leerlos. En el caso de ficheros PDF de color que era necesario separar, no se podía confiar en el algoritmo de separación de Preps. Era mejor recurrir a una separación en el RIP.
Aunque Preps 3.5 era teóricamente capaz de reconocer el formato PDF (procedente de Acrobat 3), lo tenía que hacer por medio de un atajo que se basaba en que nada más añadir un fichero PDF a la lista de trabajo, Preps arrancaba Acrobat Exchange y hacía que éste exportara en un segundo plano el PDF a un fichero PostScript. A continuación, Preps analizaba el fichero PostScript. Como el fichero PostScript era tan grande, al menos, como el fichero PDF, había que tenerlo en cuenta al considerar la capacidad de almacenamiento del sistema.
Las primeras versiones de Preps 3.5 tenían algunos problemas con este sistema de PDF a PostScript. Cuando se sustituía un fichero PDF por una versión más nueva, Preps no hacía caso de estas alteraciones y se empeñaba en mantener el primer fichero PostScript. Este fallo se corrigión en revisiones posteriores del programa.
En el caso de ficheros PDF de color que tuvieran que ser separados, no era fiable usar el algoritmo de separación de Preps, y era mejor usar una separación en el RIP.
Que Preps comenzara a poder trabajar con ficheros PDF a partir de la versión 3.5 no quiere decir que no se pudieran importar ficheros PDF en versiones anteriores. Lo unico que había que hacer era abrir Acrobat y exportar a un fichero PostScript. He hecho esto con ficheros procedentes de diversas fuentes y siempre resultó bien con Preps 3.1e (que fue la primera versión de Preps capaz de trabajar en condiciones con sistemas de separación en el RIP de dispositivos de Agfa).
Una advertencia: En el caso de ficheros PDF de color que tuvieran que ser separados, no era fiable usar el algoritmo de separación de Preps y era mejor usar una separación en el RIP. Por eso habia que configurar Preps para que enviase el fichero PostScript compuesto al RIP y dejar que éste hciera el trabajo duro. Para los RIPs de Agfa, esto quería decir que hacía falta la versión 3.1c de Preps, que era ya capaz de admitir deparaciones hechas en el RIP ejecutando PSE 11 o posterior.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Según algunas fuentes, la firma Quark, fabricante de Quark XPress (probablemente el programa de maquetación más popular de los que existen) pretendió que Adobe pagara por incluir soporte para PDF en la versión 4 de Quark XPress. Adobe se negó y Quark sacó el programa sin funcionalidades PDF. Con esta estrategia a Quark le salió el tiro por la culata cuando el formato PDF se convirtió en un gran éxito. Quark tuvo entonces que prometer la creación de una Xtension para tratar el formato PDF. Aunque tardó algún tiempo en estar preparada, al final salió como Xtension gratuita disponible en el sitio web de Quark. Una vez instalada, esta Xtension añade dos funcionalidades importantes a Quark XPress:
La capacidad de importar ficheros PDF dentro de una caja de imagen.
La capacidad de exportar y crear ficheros PDF desde Quark Xpress.
Sin embargo, aunque esto pueda parecer una gran cosa, lo cierto es que no hay que ser muy listo para percatarse de que la Xtension tiene sus fallos. Es lenta y no reconoce los colores directos que se hayan usado como tales en el PDF. Ambas limitaciones se pueden obviar, sin embargo, exportando el PDF a un fichero EPS compatible con el nivel PostScript 1 desde el mismo Acrobat y luego trayendo el fichero EPS a Quark XPress como una imagen normal. Hay que destacar que esta "técnica" puede dar origen a ficheros EPS verdaderamente grandes, ya que las imágenes se descomprimen.
Otra desventaja de la Xtension se revela cuando se colocan ficheros PDF multipágina y después, por lo que sea, se actualizan. Quark XPress rebobina hasta la primera página de cada fichero PDF aquellos PDFs que estuvieran colocados dentro de cajas de imagen haciendo referencia a páginas distintas de la primera del PDF
En conjunto, la importación de ficheros PDF parece funcionar bien cuando se trata colocar sólo cosas como anuncios o pequeños ficheros PDF de una sóla página y de imprimir esto sólo en dispositivos de color compuesto (sin hacer separaciones).
Además, la idea de que se preparan y exportan ficheros PDF directamente desde Quark XPress no es del todo cierta. La Xtension meramente actua como una especie de controlador para Acrobat Distiller. Como ocurría en el caso de Quark XPress 3.x, perfiero imprimir a un fichero PostScript y después usar Acrobat Distiller o cualquier herramienta similar para convertir el fichero PostScript a PDF.
Una cuestión importante que no hay que perder de vista es que los ficheros PDF son ficheros compuestos (composite), es decir que cada página lleva consigo la necesaria información de Cian, Magenta, Amarillo y Negro. No va cada color en una página separada. La limitación al respecto de Quark XPress nace de que sus ficheros PostScript compuestos no contienen toda la información necesaria sobre trapping. Las sobreimpresiones y calados se conservan, pero los reventados (chokes y spreads), se pierden. Este es un buen problema si no se dispone de un RIP o de alguna aplicación aparte capaces de encargarse del trapping. Además, aunque los valores de sobreimpresión de Quark XPress se pueden conservar en un PDF, esto no siempre ocurre.
Los gradientes y degradados creados con colores directos no se conservan muy bien, incluso aun cuando se haya configurado Acrobat para que respete los colores directos en el fichero PDF. Los colores directos se convierten a CMYK.
Otro problema está en las sangres de los documentos. En teoría el tamaño del PDF resultante es totalmente fiel al tamaño de la página del documento de Quark XPress (es decir, un A4 de Quark XPress es un A4 en Acrobat). Pero, por desgracia, Quark XPress no incluye sangrías al crear un PDF mediante la impresión a un archivo PostScript y posterior tratamiento con Acrobat Distiller (lee esto si quieres saber más).
Si se usan ficheros DCS dentro de un documento de Quark XPress, este programa sólo incluye las previsualizaciones de baja resolución al imprimir ficheros compuestos. La consecuencia es que los ficheros PDF resultantes sólo incluirán las imágenes de baja resolución.
las líneas de puntos de Quark XPress dan a veces problemas al crear ficheros PDF. Si la longitud de un filete no es completamente divisible por la cantidad de puntos (con la opción "Estirar hasta las esquinas" desactivada), a veces aparece una especie de punto perdido suelto al final de la línea.
Y un último problema. Puede darse el caso de que haya pequeñas diferencias entre los tamaños de la página definida en Quark XPress y la del PDF correspondiente (lo usual son diferencias de unos 0,3 mm). Esto se debe a que Quark XPress sólo usa números enteros (integers) al describir el tamaño de sus páginas en un fichero PostScript.
Hay un par de cosas que se pueden hacer para afrontar algunos de los problemas descritos y complicarse al mínimo la vida cuando se tienen que generar muchos ficheros PDF con Quark XPress.
En primer lugar, existen varias aplicaciones comerciales que solucionan esos problemas. Apogee Create (Agfa) puede tratar los problemas de valores de sobreimpresión, gradientes, ficheros DCS y establecer las sangres de los documentos. En cierto modom se lo puede cnsiderar una versión de alto nivel de Acrobat Distiller.
La Xtension SmartXT, (Total Integration) sirve para volver a fusionar los datos DCS al imprimir a un fichero compuesto. En el sitio wev de Creo Prinergy se pueden obtener algunas extensiones gratuitas para Acrobat que sirven para resolver los problemas de sangres y gradientes.
La Xtension DCSMerger (Impressed) es útil para guardar ficheros DCS como ficheros de color compuesto para que se puedan usar en un sistema de trabajo basado en ficheros de color compuesto
Posiblemente existan en el mercado muchos productos de trapping que son capaces de volver a aplicar éste a un fichero en el caso de que Quark XPress se haya "olvidado" de añadir valores sensatos de trapping a sus ficheros compuestos. Estos productos están disponibles como programas con entidad propia (como es el caso de Trapwise, de Scenicsoft), como extensiones de Acrobat (por ejemplo, Supertrap de Heidelberg), o como módulos de un RIP (ese es el caso, por ejemplo, de la capacidad de separaciones en el RIP para los RIPs de Adobe o Harlequin, de Global Graphics).
Por L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
Nunca he usado Tex y no lo conozco salvo por saber que es un lenguaje-programa de composición especialmente adecuado para materiales científicos con muchas fórmulas. Fue desarrollado hace ya varios años por el profesor Donald Knuth y es aún muy popular en el mundo universitario.
El único motivo de haber incluido aquí esta página sobre Tex es proporcionar un enlace a Y&Y, que tienen disponible un PDF [en inglés] sobre la creación de ficheros PDF desde Tex.
[Nota del traductor español: También se puede consultar Este documento PDF de D.P. Story, de la Universidad de Akron (Ohio, EEUU).]
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
El texto en un fichero PDF puede ir comprimido o sin comprimir. El algoritmo de compresión usado es LZW. Si el texto se hubiera comprimido, ya no será legible a simple vista si se abre con un editor de texto.
El algoritmo LZW funciona reemplazando los datos más frecuentes por un sólo carácter. Suele dar una tasa de compresión de 2:1.
En los ficheros PDF el texto se distribuye línea a línea. Esto significa que un PDF no tiene "conciencia" de cómo fluía el texto en el documento original. Si usas Adobe Acrobat para hacer una pequeña corrección, las palabras no refluirán a la línea inferior si hiciera falta. Sin intentas seleccionar dos líneas en dos columnas adyacentes, verás que puedes seleccionar a lo largo de ambas columnas.
Afortunadamente, si copias y pegas las dos columnas en un documento de texto, verás que se pega en orden adecuado, una columna detrás de otra.
[Nota del traductor: Existen plug-ins para versiones de Acrobat anteriores a la versión 5 que permiten extraer el texto de los documentos. A partir de la versión 5, Acrobat mismo es capaz de guardar el texto de los documentos no bloqueados.]
En el formato PDF se pueden usar fuentes PostScript (tipo 1 y tipo 3) y fuentes True Type. Estas fuentes se incluyen preferentemente en los ficheros PDF para que se puedan ver e imprimir tal cómo fueron hechos por sus creadores. Si faltan algunas fuentes, Acrobat (ya sea su versión completa o Acrobat Reader) intentará emularlas usando alguna de las fuentes Multiple Master que llevan incluidas. De este modo, el documento no se representará tan exactamente como su creador quiso, pero, al menos, el texto no refluirá.
Las fuentes Multiple Master (MM) que Adobe Acrobat usa son:
Adobe Serif MM.
Adobe Sans MM.
Acrobat (ya sea su versión completa o Acrobat Reader) ofrecen una opción
de información sobre las fuentes es su menú "Archivo
- Datos del documento - Fuentes". En este apartado se listan sólamente
aquellas fuentes usadas en la página activa en ese momento. No debes usarlo
como una fuente de información sobre todas las fuentes usadas en un fichero
PDF. Para obtener una lista completa de todas las fuentes usadas en un
fichero PDF debes usar una extensión del tipo de PitStop
(de Enfocus).
Acrobat Distiller ofrece la opción de añadir automáticamente las fuentes
perdidas a los ficheros PostScript que tiene que procesar. En el menú
de "Configuración - Ubicación de fuentes",
el usuario puede definir varias carpetas para que Acrobat Distiller busque
y sepa dónde localizar las fuentes que falten en el fichero PostScript.
Para los usuarios de Macintosh: EL programa sólo necesita las fuentes
de impresora, no las de pantalla.
Hay algunas diferencias fundamentales entre Acrobat 3.x y Acrobat 4.x en la forma de gestionar las fuentes.
Hay 14 fuentes que Acrobat Distiller 3.x nunca incrusta en un fichero PDF. Son:
Courier, Courier-Bold, Courier-Oblique, Courier-BoldOblique.
Times-Roman , Times-Bold , Times-Italic, Times-BoldItalic.
Helvetica, Helvetica-Bold, Helvetica-Oblique, Helvetica-BoldOblique.
Symbol.
Estas fuentes (ZapfDingbats excluida) son las llamadas 13 fuentes básicas.
Adobe Acrobat 4.x no tiene problemas en incrustar esas 14 fuentes. Pero sí tiene otra restricción: Si las normas de licencia (licensing policy) de una fuente True Type impiden que la fuente de incruste en un fichero, Adobe Acrobat 4.x respetará esta restricción y no incrustará la fuente. Lee esto si quieres saber más sobre este problema.
También es posible incluir sólo aquellos carácteres de una fuente que
se usen en una publicación. Esta técnica se llama "incrustar
subjuegos de fuentes". Al usar la opción "Configuración
- Opciones de trabajo - Fuentes - Incrustar subjuegos de fuentes por debajo
de XXX %" de Acrobat Distiller, el usuario puede decidir cuántos
carácteres deben haberse usado en una publicación para que se incruste
una porción de esa fuente.
incrustar subjuegos tiene dos ventajas:
El tamaño del fichero PDF final se reduce y esto puede ser muy útil si el tamaño de un PDF es verdaderamente crucial, como es el caso de PDFs que deban situarse en la Red.
Un RIP usará siempre una fuente incrustada como subjuego incluso aunque disponga por sí mismo de la fuente completa. Esta es una manera de evitar recolocaciones extrañas de textos debido a difererencias menores entre veersionesde una misma fuente.
Sin embargo, incrustar subjuegos también tiene dos desventajas:
Si el usuario opta por editar algo de texto en Adobe Acrobat y un carácter que se necesite no ha sido incrustado en el subjuego, no podrá usarse.
Fusionar dos ficheros PDF que contienen subjuegos diferentes de una misma fuente puede hacer que desaparezcan carácteres necesarios.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Los ficheros PDF son muho menores que sus equivalentes PostScript. Aunque esto se consigue en parte gracias a una mejor estructura de los ficheros, la razón principal se debe a los algoritmos de compresión extremadamente eficaces que admiten los PDFs.
Todos los textos y todas las órdenes PostScript que forman parte de un PDF se pueden comprimir usando el algoritmo LZW (Lempel-Ziv-Welch). Esta compresion por si sola ya puede dejar el tamaño de un fichero PDF en la mitad del tamaño de su equivalente PostScript.
Si la comresión está activada en el Acrobat Distiller, lo primero que hará este programa es descomprimir todas las imágenes que se hallen dentro del fichero PostScript y luego las volvera a comprimir al crear el fichero PDF. En el caso de las imágenes, existen varios algoritmos de compresión admisibles: JPEG, Zip, CCITT, RLE y "hinchar/deshinchar" (flate).
Para comprobar qué tipo de compresión se ha utilizado, basta con abrir el fichero PDF en un simple editor de texto que admita datos binarios (el Bloc de Notas, etc...) y buscar allí la cadena "/Filter".
La compresión JPEG se usa para imágenes de cuatricromía y escala de grises. Es un algoritmo de compresión que puede ser "con pérdidas" (lossy) y "sin pérdidas" (non-lossy). Sin embargo, en Adobe Acrobat sólo está disponible el modelo "con pérdidas". Esto quiere decir que algunos detalles de la imagen se pierden o deterioran cada vez que se la comprime. Cuanto mayor es la tasa de compresión, mayor es el deterioro de las imágenes. Si quieres saber más sobre el algoritmo de compresión JPEG, puedes leer esto [y también esto otro, en inglés].
Acrobat Distiller 3.x ofrecía cinco niveles de compresión JPEG:
Baja: Propociona una pérdida de calidad que es generalmente aceptable salvo en el caso de los trabajos más exigentes. La tasa media de compresión es de 1:2.
Baja - media
Media: Proporciona una tasa de calidad para trabajos de tipo medio. La tasa media de compresión es de 1:5.
Alta - media
Alta: not acceptable for prepress any more. Average compression ratio: 1/10
Acrobat Distiller 4 tenía disponibles ajustes muy similares, pero no se correspondían exactamente con los de Acrobat 3. En Acrobat Distiller 4.0 había además un fallo de programación que afectaba al algoritmo JPEG. Este fallo se arregló con la actualización a 4.05. Las opciones son:
Mínima.
Baja.
Media.
Alta.
Máxima.
Las imágenes que se han comprimido usando el algoritmo JPEG no deben recomprimirse, ya que esto causará una pérdida acumulativa de calidad. Si se destila un fichero que contiene imágenes comprimidas como JPEGs, Acrobat Distiller las descomprimirá y volverá a comprimir (dependiendo de los parámetros que se hayan establecido). Esto dará lugar a la mencionada pérdida de calidad.
La extensión para Adobe Acrobat Quite A Box Of Tricks (de Quite Software) permite algoritmos de compresión JPEG más potentes que los del propio Acrobat. Además permite la recompresión de ficheros PDF.
El algoritmo de compresión Zip es el que usan utilidades para PC muy populares como WinZip, PKZip, Stuffit y similares. su uso no quiere decir que Acrobat sea capaz de crear un fichero Zip, sino que usará el algoritmo para comprimir imágenes de color o escala de grises.
La compresión Zip es un poco más "inteligente" que la realizada por el algoritmo LZW. Lo que hace es escanear un fichero para detectar secuencias repetidas y entonces reemplaza éstas por una marca. Un ejemplo sería comprimir todo la web del Rincón del PDF y sustituir la palabra "fichero" (de gran frecuencia) por una simple marca. Una sucesión de sustituciones permite un gran ahorro de bytes.
Zip es un algoritmo de compresión "sin pérdidas". Esto quiere decir que las imágenes no se degradarán al comprimirlas. En Adobe Acrobat 4 es realmente así, pero en Acrobat 3 existe la opción de usar una compresión de 4 bits y otra de 8 bits. El problema es que con la de 4 bits, Acrobat reducirá primero el número de tonos por canal de 256 a sólo 16 y, posteriormente, realizará la compresión "sin pérdidas". El resultado es una tasa de compresión excelente y una degradación de la calidad extrema. Por consiguiente, la compresión Zip de 4 bits se debe evitar siempre a no ser que las características (color, contenido, etc...) de los ficheros se presten a ello. La compresión zip con 8 bits carece absolutamente de pérdidas.
La compresión CCITT se puede usar con imágenes de línea (en Photoshop: Mapa de bits). Es el mismo algoritmo de compresión que utilizan los faxes. Es una compresión "sin pérdidas", por lo que las imágenes no sufren degradación alguna.
Adobe Acrobat ofrece la posibilidad de elegir entre Grupo 3 de CCITT y Grupo 4 de CCITT. La mayoría de las opiniones están de acuerdo en que la segunda es mejor. Se puede dejar activada por omisión.
El algoritmo RLE (Run Length Encoding) es un sistema de compresión "sin pérdidas", por lo que no afectará a la calidad de las imágenes. El algoritmo RLE es probablemente el más simple que existe. en vez de escribir un fichero que vaya diciendo: "Pixel blanco, pixel negro, pixel negro, ...." Va diciendo algo así como: "129 píxeles negros, dos píxeles blancos, ..."
En Acrobat, la compresión RLE se puede usar para imágenes de línea (en Photoshop: Mapa de bits). La mayoría de los usuarios prefieren la compresión CCITT porque es más eficaz.
El algoritmo de "hinchar/deshinchar" (flate, a veces también llamada deflate) es un sistema de compresión bastante complejo que he tratado con más profundidad en otra página.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Los ficheros PDF pueden contener imágenes, por supuesto. Éstas pueden ser:
Imágenes de línea (blanco y negro, sin grises). Hay que tener cuidado, ya que Acrobat Exchange 3.x puede tener algunos problemas al mostrar esas imágenes. Si esas imágenes se han coloreado dentro de un programa profesional como Quark XPress (por ejemplo, dándole color a un logotipo), pudiera ser que Acrobat Distiller 3.x o 4.x tuvieran algunos problemas con ellas.
Imágenes de escala de gris: Del mismo modo que en el caso anterior, si las imágenes se han coloreado en programas como Quark XPress, pudiera ser que Acrobat Distiller 3.x o 4.x tuvieran algunos problemas con ellas.
Imágenes multitono (duotonos, tritonos, cuadritonos, hexacromías, etc…): No son posibles en ficheros PDF 1.2 (creados con Acrobat 3.x). La especificación PF 1.3 proporciona soporte para un nuevo espacio de color llamado DeviceN que está especialmente ideado para este tipo de imágenes. Para saber más sobre este tema, echa un vistazo a la sección sobre DeviceN que hay más abajo.
Imágenes RGB: Estas son imágenes que soportan unos 16 millones de tonos de color, aquneu también es posible incrustar imágenes que sólo admiten unos pocos tonos (hasta 256, llamadas de color indexado).
Imágenes CMYK.
Como puesdes ver, casi cualquier cosa de las que son posibles en los programas profesionales se puede mantener en un fichero PDF. Algunas veces, la creación de un fichero PostScript y la subsiguiente transformación en un fichero PDF cambia el contenido de las imágenes. Entre los problemas más usuales están la alteración de imágenes CMYK a RGB y la transformación de imágenes en color a blanco y negro.
En la mayoría de los casos, las imágenes que van en los ficheros PDF se comprimen para limitar el tamaño de éstos. Lee esto si quieres saber más sobre los algoritmos de impresión utilizados en los ficheros PDF.
Algunas veces, un fichero PDF contiene referencias OPI a las imágenes aunque en la cadena de trabajo en cuestión no se use OPI. Esta peculiaridad no es una "característica" del formato PDF, sino que es más bien una consecuencia de la manera en la que algunas aplicaciones profesionales como Quark XPress o Adobe PageMaker trabajan con las imágenes. Puedes saber más sobre el tema leyendo esto.
Si usas una herramienta como PitStop para comprobar los elementos que hay dentro de un fichero PDF, verás que a veces las imágenes van incrustadas como objetos llamados 'Forms XObject'. En el interior de los ficheros PDF, los Forms XObjects son el equivalente lógico de los ficheros EPS, es decir, cualquier combinación de texto, información vectorial o imágenes de mapa de bits. Puede haber Forms XObjects dentro de otros Forms XObjects, etc… Aunque no es imprescindible, parece que Acrobat Distiller forma Forms XObjects allí donde ecuentra OPI, incluso aunque se trate de una sola imagen que podría representarse de forma más simple con un 'Image Xobject'.
Si no trabajas con un sistema basado en OPI, puedes desactivar la opción "Opciones de trabajo - Avanzadas - Convenciones de estructura de documentos - Conservar comentarios OPI" y eliminar así la aparición de muchos Forms XObjects. A veces las herramientas PDF no son capaces de manipular los Forms XObjects y algunos otros arcanos estructurales del PDF. Por eso es una buena idea intentar evitar su uso.
En la especificación PDF 1.2 (Adobe Acrobat 3), no había manera de incrustar multitonos (duotonos, tritonos, cuadritonos, etc…) de forma correcta. Algunas compañías compusieron apaños basados en hacer que las imágenes se sobreimprimieran. Aunque este era un procedimiento que conseguía filmaciones correctas, las imágenes no se podían ver en pantalla.
En la especificación PDF 1.3 (Adobe Acrobat 4), se proporcionó un nuevo espacio de color llamado DeviceN que está especialmente ideado para ese tipo de imágenes. DeviceN se puede usar además para otros objetos como degradados con colores directos (spot colours). La principal desventaja de este DeviceN es que sólo se puede separar de forma adecuada en un RIP de nivel PostScript 3.
La gestión del color con los PDFs es algo que he conseguido ignorar con
éxito hasta ahora. Por eso, me temo que tardaré en tener información al
respecto ![]()
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Un gradiente o degradado (blend) es una transición gradual entre un tono o color y otro. A veces también se les llama "transiciones".
Para crear esos gradientes se pueden usar muchos programas y hay muchas maneras en las que se los puede realizar. Para mayor claridad, hay que distinguir entre las técnicas que se usaban antes de la llegadas del PostScript 3 y Adobe Acrobat 4, y aquellas que se han comenzado a usar después.
Antes de la llegada del nivel PostScript 3 y de Adobe Acrobat 4, un PDF contenía un gradiente de forma similar a cómo el program de origen hubiera codificado ese gradiente en el fichero de impresión PostScript.
La mayoría de las aplicaciones codifican un gradiente en PostScript creando una multitud de objetos (líneas, rectángulos o elipses en el caso de un gradiente circular) que se van desplazando levemente o cambian de tamaño y cuyo color varía también de poco en poco. En la pantalla y al imprimir se ve un degradado, pero lo que puede haber ahí son 256 cajas que se superponen y varían ligeramente de color.
Algunos programas, como por ejemplo Microsoft PowerPoint, crean el código necesario de forma muy ineficaz, y Acrobat Distiller o Acrobat PDF-Writer incluyen ese algoritmo ineficaz en el PDF resultante. Para ver lo que quiero decir, lee esto.
Todo esto cambió cuando "smooth shading" y "idiom recognition" se incorporaron a los productos de Adobe.
"Smooth shading" es una técnica que Adobe incorporó a PostScript 3 y a PDF 1.3. Es una forma muy compacta y rápida de definir degradados y transiciones. El resultado se ve y se imprime estupendamente, incluso con resoluciones muy bajas o con lineaturas muy elevadas.
Desgraciadamente en el mercado hay muchos programas que no son capaces de usar "smooth shading" por sí mismos, ya sea porque sus programadores no se han tomado el esfuerzo de ponerlo en práctica o porque deseaban conservar la compatibilidad con RIPs que no fueran de nivel PostScript 3.
Esta situación explica porqué Adobe decidió incorporar un mecanismo llamado "idiom recognition" a PostScript 3. Éste es un algoritmo que explora un fichero PostScript y, si encuentra un degradado creado por una de las aplicaciones de preimpresión más conocidas (Quark XPress, Adobe Illustrator o Macromedia Freehand), lo reemplaza por una versión realizada mediante el superior sistema PotScript 3 de "smooth shadings".
Compañías como Scitex ya llevaban años usando una técnica similar en la tecnología propia que aplicaban a sus RIPs.
Acrobat 3 no realiza ese "idiom recognition". Lo que es peor, "idiom recognition" no funciona cuando un RIP intenta procesar ficheros PDF creados con Acrobat 3. Lee esto si quieres saber más sobre esta limitación.
En Acrobat 4 y Distiller 4, Adobe incorporó el mismo "idiom recognition"
que usaba en sus RIPs. Esta característica se puede desactivar si se considera
necesario. En la ayuda de Acrobat 4 hay un fichero llamado Distparm.pdf
donde se describe cómo hacerlo.
Acrobat 5 incorpora el mismo algoritmo que la versión 4, pero ahora se
puede activar o desactivar en el menú "Configuración
- Opciones de trabajo - Avanzadas" de Acrobat Distiller. La opción
es "Convertir gradientes en transiciones suaves".
Los gradientes deberían verse bien en pantalla. Si no es ese el caso, lo usual es que se deba a los parámetros del propio monitor. Si la tarjeta gráfica está fijada a 256 colores o (en el caso de los PCs) al llamado color de 16 bits (unos 65.000 colores), la tarjeta de vídeo no podrá representar los degradados de forma adecuada.
Cuando se imprime desde Adobe Acrobat o Acrobat Reader un documento que contiene "smooth shadings", los gradientes se imprimirán según sea el tipo del dispositivo de impresión:
En impresoras de nivel PostScript 3, Adobe Acrobat se limita a enviar el código de "smooth shading", por loq ue la calidad y rapidez de impresión son óptimas.
En dispositivos más viejso, que no son PostScript 3 o que no son PostScript en absoluto, Acrobat convierte los degradados en imágenes de mapa de bits con la resolución óptima para el dispositivo de salida. De este modo, lo impreso es también lo mejor conforme al dispositivo, pero la rapidez de impresión es mucho menor.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Desde la revisión PDF 1.2 (Acrobat 3), el formato PDF soporta OPI (Open Prepress Interface). sto significa que se pueden crear PDFs que contengan comentarios OPI en lugar de (o además de) imágenes de alta resolución. A los ficheros PDF que contienen imágenes OPI se les suele llamar "ficheros PDF 'delgados' (thin)". Los PDFs que sólo contienen imágenes de alta resolución se suelen llamar "ficheros PDF 'gruesos' o 'gordos' (fat)".
La especificación PDF 1.2 sólo soportaba comentarios OPI 1.3. Esto hacía que esos ficheros fueran incompatibles con versiones anteriores de Color Check. Lee esto si quieres saber más sobre el tema.
La especificación PDF 1.3 (Acrobat 4) soporta comentarios OPI 1.3 y 2.0. Esto debería bastar para que los ficheros PDF resultantes sean compatibles con cualquier sistema OPI disponible en el mercado.
Hasta donde yo sé, aun no hay en el mercado sistemas OPI que den verdadero soporte al formato PDF. Es decir, que sean capaces de tomar un PDF de una carpeta monitorizada, reemplazar las imágenes marcadas por todas las referencias OPI de ese fichero y escribir a continuación un PDF "grueso" en una carpeta de salida. Los sistemas OPI disponibles en la actualidad sólo son capaces de realizar ese remplazo dentro de ficheros PostScritpt.
Si se da el caso de recibir un fichero PDF que contenga comentarios OPI y se adjunten las imágenes de alta resolución, es bueno que sepas que existe en el mercado una extensión llamada OPI-Doctor (de Lantana), que permite volver a enlazar las imágenes dentro del PDF [Nota del traductor español: Esta extensión parece haber sido sustituida por otra del mismo fabricante llamada PDF ImageWorks].
He tenido numerosas discusiones con algunas personas sobre las ventajas y desventajas de usar PDFs "delgados". La única ventaja que tienen es el tamaño del fichero PDF: Esos PDFs "delgados" pueden llegar a ser muy pequeños y su proceso es extremadamente rápido.
Sin embargo, la lista de desventajas del uso de OPI con PDF es larga:
Una de las desventajas de PDF es que los ficheros se pueden comprobar visualmente usando Adobe Acrobat o simplemente Acrobat Reader. Sin embargo, cuando se usa un sistema de trabajo OPI basado en "omitir imágenes", cualquier PDF que se abrá sólo contendrá los comentarios OPI y no será posible verlo correctamente.
Los ficheros PDF pueden ser por si mismos muy pequeños debido a los algoritmos de compresión tan buenos que usan. Por eso, usar OPI para limitar el tamaño de los PDFs no es realmente tan necesario.
El uso de programas de comprobación previa (preflight) y de herramientas para edición de PDFs suele ser imposible con los PDFs "delgados" debido a que no contienen los datos finales.
Hay quien usa Acrobat Distiller como herramienta para eliminar posibles errores PostScript en la cadena de producción. La ventaja de trabajar así desaparece cuando un sistema OPI es capaz de insertar imágenes corruptas y código PostScript incorrecto después de que un fichero PDF se haya procesado para "limpiarlo".
Todos esos argumentos revelan que el uso de PDFs "delgados" no siempre es una buena idea. En muchos casos, tiene más sentido seguir usando OPI para que este sistema genere PDFs "gruesos" y que estos sean los que se proceen dentro de la cadena de trabajo.
Algunos programas, como Quark XPress (incluida sus versiones 4.x), tienden a añadir comentarios OPI a sus datos PostScript incluso aunque no se use un sistema OPI. Esto es especialmente cierto en el caso de las imágenes TIFF colocadas en un documento.
Porque estos programas hacen esto es algo que se me escapa completamente. Lo que ocurre con esta conducta es que tiene un efecto secundario muy perjudicial. Algunas apliaciones de comprobación de preimpresión como PitStop dan por inútil comprobar imágenes que contienen comentarios OPI. La consecuencia de esto es que no comprueban esos ficheros TIFF incluso en el caso de que las imágenes de alta resolución estén disponibles.
La forma de evitar este problema es desactivar siempre que no se
use OPI la opción "Conservar comentarios OPI"
existente en Acrobat Distiller. de ese modo, los comentarios OPI se borran
al crear los PDFs y las herramientas de post proceso no se lian con comentarios
OPI irrelevantes.
Por Gustavo Sánchez, invierno de 2003
En el formato PDF se han definido cinco elementos que van expresados como claves (keys) para describir la geometría de un documento en cada página. Sólo uno de ellos, el que describe el tamaño de la página (MediaBox) es imprescindible en el estandar PDF. Los demás son opcionales (aunque en subestándares como el PDF/X sean necesarios).
Todos ellos van expresados en la medida establecida por omisión para el usuario. Ninguno de ellos tiene bordes visibles, aunque en estos esquemas se han indicado con líneas continuas o discontinuas para mayor claridad.
Una matriz de cuatro números que indica la zona máxima de la página, incluido cualquier espacio en blanco que se haya dejado más allá de los cortes, sangres, marcas de registro o barras de color y demás. En cristiano: la casilla de material (MediaBox) indica el tamaño de lá hoja de papel en la que está situado