Por L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
En esta página se explica brevemente cómo se almacena la información en los ficheros de formato PDF:
esta información puede ser de alguna utilidad para quien quiera editar directamente ficheros PDF. Estos documentos son simplemente ficheros de texto ASCII de 7-bits. Se pueden abrir en cualquier editor de texto puro y duro (como el Bloc de notas de Windows, por ejemplo). siempre que el texto no se haya comprimido.
En un fichero PDF, cada línea puede contener hasta 255 carácteres. Cada una de estas líneas debe terminar con un carácter de retorno de carro (que debe ir o no seguido de un carácter de nueva línea dependiendo de la plataforma usada para crear el fichero PDF). En los datos un fichero PDF se establecen diferencias entre mayúsculas y minúsculas (es un formato case-sensitive).
El formato de ficheros PDF usa una estructura fija. Siempre contiene cuatro secciones:
Una cabecera (header): Contiene información sobre qué especificación del estándar PDF sigue el fichero. Esta información es algo parecido a "%PDF-1.2" (donde 1.2 puede ser 1.0 o 1.1 en el caso de las versiones más antiguas).
Un cuerpo (body area): Contiene la descripción de cada uno de los elementos usados en las páginas.
Una tabla de referencias cruzadas (cross-reference table): Contiene la información de qué elementos se usan en las páginas del fichero PDF.
Una coda (trailer): Que le dice al RIP dónde encontrar la tabla de referencias cruzadas y que termina siempre con un "%%EOF" (marca de final de fichero: End Of File). Si esta linea faltara, el fichero estaría incompleto y lo más probable es que un RIP no sea capaz de procesar el fichero. Esto no ocurre así con los ficheros PostScript, donde si falta la parte final del fichero (debido a un error de transmisión a una caída del sistema, etc...) aun es posible imprimir parte de la página (aunque sea de forma errónea). En un fichero PDF esto no ocurre. Se pierde todo.
Cada vez que se añaden nuevos datos a un fichero PDF (al editar por ejemplo un texto o al insertar nuevas páginas), se añaden sendas zonas nuevas de Cuerpo, Tabla de referencias y Coda. Si al guardar ese documento otra vez marcamos la opción "optimizar", Adobe Acrobat limpiará el fichero eliminando esas reduplicaciones de zonas y reorganizando el fichero.
Nota del traductor: Si quieres examinar y modificar la estructura de un PDF, existe un interesante programa llamado PDFCanOpener que te permitirá hacerlo.
Por Gustavo Sánchez, verano de 2006
En el formato PDF se especifican los colores siguiendo diversos sistemas de describir los colores. Estos sistemas se llaman "espacios de color" (colour spaces).
Algunos de ellos se relacionan directamente con la forma en la que los humanos vemos el color. Son lo que se llaman "basados en CIE" o "independientes de los dispositivos".
Otros son valores numéricos cuya representación del color depende del dispositivo que los vaya a representar (son "dependientes del dispositivo"). Un tercer tipo son modos especiales de imprimir o trabajar que se han modelado como espacios de color (tintas directas, duotonos, etc…)
En PDF y PostScript, cada valor de color esta formado por uno o varios componentes que se expresan mediante números. Los valores del color se intepretan según el espacio de color que tengan asignado (en PDF un parámetro del "estado gráfico" (Graphics state). Los espacios de color se pueden agrupar en tres clases:
Aquí cada valor que describe un punto de color describe simplemente una cantidad de colorantes que se deben usar. Es decir: Un valor de porcentaje de tinta, una mezcla de luz en los fósforos de un monitor, etc… Cuando se describe un rojo RGB así, se dice simplemente R=255,G=0,B=0, por ejemplo. Un gris sería Tinta negra=50%. Un rojo CMYK sería 0/100/100/0.
En cada dispositivo el color real variará, por lo que "depende del dispositivo". Es la forma más simple (e imprecisa) de reproducir colores. Es la que usan los aparatos y programas que no disponen de gestión del color (colour management). El formato PDF tiene tres tipos de espacio de color del dispositivo:
Los colores se describen en una escala monocroma neutra (acromática) que va del blanco al negro pasando por una escala de grises. Su intensidad, tonalidad real y gradación depende del dispositivo. El negro es el color tradicional de la forma más básica de reproducción impresa.
Los colores se describen mediante tres colorantes en una mezcla aditiva de colores (o sea: Se mezclan luces). Los colorantes son Rojo (Red), Verde (Green) y Azul (Blue). Son los tres colores básicos de las pantallas.
Los colores se describen mediante cuatro colorantes en una mezcla sustractiva de colores (o sea: Se mezclan pigmentos). Los colorantes son Cian (Cyan), Magenta (Magenta), Amarillo (Yellow) y Negro (Black). Son las cuatro tintas básicas de la impresión comercial.
Al usar definiciones en un PDF el color de forma dependiente, su reproducción variará según qué aparato lo reproduzca. Sin embargo, el formato PDF permite definir (aunque no es obligatorio) una serie de espacios de color predeterminados o por omisión (DefaultGray, DefaultRGB y DefaultCMYK).
El fin de esto es que todos los valores de color definidos como Device… se conviertan a los correspondientes espacios de color predeterminados que suelen ser independientes de los dispositivos.
Cualquier espacio de color que no sea Lab, Indexado o Pattern se puede usar como espacio de color predeterminado. Pese a esta "liberalidad", lo que tiene más sentido es definir los espacios de color predeterminados usando espacios de color basados en perfiles de color ICC que describan comportamientos conocidos o estandarizados.
Esto es útil para modificar el color al reproducir en dispositivos distintos, sistemas que no entienden espacios de color calibrados o al hacer conversiones de color.
En el formato PDF (y parcialmente en el PostScript) se puede definir el color de forma independiente a cómo lo reproducen los dispositivos concretos. Esa forma de describir el color, que se llama color "calibrado" (calibrated) se basan en los estudios de una organización internacional de estudio de la luz y el color llamada CIE. Por eso a estos espacios de color se les llama "espacios de color basados en CIE" (CIEBased colour spaces).
No vamos a describir en detalle cómo se consigue esto ni cual es la teoría de la percepción del color en los humanos (para eso hay otras páginas). Baste saber con el el objetivo es que los colores de reproduzcan igual en distintos aparatos, superando sus diferencias y, en lo posible, sus limitaciones.
En estos espacios, los colores se describen mediante matrices numéricas y fórmulas de transformación que se les aplican para describir los valores de color originarios y finales. Todo ello implica el uso intenso de diccionarios, unas estructuras de datos del formato PDF y PostScript. Los conceptos de punto blanco (color neutro más claro) y punto negro (color neutro más oscuro) son esenciales en estos espacios de color. El formato PDF tiene cuatro tipos de espacio de color independientes del dispositivo (el cuatro sólo existe a partir del nivel 1.3 del formato):
Los colores se describen en una escala monocromática neutra (acromática) que va del blanco al negro pasando por una escala de grises. Su intensidad, tonalidad real y gradación depende de una función decodificadora por la que se le aplica un valor gamma que transforma (o "calibra") su resultado final. Por eso no depende del dispositivo. El negro es el color tradicional de la forma más básica de reproducción impresa.
Los colores se describen mediante tres colorantes en una mezcla aditiva de colores (o sea: Se mezclan luces). Los colorantes son Rojo (Red), Verde (Green) y Azul (Blue). Son los tres colores básicos de las pantallas. Su intensidad, tonalidad real y gradación depende de funciones decodificadoras por la que se le aplica un valor gamma particular a cada uno de los colorantes que transforma (o "calibra") su resultado final. Por eso no depende del dispositivo.
En este espacio de color, que es como los otros espacios, un espacio de color basado en CIE del tipo ABC, los valores A, B y C se asignan a los valores L*, a* y b* del espacio de color CIE L*a*b* 1976.
Este tipo de espacios de color se basan en los trabajos del Consorcio Internacional del Color (ICC) para normalizar la descripción del color en distintas sectores industriales. La diferencia básica con respecto a los espacios de color calibrado anteriores es que no se basa en entradas en los diccionarios de espacio de color sino en perfiles de color ICC (conforme a las especificaciones de dicho organismo), ya sea mediante referencia o inclusión directa del perfil.
La forma en la que los datos se especifican en este tipo de espacios de color ha ido evolucionando conforme han ido cambiando las especificaciones del ICC.
El uso de este cuatro tipo de espacio de color es menor compacto que el de los otros espacios "calibrados", pero a cambio puede representar más tonos de color de forma mucho más fidedigna y fiable.
Estos colores permiten usar métodos especiales de reproducción del color. A esta clase pertenecen Indexed, Pattern (en los que no vamos a entrar), Separation y DeviceN:
Son espacios de color que usan colorantes especiales, que representan cosas como tintas metálicas, fluorescentes, barnices o similares. Este tipo de espacios de color permiten producir separaciones de color adecuadas para esos colorantes especiales adicionales. Por tanto son espacios de color monocromos.
Este tipo de espacios de color (en PDF a partir del nivel 1.3), enfocados hacia la impresión, sirve para especificar imágenes u objetos que usen más colorantes que los procesos de impresión comerciales habituales o que lo hagan de forma distinta.
Ese es el caso de los sistemas de "color de alta fidelidad" (high-fidelity color) como la hexacromía (donde se usan seis colorantes para describir los colores en lugar de los cuatro habituales en CMYK).
También sirve para describir objetos "multitono". Es el típico caso de los duotonos; imágenes en las que un mismo punto de una imagen se reproduce con colorantes distintos usando valores distintos aplicando funciones no lineales (se trata de una imagen en blanco y negro en la que se describe la tinta negra linealmente y la otra aplicando una curva para, por ejemplo, resaltar las sombras).
Los espacios de color DeviceN permiten que los colorantes que haya en el dispositivo se trate como un espacio de color del dispositivo con varios componentes.
Dicho de otro modo, podemos crear "un color" DeviceN compuesto solo de porcentajes de Cian y Magenta (para un trabajo a dos tintas) y tratarlo como si fuera un colorante más.
Un espacio de color DeviceN funciona casi igual que un espacio de color Separación. De hecho, un espacio de color DeviceN que tenga un solo componente equivale a un espacio de color Separación.
Si un colorante asociado a un espacio de color Separación no se corresponden con un colorante disponible en el dispositivo, el programa recurre a lo que se llama "espacio de color alternativo", que permite representar el color por aproximación en un espacio de color del dispositivo o basado en CIE (nunca en otro espacio de color especial).
En otra página puedes ver en una tabla las formas de definir los colores en los distintos niveles del formato PDF y PostScript.
Esta sección pretende ser una recopilación de páginas sobre cómo se comportan distintos programas con respecto al formato PDF. Aunque no está muy al día, puede seguir mereciendo la pena.
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
Si quieres crear un PDF desde Autocad (de Autodesk), hay varias formas de hacerlo:
Crea un archivo PostScript y usa Adobe Acrobat Distiller o una herramienta similar para crear el fichero PDF. La opción de crear ficheros PostScript desde el mismo Autocad está disponible, pero no me preguntes dónde (no dispongo del dinero suficiente para trastear con programa tan caro).
Consigue una herramienta de conversión llamada OttoPDF (de Myndkryme) que sirve para convertir ficheros en formato DWG de Autocad a ficheros PDF. Lo bueno de esta utilidad es que además de funcionar estupendamente es gratuita. [Nota en junio de 2003. El sitio web parece haber quedado un poco parado]
Además, hay en el mercado varias herramientas que pueden convertir ficheros e Autocad en ficheros de Adobe Illustrator o pasarlos a formato PICT (que Macromedia Freehand puede leer). De hecho, Adobe Illustrator y CorelDraw pueden leer directamente ficheros de formato DXF. Así es posible usar ambas aplicaciones para después exportar los ficheros a formato PDF. El problem es que a veces el grosor de las líneas originales se ve afectado por el proceso de conversión.
Si tienes Adobe Acrobat o sólo PDF-Writer, puedes ir al sitio web de FastCad y conseguir allí el visor gratuito CADView/7 para ver archivos DWG y DXF. Una vez conseguido, basta abrir los archivos e imprimirlos con PDF-Writer.
Si tienes más información sobre Autocad y el formato PDF o conoces algún sitio web sobre el tema que sea interesante, por favor, envía un e-mail a mí o a mi traductor.
L. Leurs, 2002
(traducción: Gustavo Sánchez Muñoz)
Muchas personas usan el formato PDF como una forma de imprimir profesionalmente documentos de Microsoft Office. Aunque esta es una idea bastante buena, hay que tener en cuenta algunas limitaciones de Microsoft Word.
La primera es que el uso de PDF-Writer es casi siempre una mala idea, al menos en lo que se refiere a impresión profesional. Lo recomendado es siempre imprimir a un fichero PostScript y después usar Acrobat Distiller o alguna herramienta similar para crear un PDF.
Si se instala Adobe Acrobat en un sistema que ya tenga instalada la suite Microsoft Office, se añaden macros a Word, Excel y Power Point que sirven para automatizar la creación de ficheros PDF. Siempre que se seleccione en estos programas la opción "exportar a PDF", la aplicación procederá a crear el fichero PostScript y después arrancará Distiller para convertir automáticamente ese código a PDF, lo que es algo bastante práctico.
Estos son algunos de los problemas que existen. Buena parte de la información que aquí se explica fue amablemente proporcionada por Dov Isaacs (Adobe) y Jacob Schäffer (Grafikhuset).
Como la mayoría de las aplicaciones de Microsoft Office, Word se basa en el modelo gráfico del sistema sobre el que se esté ejecutando: GDI en Windows y QuickDraw en Macintosh. Al imprimir a un archivo PostScript, Word usa un controlador PostScript para generar el código correspondiente, salvo en el caso de los ficheros EPS, cuya información se limita a transmitir. Esto quiere decir que todos los colores del PDF resultante serán colores RGB y, aunque todos los RIPs PostScript más modernos pueden efectuar la separación de esos colores, el resultado podría no ser el esperado.
Ese código RGB resultante arriba mencionado hace los elementos negros o con un porcentaje de negro (grises) se filmen en las cuatro planchas (CMYK) de una cuatricromía. Para los Windows de la familia 9.x existe una versión (4.4.1 y posteriores) que incluye la opción de forzar la salida de los textos y gráficos de línea con el valor equivalente de Negro (dejando los colores restantes en sus valores RGB). Además, hay en el mercado varias herramientas y extensiones que permiten la conversión de colores RGB a CMYK. Ese es el caso de Quite A Box Of Tricks , (Quite, para PDFs ya hechos) y de Colour Chameleon 2000 (Grafikhuset, para antes de hacer los PDFs).
Cuando trabaja y componen los textos, Word toma los valores de medida de las fuentes (font metrics) de las unidades de resolución del dispositivo de salida que tenga fijado en ese momento, y no de medidas absolutas de alta resolución. Eso quiere decir que cada vez que especifica una impresora nueva (aunque se siga usando el mismo controlador) el texto puede refluir y los saltos de línea pueden ser diferentes. Esto es aún más notable si se altera la resolución del dispositivo. Además, parece que los márgenes de impresión (es decir, la especificación de las zonas no imprimibles en el PPD y los ajustes del dispositivo) también tienen su influencia. Hay un par de medidas que se pueden tomar para evitar estos problemas:
Una solución es trabajar seleccionando el controlador de impresora de Acrobat Distiller y fijándolo a la resolución que se vaya a usar finalmente (1.200 ppp, por ejemplo). Para no alterar nada, las impresiones se deben hacer con los PDFs desde el menú de impresión de Acrobat.
En el menú "Herramientas - Opciones - Compatibilidad", Microsoft Word tiene una opción "Usar las medidas en la impresora para dar formato al documento" que hace que el texto tienda a refluir aún más. Esta opción se debe desactivar antes de crear cualquier documento.
En lo que se refiere al formateo de los textos, no es buena idea mover documentos de Word de una plataforma a otra (Windows a Macintosh o viceversa). Tampoco es buena idea llevarlos de Windows 9.x a Windows NT o Windows 2.000. En ambos casos puede haber redistribuciones, pero no es un aregla fija.
Al fijar el interlineado de los textos es bueno evitar los interlineados automáticos ("sencillo", "multiple", etc…). Es mejor usar un valor fijo ("12 puntos", "14 puntos" …).
Cuando se usan fuentes True Type con documentos de Word y se ha especificado en el controlador de impresora que las fuentes True Type deben enviarse a la impresora como "Fuentes de contorno", pudiera haber pequeñas diferencias en los espaciados de los carácteres tipográficos, especialmente en los finales de línea. Esto se puede solucionar diciéndole al controlador de impresora que incluya las fuentes True Type como fuentes de Tipo 42 (la persona que me informó de este problema, por cierto, estaba usando el PPD de Distiller 4 y el controlador PostScript Adobe PS 4.3.1)
A veces los ficheros de Microsoft Word incluyen gráficos creados en Microsoft Excel. Esta hoja de cálculo ofrece a los usuarios varios grosores de trazo de línea. Uno de ellos es "fino" (hairline), que lo que hace es decirle al dispositivo de impresión que debe trazar la línea con un punto de impresión de anchura (lo que no es 1 punto de pica, por cierto). En una impresora de 300 ppp de resolución, esto es una línea muy fina. En una filmadora de 2.400 ppp es una rayita invisible. Hay en el mercado varias herramientas y extensiones que permiten cambiar el grosor de las líneas. Una es la ya mencionada Quite A Box Of Tricks , (Quite, para PDFs ya hechos). Otra es PitStop (de Enfocus Software).
En el menú "Herramientas - Opciones - Imprimir" existe una opción "Permitir alternar entra A4 y Carta" para redimensionar el documento en determinadas circunstancias. Esta opción se debe desactivar para que el documento no cambie al crear el PDF.
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
Hay unos cuantos formatos de ficheros informáticos cuyos resultados se acercan a los de PDF. Éstos son algunos de ellos, con sus diferencias y similitudes:
Adobe, la compañía que desarrollo PostScript, fue también quien desarrolló PDF. De hecho, PDF está basado en el lenguaje PostScript. PDF Usa el conjunto de intrucciones de PostScript de un modo diferente: Mientras que PostScript es realmente un lenguaje de programación que se puede usar para escribir un juego de ajedrez o un procesador de textos, PDF es de objetivos más limitados. Sólo describe la composición de un documento (usando operadores PostScript). En ese sentido, PDF recuerda más a una base de datos que a un lenguaje de programación.
Las principales ventajas de PDF frente a PostScript son:
Los ficheros PDF tienden a ser más reducidos debido a los eficaces algoritmos de compresión que se pueden usar.
Los ficheros PDF se pueden ver fácilmente con el lector Acrobat Reader u otras herramientas.
Los ficheros PDF se pueden modificar más fácilmente, siempre que se tengan las herramientas apropiadas.
Los ficheros PDF son má independientes de los dispositivos. Los ficheros PostScript suelen estar creados para dispositivos concretos y pueden generar errores PostScript si se envían a otros aparatos.
Los ficheros PDF pueden ser más versatiler que los ficheros PostScript: Pueden contener enlaces a otros ficheros y elementos multimedia.
PDF se suele comparar con HTML (el formato de datos más usual en la creación de páginas web). En principio HTML fue creado para describir la estructura de un documento y no tanto para elaborar su apariencia. El aspecto de una página web viene determinado por el navegador, no por el creador del documento. Con el incremento en la popularidad de la World Wide Web, el énfasis de las nuevas versiones de HTML pasó de más la estructura a la apariencia. En cierto modo, HTML se desplazó hacia los objetivos de PDF.
Al mismo tiempo, Adobe incluyó cada vez más funcionalidades web dentro de PDF (se hizo posible añadir enlaces de Internet dentro de un documento PDF). Al mismo tiempo, se puso a la disposición del público una extensión para los navegadores Netscape Navigator y Microsoft Internet Explorer para poder mostrar ficheros PDF. Acrobat 4 incorporó la capacidad de convertir un sitio web (o parte de él) en un documento PDF. Adobe añadió a PDF la capacidad de descarga incremental de bytes (byte streaming) para que no fuera necesario descargar todo un fichero PDF antes de poder ver su primera página en Internet.
En cierto modo, HTML y PDF se están conviertiendo en estándares en competencia. Ahora mismo, PDF es mucho más potente en lo que se refiere decribir la apariencia de documentos. HTML es más apropiado para accesos de Internet de baja capacidad. Sin embargo, es perfectamente factible usar ficheros PDF en sitios web y usar documentos HTML en un catálogo electrónico distribuido en CD-ROM.
XML (eXtensible Markup Language, "Lenguaje Extendido de Marcas"), es un formato que se puede usar para describir el contenido de un documento (similar a SGML, del que es un subconjunto). Ultimamente está en el centro de atención debido a que su gran flexibilidad permite una fácil integración con bases de datos y el intercambio de grandes masas de datos en Internet. En realidad, XML no compite con PDF. Mientras que XML describe el contenido de un documento, PDF describe su apariencia. No es fácil extraer el contenido de un fichero PDF (o al menos, no sin gran cantidad de trabajo manual) ya que las estructura de un documento se pierde cuando se transforma en fichero PDF.
Es muy interesante que PDF 1.3 incluya un mecanismo en forma de estructura en árbol que permite contener datos tipo XML. De este modo, es teóricamente posible que un fichero PDF contenga un resumen estructurado del contenido además de una representación exacta de su apariencia. Desgraciadamente, los programas necesarios para incluir datos XML en un fichero PDF (usando marcas PDF: pdfmarks) como, por ejemplo, una Xtension para Quark XPress, aun no existen. Si necesitas PDF y XML, de momento el único camino es crear dos ficheros separados a partir de un programa de diseño o de un sistema de plublicación de bases de datos.
Si quieres saber más sobre PDF y XML, hay un artículo muy interesante que Gordon Kent publicó en PlanetPDF.
Muchas personas confunden PDF (el formato de los datos) con Acrobat (el programa que la firma Adobe vende para generar, manipular y ver ficheros PDF). Esta confusión parece surgir del hecho de que casi todas las nuevas versiones de las especificaciones PDF van acompañadas de una nueva versión Acrobat. La versión 1.2 de las especificaciones PDF fueron acompañadas de Acrobat 3. Las especificaciones 1.3 de PDF, lo fueron de Acrobat 4.
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
En los dos ultimos años he estado usando Preps (de Scenisoft) sobre todo para trabajos de imposición de páginas. Aunque echo de menos el interfaz de usuario de PressWise [de Imation, adquirida por Scenicsoft en 1999], Preps ha resultado ser un programa bastante sólido que cuenta con un impresionante equipo de apoyo técnico.
En el momento de escribir estas páginas, Preps se encuentra en la fase beta de su versión 4.0. Scenicsoft ha informado de que esta versión podrá trabajar plenamente con el formato PDF. Afirma que será capaz de leer, analizar e imponer directamente ficheros PDF si necesidad de convertirlos primero a ficheros PostScript. He echado un vistazo a la fase beta de esta versión y veo que es cierto. Desgraciadamente no han alterado el interfaz de usuario de Preps, lo que deberían hacer tarde o temprano.
[Nota del traductor español: L. Leurs escribió estas líneas en 2000. Actualmente (verano de 2002), Preps se encuentra en su versión 4.1.2, que es una actualización para quienes tienen Preps 4.0. Preps tiene versiones en español, por cierto.].
Preps 3.7 contaba con capacidad de reconocer ficheros PDF de nivel 1.3 (los creados por Acrobat 4). Sin embargo, aun necesitab convertir los ficheros PDF a PostScript antes de leerlos. En el caso de ficheros PDF de color que era necesario separar, no se podía confiar en el algoritmo de separación de Preps. Era mejor recurrir a una separación en el RIP.
Aunque Preps 3.5 era teóricamente capaz de reconocer el formato PDF (procedente de Acrobat 3), lo tenía que hacer por medio de un atajo que se basaba en que nada más añadir un fichero PDF a la lista de trabajo, Preps arrancaba Acrobat Exchange y hacía que éste exportara en un segundo plano el PDF a un fichero PostScript. A continuación, Preps analizaba el fichero PostScript. Como el fichero PostScript era tan grande, al menos, como el fichero PDF, había que tenerlo en cuenta al considerar la capacidad de almacenamiento del sistema.
Las primeras versiones de Preps 3.5 tenían algunos problemas con este sistema de PDF a PostScript. Cuando se sustituía un fichero PDF por una versión más nueva, Preps no hacía caso de estas alteraciones y se empeñaba en mantener el primer fichero PostScript. Este fallo se corrigión en revisiones posteriores del programa.
En el caso de ficheros PDF de color que tuvieran que ser separados, no era fiable usar el algoritmo de separación de Preps, y era mejor usar una separación en el RIP.
Que Preps comenzara a poder trabajar con ficheros PDF a partir de la versión 3.5 no quiere decir que no se pudieran importar ficheros PDF en versiones anteriores. Lo unico que había que hacer era abrir Acrobat y exportar a un fichero PostScript. He hecho esto con ficheros procedentes de diversas fuentes y siempre resultó bien con Preps 3.1e (que fue la primera versión de Preps capaz de trabajar en condiciones con sistemas de separación en el RIP de dispositivos de Agfa).
Una advertencia: En el caso de ficheros PDF de color que tuvieran que ser separados, no era fiable usar el algoritmo de separación de Preps y era mejor usar una separación en el RIP. Por eso habia que configurar Preps para que enviase el fichero PostScript compuesto al RIP y dejar que éste hciera el trabajo duro. Para los RIPs de Agfa, esto quería decir que hacía falta la versión 3.1c de Preps, que era ya capaz de admitir deparaciones hechas en el RIP ejecutando PSE 11 o posterior.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Según algunas fuentes, la firma Quark, fabricante de Quark XPress (probablemente el programa de maquetación más popular de los que existen) pretendió que Adobe pagara por incluir soporte para PDF en la versión 4 de Quark XPress. Adobe se negó y Quark sacó el programa sin funcionalidades PDF. Con esta estrategia a Quark le salió el tiro por la culata cuando el formato PDF se convirtió en un gran éxito. Quark tuvo entonces que prometer la creación de una Xtension para tratar el formato PDF. Aunque tardó algún tiempo en estar preparada, al final salió como Xtension gratuita disponible en el sitio web de Quark. Una vez instalada, esta Xtension añade dos funcionalidades importantes a Quark XPress:
La capacidad de importar ficheros PDF dentro de una caja de imagen.
La capacidad de exportar y crear ficheros PDF desde Quark Xpress.
Sin embargo, aunque esto pueda parecer una gran cosa, lo cierto es que no hay que ser muy listo para percatarse de que la Xtension tiene sus fallos. Es lenta y no reconoce los colores directos que se hayan usado como tales en el PDF. Ambas limitaciones se pueden obviar, sin embargo, exportando el PDF a un fichero EPS compatible con el nivel PostScript 1 desde el mismo Acrobat y luego trayendo el fichero EPS a Quark XPress como una imagen normal. Hay que destacar que esta "técnica" puede dar origen a ficheros EPS verdaderamente grandes, ya que las imágenes se descomprimen.
Otra desventaja de la Xtension se revela cuando se colocan ficheros PDF multipágina y después, por lo que sea, se actualizan. Quark XPress rebobina hasta la primera página de cada fichero PDF aquellos PDFs que estuvieran colocados dentro de cajas de imagen haciendo referencia a páginas distintas de la primera del PDF
En conjunto, la importación de ficheros PDF parece funcionar bien cuando se trata colocar sólo cosas como anuncios o pequeños ficheros PDF de una sóla página y de imprimir esto sólo en dispositivos de color compuesto (sin hacer separaciones).
Además, la idea de que se preparan y exportan ficheros PDF directamente desde Quark XPress no es del todo cierta. La Xtension meramente actua como una especie de controlador para Acrobat Distiller. Como ocurría en el caso de Quark XPress 3.x, perfiero imprimir a un fichero PostScript y después usar Acrobat Distiller o cualquier herramienta similar para convertir el fichero PostScript a PDF.
Una cuestión importante que no hay que perder de vista es que los ficheros PDF son ficheros compuestos (composite), es decir que cada página lleva consigo la necesaria información de Cian, Magenta, Amarillo y Negro. No va cada color en una página separada. La limitación al respecto de Quark XPress nace de que sus ficheros PostScript compuestos no contienen toda la información necesaria sobre trapping. Las sobreimpresiones y calados se conservan, pero los reventados (chokes y spreads), se pierden. Este es un buen problema si no se dispone de un RIP o de alguna aplicación aparte capaces de encargarse del trapping. Además, aunque los valores de sobreimpresión de Quark XPress se pueden conservar en un PDF, esto no siempre ocurre.
Los gradientes y degradados creados con colores directos no se conservan muy bien, incluso aun cuando se haya configurado Acrobat para que respete los colores directos en el fichero PDF. Los colores directos se convierten a CMYK.
Otro problema está en las sangres de los documentos. En teoría el tamaño del PDF resultante es totalmente fiel al tamaño de la página del documento de Quark XPress (es decir, un A4 de Quark XPress es un A4 en Acrobat). Pero, por desgracia, Quark XPress no incluye sangrías al crear un PDF mediante la impresión a un archivo PostScript y posterior tratamiento con Acrobat Distiller (lee esto si quieres saber más).
Si se usan ficheros DCS dentro de un documento de Quark XPress, este programa sólo incluye las previsualizaciones de baja resolución al imprimir ficheros compuestos. La consecuencia es que los ficheros PDF resultantes sólo incluirán las imágenes de baja resolución.
las líneas de puntos de Quark XPress dan a veces problemas al crear ficheros PDF. Si la longitud de un filete no es completamente divisible por la cantidad de puntos (con la opción "Estirar hasta las esquinas" desactivada), a veces aparece una especie de punto perdido suelto al final de la línea.
Y un último problema. Puede darse el caso de que haya pequeñas diferencias entre los tamaños de la página definida en Quark XPress y la del PDF correspondiente (lo usual son diferencias de unos 0,3 mm). Esto se debe a que Quark XPress sólo usa números enteros (integers) al describir el tamaño de sus páginas en un fichero PostScript.
Hay un par de cosas que se pueden hacer para afrontar algunos de los problemas descritos y complicarse al mínimo la vida cuando se tienen que generar muchos ficheros PDF con Quark XPress.
En primer lugar, existen varias aplicaciones comerciales que solucionan esos problemas. Apogee Create (Agfa) puede tratar los problemas de valores de sobreimpresión, gradientes, ficheros DCS y establecer las sangres de los documentos. En cierto modom se lo puede cnsiderar una versión de alto nivel de Acrobat Distiller.
La Xtension SmartXT, (Total Integration) sirve para volver a fusionar los datos DCS al imprimir a un fichero compuesto. En el sitio wev de Creo Prinergy se pueden obtener algunas extensiones gratuitas para Acrobat que sirven para resolver los problemas de sangres y gradientes.
La Xtension DCSMerger (Impressed) es útil para guardar ficheros DCS como ficheros de color compuesto para que se puedan usar en un sistema de trabajo basado en ficheros de color compuesto
Posiblemente existan en el mercado muchos productos de trapping que son capaces de volver a aplicar éste a un fichero en el caso de que Quark XPress se haya "olvidado" de añadir valores sensatos de trapping a sus ficheros compuestos. Estos productos están disponibles como programas con entidad propia (como es el caso de Trapwise, de Scenicsoft), como extensiones de Acrobat (por ejemplo, Supertrap de Heidelberg), o como módulos de un RIP (ese es el caso, por ejemplo, de la capacidad de separaciones en el RIP para los RIPs de Adobe o Harlequin, de Global Graphics).
Por L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
Nunca he usado Tex y no lo conozco salvo por saber que es un lenguaje-programa de composición especialmente adecuado para materiales científicos con muchas fórmulas. Fue desarrollado hace ya varios años por el profesor Donald Knuth y es aún muy popular en el mundo universitario.
El único motivo de haber incluido aquí esta página sobre Tex es proporcionar un enlace a Y&Y, que tienen disponible un PDF [en inglés] sobre la creación de ficheros PDF desde Tex.
[Nota del traductor español: También se puede consultar Este documento PDF de D.P. Story, de la Universidad de Akron (Ohio, EEUU).]
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
El texto en un fichero PDF puede ir comprimido o sin comprimir. El algoritmo de compresión usado es LZW. Si el texto se hubiera comprimido, ya no será legible a simple vista si se abre con un editor de texto.
El algoritmo LZW funciona reemplazando los datos más frecuentes por un sólo carácter. Suele dar una tasa de compresión de 2:1.
En los ficheros PDF el texto se distribuye línea a línea. Esto significa que un PDF no tiene "conciencia" de cómo fluía el texto en el documento original. Si usas Adobe Acrobat para hacer una pequeña corrección, las palabras no refluirán a la línea inferior si hiciera falta. Sin intentas seleccionar dos líneas en dos columnas adyacentes, verás que puedes seleccionar a lo largo de ambas columnas.
Afortunadamente, si copias y pegas las dos columnas en un documento de texto, verás que se pega en orden adecuado, una columna detrás de otra.
[Nota del traductor: Existen plug-ins para versiones de Acrobat anteriores a la versión 5 que permiten extraer el texto de los documentos. A partir de la versión 5, Acrobat mismo es capaz de guardar el texto de los documentos no bloqueados.]
En el formato PDF se pueden usar fuentes PostScript (tipo 1 y tipo 3) y fuentes True Type. Estas fuentes se incluyen preferentemente en los ficheros PDF para que se puedan ver e imprimir tal cómo fueron hechos por sus creadores. Si faltan algunas fuentes, Acrobat (ya sea su versión completa o Acrobat Reader) intentará emularlas usando alguna de las fuentes Multiple Master que llevan incluidas. De este modo, el documento no se representará tan exactamente como su creador quiso, pero, al menos, el texto no refluirá.
Las fuentes Multiple Master (MM) que Adobe Acrobat usa son:
Adobe Serif MM.
Adobe Sans MM.
Acrobat (ya sea su versión completa o Acrobat Reader) ofrecen una opción
de información sobre las fuentes es su menú "Archivo
- Datos del documento - Fuentes". En este apartado se listan sólamente
aquellas fuentes usadas en la página activa en ese momento. No debes usarlo
como una fuente de información sobre todas las fuentes usadas en un fichero
PDF. Para obtener una lista completa de todas las fuentes usadas en un
fichero PDF debes usar una extensión del tipo de PitStop
(de Enfocus).
Acrobat Distiller ofrece la opción de añadir automáticamente las fuentes
perdidas a los ficheros PostScript que tiene que procesar. En el menú
de "Configuración - Ubicación de fuentes",
el usuario puede definir varias carpetas para que Acrobat Distiller busque
y sepa dónde localizar las fuentes que falten en el fichero PostScript.
Para los usuarios de Macintosh: EL programa sólo necesita las fuentes
de impresora, no las de pantalla.
Hay algunas diferencias fundamentales entre Acrobat 3.x y Acrobat 4.x en la forma de gestionar las fuentes.
Hay 14 fuentes que Acrobat Distiller 3.x nunca incrusta en un fichero PDF. Son:
Courier, Courier-Bold, Courier-Oblique, Courier-BoldOblique.
Times-Roman , Times-Bold , Times-Italic, Times-BoldItalic.
Helvetica, Helvetica-Bold, Helvetica-Oblique, Helvetica-BoldOblique.
Symbol.
Estas fuentes (ZapfDingbats excluida) son las llamadas 13 fuentes básicas.
Adobe Acrobat 4.x no tiene problemas en incrustar esas 14 fuentes. Pero sí tiene otra restricción: Si las normas de licencia (licensing policy) de una fuente True Type impiden que la fuente de incruste en un fichero, Adobe Acrobat 4.x respetará esta restricción y no incrustará la fuente. Lee esto si quieres saber más sobre este problema.
También es posible incluir sólo aquellos carácteres de una fuente que
se usen en una publicación. Esta técnica se llama "incrustar
subjuegos de fuentes". Al usar la opción "Configuración
- Opciones de trabajo - Fuentes - Incrustar subjuegos de fuentes por debajo
de XXX %" de Acrobat Distiller, el usuario puede decidir cuántos
carácteres deben haberse usado en una publicación para que se incruste
una porción de esa fuente.
incrustar subjuegos tiene dos ventajas:
El tamaño del fichero PDF final se reduce y esto puede ser muy útil si el tamaño de un PDF es verdaderamente crucial, como es el caso de PDFs que deban situarse en la Red.
Un RIP usará siempre una fuente incrustada como subjuego incluso aunque disponga por sí mismo de la fuente completa. Esta es una manera de evitar recolocaciones extrañas de textos debido a difererencias menores entre veersionesde una misma fuente.
Sin embargo, incrustar subjuegos también tiene dos desventajas:
Si el usuario opta por editar algo de texto en Adobe Acrobat y un carácter que se necesite no ha sido incrustado en el subjuego, no podrá usarse.
Fusionar dos ficheros PDF que contienen subjuegos diferentes de una misma fuente puede hacer que desaparezcan carácteres necesarios.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Los ficheros PDF son muho menores que sus equivalentes PostScript. Aunque esto se consigue en parte gracias a una mejor estructura de los ficheros, la razón principal se debe a los algoritmos de compresión extremadamente eficaces que admiten los PDFs.
Todos los textos y todas las órdenes PostScript que forman parte de un PDF se pueden comprimir usando el algoritmo LZW (Lempel-Ziv-Welch). Esta compresion por si sola ya puede dejar el tamaño de un fichero PDF en la mitad del tamaño de su equivalente PostScript.
Si la comresión está activada en el Acrobat Distiller, lo primero que hará este programa es descomprimir todas las imágenes que se hallen dentro del fichero PostScript y luego las volvera a comprimir al crear el fichero PDF. En el caso de las imágenes, existen varios algoritmos de compresión admisibles: JPEG, Zip, CCITT, RLE y "hinchar/deshinchar" (flate).
Para comprobar qué tipo de compresión se ha utilizado, basta con abrir el fichero PDF en un simple editor de texto que admita datos binarios (el Bloc de Notas, etc...) y buscar allí la cadena "/Filter".
La compresión JPEG se usa para imágenes de cuatricromía y escala de grises. Es un algoritmo de compresión que puede ser "con pérdidas" (lossy) y "sin pérdidas" (non-lossy). Sin embargo, en Adobe Acrobat sólo está disponible el modelo "con pérdidas". Esto quiere decir que algunos detalles de la imagen se pierden o deterioran cada vez que se la comprime. Cuanto mayor es la tasa de compresión, mayor es el deterioro de las imágenes. Si quieres saber más sobre el algoritmo de compresión JPEG, puedes leer esto [y también esto otro, en inglés].
Acrobat Distiller 3.x ofrecía cinco niveles de compresión JPEG:
Baja: Propociona una pérdida de calidad que es generalmente aceptable salvo en el caso de los trabajos más exigentes. La tasa media de compresión es de 1:2.
Baja - media
Media: Proporciona una tasa de calidad para trabajos de tipo medio. La tasa media de compresión es de 1:5.
Alta - media
Alta: not acceptable for prepress any more. Average compression ratio: 1/10
Acrobat Distiller 4 tenía disponibles ajustes muy similares, pero no se correspondían exactamente con los de Acrobat 3. En Acrobat Distiller 4.0 había además un fallo de programación que afectaba al algoritmo JPEG. Este fallo se arregló con la actualización a 4.05. Las opciones son:
Mínima.
Baja.
Media.
Alta.
Máxima.
Las imágenes que se han comprimido usando el algoritmo JPEG no deben recomprimirse, ya que esto causará una pérdida acumulativa de calidad. Si se destila un fichero que contiene imágenes comprimidas como JPEGs, Acrobat Distiller las descomprimirá y volverá a comprimir (dependiendo de los parámetros que se hayan establecido). Esto dará lugar a la mencionada pérdida de calidad.
La extensión para Adobe Acrobat Quite A Box Of Tricks (de Quite Software) permite algoritmos de compresión JPEG más potentes que los del propio Acrobat. Además permite la recompresión de ficheros PDF.
El algoritmo de compresión Zip es el que usan utilidades para PC muy populares como WinZip, PKZip, Stuffit y similares. su uso no quiere decir que Acrobat sea capaz de crear un fichero Zip, sino que usará el algoritmo para comprimir imágenes de color o escala de grises.
La compresión Zip es un poco más "inteligente" que la realizada por el algoritmo LZW. Lo que hace es escanear un fichero para detectar secuencias repetidas y entonces reemplaza éstas por una marca. Un ejemplo sería comprimir todo la web del Rincón del PDF y sustituir la palabra "fichero" (de gran frecuencia) por una simple marca. Una sucesión de sustituciones permite un gran ahorro de bytes.
Zip es un algoritmo de compresión "sin pérdidas". Esto quiere decir que las imágenes no se degradarán al comprimirlas. En Adobe Acrobat 4 es realmente así, pero en Acrobat 3 existe la opción de usar una compresión de 4 bits y otra de 8 bits. El problema es que con la de 4 bits, Acrobat reducirá primero el número de tonos por canal de 256 a sólo 16 y, posteriormente, realizará la compresión "sin pérdidas". El resultado es una tasa de compresión excelente y una degradación de la calidad extrema. Por consiguiente, la compresión Zip de 4 bits se debe evitar siempre a no ser que las características (color, contenido, etc...) de los ficheros se presten a ello. La compresión zip con 8 bits carece absolutamente de pérdidas.
La compresión CCITT se puede usar con imágenes de línea (en Photoshop: Mapa de bits). Es el mismo algoritmo de compresión que utilizan los faxes. Es una compresión "sin pérdidas", por lo que las imágenes no sufren degradación alguna.
Adobe Acrobat ofrece la posibilidad de elegir entre Grupo 3 de CCITT y Grupo 4 de CCITT. La mayoría de las opiniones están de acuerdo en que la segunda es mejor. Se puede dejar activada por omisión.
El algoritmo RLE (Run Length Encoding) es un sistema de compresión "sin pérdidas", por lo que no afectará a la calidad de las imágenes. El algoritmo RLE es probablemente el más simple que existe. en vez de escribir un fichero que vaya diciendo: "Pixel blanco, pixel negro, pixel negro, ...." Va diciendo algo así como: "129 píxeles negros, dos píxeles blancos, ..."
En Acrobat, la compresión RLE se puede usar para imágenes de línea (en Photoshop: Mapa de bits). La mayoría de los usuarios prefieren la compresión CCITT porque es más eficaz.
El algoritmo de "hinchar/deshinchar" (flate, a veces también llamada deflate) es un sistema de compresión bastante complejo que he tratado con más profundidad en otra página.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Los ficheros PDF pueden contener imágenes, por supuesto. Éstas pueden ser:
Imágenes de línea (blanco y negro, sin grises). Hay que tener cuidado, ya que Acrobat Exchange 3.x puede tener algunos problemas al mostrar esas imágenes. Si esas imágenes se han coloreado dentro de un programa profesional como Quark XPress (por ejemplo, dándole color a un logotipo), pudiera ser que Acrobat Distiller 3.x o 4.x tuvieran algunos problemas con ellas.
Imágenes de escala de gris: Del mismo modo que en el caso anterior, si las imágenes se han coloreado en programas como Quark XPress, pudiera ser que Acrobat Distiller 3.x o 4.x tuvieran algunos problemas con ellas.
Imágenes multitono (duotonos, tritonos, cuadritonos, hexacromías, etc…): No son posibles en ficheros PDF 1.2 (creados con Acrobat 3.x). La especificación PF 1.3 proporciona soporte para un nuevo espacio de color llamado DeviceN que está especialmente ideado para este tipo de imágenes. Para saber más sobre este tema, echa un vistazo a la sección sobre DeviceN que hay más abajo.
Imágenes RGB: Estas son imágenes que soportan unos 16 millones de tonos de color, aquneu también es posible incrustar imágenes que sólo admiten unos pocos tonos (hasta 256, llamadas de color indexado).
Imágenes CMYK.
Como puesdes ver, casi cualquier cosa de las que son posibles en los programas profesionales se puede mantener en un fichero PDF. Algunas veces, la creación de un fichero PostScript y la subsiguiente transformación en un fichero PDF cambia el contenido de las imágenes. Entre los problemas más usuales están la alteración de imágenes CMYK a RGB y la transformación de imágenes en color a blanco y negro.
En la mayoría de los casos, las imágenes que van en los ficheros PDF se comprimen para limitar el tamaño de éstos. Lee esto si quieres saber más sobre los algoritmos de impresión utilizados en los ficheros PDF.
Algunas veces, un fichero PDF contiene referencias OPI a las imágenes aunque en la cadena de trabajo en cuestión no se use OPI. Esta peculiaridad no es una "característica" del formato PDF, sino que es más bien una consecuencia de la manera en la que algunas aplicaciones profesionales como Quark XPress o Adobe PageMaker trabajan con las imágenes. Puedes saber más sobre el tema leyendo esto.
Si usas una herramienta como PitStop para comprobar los elementos que hay dentro de un fichero PDF, verás que a veces las imágenes van incrustadas como objetos llamados 'Forms XObject'. En el interior de los ficheros PDF, los Forms XObjects son el equivalente lógico de los ficheros EPS, es decir, cualquier combinación de texto, información vectorial o imágenes de mapa de bits. Puede haber Forms XObjects dentro de otros Forms XObjects, etc… Aunque no es imprescindible, parece que Acrobat Distiller forma Forms XObjects allí donde ecuentra OPI, incluso aunque se trate de una sola imagen que podría representarse de forma más simple con un 'Image Xobject'.
Si no trabajas con un sistema basado en OPI, puedes desactivar la opción "Opciones de trabajo - Avanzadas - Convenciones de estructura de documentos - Conservar comentarios OPI" y eliminar así la aparición de muchos Forms XObjects. A veces las herramientas PDF no son capaces de manipular los Forms XObjects y algunos otros arcanos estructurales del PDF. Por eso es una buena idea intentar evitar su uso.
En la especificación PDF 1.2 (Adobe Acrobat 3), no había manera de incrustar multitonos (duotonos, tritonos, cuadritonos, etc…) de forma correcta. Algunas compañías compusieron apaños basados en hacer que las imágenes se sobreimprimieran. Aunque este era un procedimiento que conseguía filmaciones correctas, las imágenes no se podían ver en pantalla.
En la especificación PDF 1.3 (Adobe Acrobat 4), se proporcionó un nuevo espacio de color llamado DeviceN que está especialmente ideado para ese tipo de imágenes. DeviceN se puede usar además para otros objetos como degradados con colores directos (spot colours). La principal desventaja de este DeviceN es que sólo se puede separar de forma adecuada en un RIP de nivel PostScript 3.
La gestión del color con los PDFs es algo que he conseguido ignorar con
éxito hasta ahora. Por eso, me temo que tardaré en tener información al
respecto ![]()
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Un gradiente o degradado (blend) es una transición gradual entre un tono o color y otro. A veces también se les llama "transiciones".
Para crear esos gradientes se pueden usar muchos programas y hay muchas maneras en las que se los puede realizar. Para mayor claridad, hay que distinguir entre las técnicas que se usaban antes de la llegadas del PostScript 3 y Adobe Acrobat 4, y aquellas que se han comenzado a usar después.
Antes de la llegada del nivel PostScript 3 y de Adobe Acrobat 4, un PDF contenía un gradiente de forma similar a cómo el program de origen hubiera codificado ese gradiente en el fichero de impresión PostScript.
La mayoría de las aplicaciones codifican un gradiente en PostScript creando una multitud de objetos (líneas, rectángulos o elipses en el caso de un gradiente circular) que se van desplazando levemente o cambian de tamaño y cuyo color varía también de poco en poco. En la pantalla y al imprimir se ve un degradado, pero lo que puede haber ahí son 256 cajas que se superponen y varían ligeramente de color.
Algunos programas, como por ejemplo Microsoft PowerPoint, crean el código necesario de forma muy ineficaz, y Acrobat Distiller o Acrobat PDF-Writer incluyen ese algoritmo ineficaz en el PDF resultante. Para ver lo que quiero decir, lee esto.
Todo esto cambió cuando "smooth shading" y "idiom recognition" se incorporaron a los productos de Adobe.
"Smooth shading" es una técnica que Adobe incorporó a PostScript 3 y a PDF 1.3. Es una forma muy compacta y rápida de definir degradados y transiciones. El resultado se ve y se imprime estupendamente, incluso con resoluciones muy bajas o con lineaturas muy elevadas.
Desgraciadamente en el mercado hay muchos programas que no son capaces de usar "smooth shading" por sí mismos, ya sea porque sus programadores no se han tomado el esfuerzo de ponerlo en práctica o porque deseaban conservar la compatibilidad con RIPs que no fueran de nivel PostScript 3.
Esta situación explica porqué Adobe decidió incorporar un mecanismo llamado "idiom recognition" a PostScript 3. Éste es un algoritmo que explora un fichero PostScript y, si encuentra un degradado creado por una de las aplicaciones de preimpresión más conocidas (Quark XPress, Adobe Illustrator o Macromedia Freehand), lo reemplaza por una versión realizada mediante el superior sistema PotScript 3 de "smooth shadings".
Compañías como Scitex ya llevaban años usando una técnica similar en la tecnología propia que aplicaban a sus RIPs.
Acrobat 3 no realiza ese "idiom recognition". Lo que es peor, "idiom recognition" no funciona cuando un RIP intenta procesar ficheros PDF creados con Acrobat 3. Lee esto si quieres saber más sobre esta limitación.
En Acrobat 4 y Distiller 4, Adobe incorporó el mismo "idiom recognition"
que usaba en sus RIPs. Esta característica se puede desactivar si se considera
necesario. En la ayuda de Acrobat 4 hay un fichero llamado Distparm.pdf
donde se describe cómo hacerlo.
Acrobat 5 incorpora el mismo algoritmo que la versión 4, pero ahora se
puede activar o desactivar en el menú "Configuración
- Opciones de trabajo - Avanzadas" de Acrobat Distiller. La opción
es "Convertir gradientes en transiciones suaves".
Los gradientes deberían verse bien en pantalla. Si no es ese el caso, lo usual es que se deba a los parámetros del propio monitor. Si la tarjeta gráfica está fijada a 256 colores o (en el caso de los PCs) al llamado color de 16 bits (unos 65.000 colores), la tarjeta de vídeo no podrá representar los degradados de forma adecuada.
Cuando se imprime desde Adobe Acrobat o Acrobat Reader un documento que contiene "smooth shadings", los gradientes se imprimirán según sea el tipo del dispositivo de impresión:
En impresoras de nivel PostScript 3, Adobe Acrobat se limita a enviar el código de "smooth shading", por loq ue la calidad y rapidez de impresión son óptimas.
En dispositivos más viejso, que no son PostScript 3 o que no son PostScript en absoluto, Acrobat convierte los degradados en imágenes de mapa de bits con la resolución óptima para el dispositivo de salida. De este modo, lo impreso es también lo mejor conforme al dispositivo, pero la rapidez de impresión es mucho menor.
L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)
Desde la revisión PDF 1.2 (Acrobat 3), el formato PDF soporta OPI (Open Prepress Interface). sto significa que se pueden crear PDFs que contengan comentarios OPI en lugar de (o además de) imágenes de alta resolución. A los ficheros PDF que contienen imágenes OPI se les suele llamar "ficheros PDF 'delgados' (thin)". Los PDFs que sólo contienen imágenes de alta resolución se suelen llamar "ficheros PDF 'gruesos' o 'gordos' (fat)".
La especificación PDF 1.2 sólo soportaba comentarios OPI 1.3. Esto hacía que esos ficheros fueran incompatibles con versiones anteriores de Color Check. Lee esto si quieres saber más sobre el tema.
La especificación PDF 1.3 (Acrobat 4) soporta comentarios OPI 1.3 y 2.0. Esto debería bastar para que los ficheros PDF resultantes sean compatibles con cualquier sistema OPI disponible en el mercado.
Hasta donde yo sé, aun no hay en el mercado sistemas OPI que den verdadero soporte al formato PDF. Es decir, que sean capaces de tomar un PDF de una carpeta monitorizada, reemplazar las imágenes marcadas por todas las referencias OPI de ese fichero y escribir a continuación un PDF "grueso" en una carpeta de salida. Los sistemas OPI disponibles en la actualidad sólo son capaces de realizar ese remplazo dentro de ficheros PostScritpt.
Si se da el caso de recibir un fichero PDF que contenga comentarios OPI y se adjunten las imágenes de alta resolución, es bueno que sepas que existe en el mercado una extensión llamada OPI-Doctor (de Lantana), que permite volver a enlazar las imágenes dentro del PDF [Nota del traductor español: Esta extensión parece haber sido sustituida por otra del mismo fabricante llamada PDF ImageWorks].
He tenido numerosas discusiones con algunas personas sobre las ventajas y desventajas de usar PDFs "delgados". La única ventaja que tienen es el tamaño del fichero PDF: Esos PDFs "delgados" pueden llegar a ser muy pequeños y su proceso es extremadamente rápido.
Sin embargo, la lista de desventajas del uso de OPI con PDF es larga:
Una de las desventajas de PDF es que los ficheros se pueden comprobar visualmente usando Adobe Acrobat o simplemente Acrobat Reader. Sin embargo, cuando se usa un sistema de trabajo OPI basado en "omitir imágenes", cualquier PDF que se abrá sólo contendrá los comentarios OPI y no será posible verlo correctamente.
Los ficheros PDF pueden ser por si mismos muy pequeños debido a los algoritmos de compresión tan buenos que usan. Por eso, usar OPI para limitar el tamaño de los PDFs no es realmente tan necesario.
El uso de programas de comprobación previa (preflight) y de herramientas para edición de PDFs suele ser imposible con los PDFs "delgados" debido a que no contienen los datos finales.
Hay quien usa Acrobat Distiller como herramienta para eliminar posibles errores PostScript en la cadena de producción. La ventaja de trabajar así desaparece cuando un sistema OPI es capaz de insertar imágenes corruptas y código PostScript incorrecto después de que un fichero PDF se haya procesado para "limpiarlo".
Todos esos argumentos revelan que el uso de PDFs "delgados" no siempre es una buena idea. En muchos casos, tiene más sentido seguir usando OPI para que este sistema genere PDFs "gruesos" y que estos sean los que se proceen dentro de la cadena de trabajo.
Algunos programas, como Quark XPress (incluida sus versiones 4.x), tienden a añadir comentarios OPI a sus datos PostScript incluso aunque no se use un sistema OPI. Esto es especialmente cierto en el caso de las imágenes TIFF colocadas en un documento.
Porque estos programas hacen esto es algo que se me escapa completamente. Lo que ocurre con esta conducta es que tiene un efecto secundario muy perjudicial. Algunas apliaciones de comprobación de preimpresión como PitStop dan por inútil comprobar imágenes que contienen comentarios OPI. La consecuencia de esto es que no comprueban esos ficheros TIFF incluso en el caso de que las imágenes de alta resolución estén disponibles.
La forma de evitar este problema es desactivar siempre que no se
use OPI la opción "Conservar comentarios OPI"
existente en Acrobat Distiller. de ese modo, los comentarios OPI se borran
al crear los PDFs y las herramientas de post proceso no se lian con comentarios
OPI irrelevantes.
Por Gustavo Sánchez, invierno de 2003
En el formato PDF se han definido cinco elementos que van expresados como claves (keys) para describir la geometría de un documento en cada página. Sólo uno de ellos, el que describe el tamaño de la página (MediaBox) es imprescindible en el estandar PDF. Los demás son opcionales (aunque en subestándares como el PDF/X sean necesarios).
Todos ellos van expresados en la medida establecida por omisión para el usuario. Ninguno de ellos tiene bordes visibles, aunque en estos esquemas se han indicado con líneas continuas o discontinuas para mayor claridad.
Una matriz de cuatro números que indica la zona máxima de la página, incluido cualquier espacio en blanco que se haya dejado más allá de los cortes, sangres, marcas de registro o barras de color y demás. En cristiano: la casilla de material (MediaBox) indica el tamaño de lá hoja de papel en la que está situado el documento, no de la página final cuando se acabe el trabajo impreso.
Como se supone que no hay contenido más allá, este valor se puede alterar sin cambiar el significado del PDF.
En el formato PDF es un dato imprescindible (y puede ser heredado entre elementos).
Matriz de cuatro números que indica la zona rectangular de la página donde van los elementos que deben reproducirse o imprimirse. Esta casilla de recorte (crop box), no debe ser mayor que la casilla de material (MediaBox) y, si fuera así, la casilla de recorte (CropBox), real será la intersección de la casilla de recorte y la casilla de material (MediaBox).
Como es un elemento opcional (y heredable), si no estuviera explícita, la casilla de recorte es igual a la casilla de material. Si existen marcas de imprenta (corte, registro, barras de control del color y similares), es en esta zona donde deben situarse.
Esta otra matriz de cuatro números expresa la página de un trabajo impreso antes de que haya sido cortado o guillotinado. En ese sentido, indica la página impresa acabada antes de ser cortada por la guillotina (el valor que expresa la misma página ya guillotinada es la casilla de límite de página (TrimBox)).
En el formato pdf es un dato opcional (y puede ser heredado entre elementos). Si no está explícito, se asume que el valor es el de la casilla de recorte (CropBox), y si ésta no estuviera, se asume entonces que el valor de la casilla de sangrado es igual al de la página total (MediaBox). En los estándares PDF/X BleedBox es opcional pero extremadamente recomendado. En algunos casos (PDF/X plus) es usual considerar obligatoria la presencia de BleedBox.
La casilla de sangrado no puede ser nunca mayor que la casilla de material.
Esta otra matriz de cuatro números expresa la página de un trabajo impreso después de que haya sido cortado o guillotinado. En ese sentido, indica la página impresa acabada ya cortada por la guillotina. El valor que representa la misma página antes de ser guillotinada es la casilla de sangrado (BleedBox).
la casilla de límite de página sólo se debe usar si el fichero pdf expresa páginas completas. Si fuera sólo un elemento para colocar en otras páginas (un módulo de publicidad, por ejemplo), se debería usar la casilla de ilustración (ArtBox). En los estándares PDF/X, es obligatorio incluir TrimBox o ArtBox, pero nunca se pueden incluir ambas. En el formato PDF es un dato opcional (y puede ser heredado entre elementos).
Con la inclusión de esta casilla, se pretende es posibilitar la imposición "a ciegas" de las páginas, ya que el programa de imposición "sabrá" con ella cómo debe colocar las páginas en el pliego.
Es una matriz de cuatro números que indica qué parte del fichero se debe usar si el pdf se coloca dentro de un documento en un programa de maquetación o diseño gráfico. La casilla de ilustraciones sólo se debe usar si el fichero pdf expresa sólo un elemento para colocar en otras páginas (un módulo de publicidad, por ejemplo), es decir: no es una página completa.
En los estándares PDF/X, es obligatorio incluir TrimBox o ArtBox, pero nunca se pueden incluir ambas. En el formato PDF es un dato opcional (y puede ser heredado entre elementos). Si no se haya presente, se toma como valor el de CropBox.la firma de artes gráficas creo dispone de un plug-in gratuito para Acrobat llamado "Prinergy Geometry Editor" (como parte del sistema de trabajo Prinergy) con el que se pueden editar visualmente estos cinco valores (sólo hasta la versión 5 de Acrobat). En la actualidad hay otras muchas herramientas que permiten modificarlos.
L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)
Hay unos acrónimos que aparecen con regularidad cuando se habla del Portable Document Format (PDF). Son: PDF/X (o PDF/X1), PJTF y JDF. Sobre PDF/X y PDF/X1, hay varias páginas aparte. Lo que vienen a continuación es un breve vistazo a PJTF y JDF:
PJTF son las siglas de Portable Job Ticket Format. Lo mismo que en el caso de PDF, en un estándar definido por Adobe. Esta firma vendió el derecho de uso y el software necesario a algunos fabricantes de soluciones informáticas. Entre los programas que usan PJTF están Apogee (de Agfa) y Prinergy (de CreoScitex/Heidelberg).
En PJTF se definen las distintas variables de producción de un trabajo formado por uno o más ficheros PDF. Los datos PJTF se pueden almacenar en un fichero aparte que incluye enlaces a los ficheros PDF asociados. Los datos PJTF se pueden almacenar también en un fichero PDF.
Las ambiciones de PJTF son muy limitadas. Sólo define datos relacionados con la preimpresión. No se usa durante la cración de un trabajo ni después de la filmación de fotolitos o planchas. Adobe, Agfa, Man-Roland y Heidelberg están trabajando actualmente en la siguiente generación de PJTF, que se llamará JDF.
Como acabas de leer, el sucesor de PJTF es JDF (Job Definition Ticket). Encontrarás más sobre esta especificación en el sitio web. de CIP4.