Comportamiento del PDF con diversos programas

Esta sección pretende ser una recopilación de páginas sobre cómo se comportan distintos programas con respecto al formato PDF. Aunque no está muy al día, puede seguir mereciendo la pena.

AutoCAD y el formato PDF

L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)

Si quieres crear un PDF desde Autocad (de Autodesk), hay varias formas de hacerlo:

  1. Crea un archivo PostScript y usa Adobe Acrobat Distiller o una herramienta similar para crear el fichero PDF. La opción de crear ficheros PostScript desde el mismo Autocad está disponible, pero no me preguntes dónde (no dispongo del dinero suficiente para trastear con programa tan caro).

  2. Consigue una herramienta de conversión llamada OttoPDF (de Myndkryme) que sirve para convertir ficheros en formato DWG de Autocad a ficheros PDF. Lo bueno de esta utilidad es que además de funcionar estupendamente es gratuita. [Nota en junio de 2003. El sitio web parece haber quedado un poco parado]

  3. Además, hay en el mercado varias herramientas que pueden convertir ficheros e Autocad en ficheros de Adobe Illustrator o pasarlos a formato PICT (que Macromedia Freehand puede leer). De hecho, Adobe Illustrator y CorelDraw pueden leer directamente ficheros de formato DXF. Así es posible usar ambas aplicaciones para después exportar los ficheros a formato PDF. El problem es que a veces el grosor de las líneas originales se ve afectado por el proceso de conversión.

  4. Si tienes Adobe Acrobat o sólo PDF-Writer, puedes ir al sitio web de FastCad y conseguir allí el visor gratuito CADView/7 para ver archivos DWG y DXF. Una vez conseguido, basta abrir los archivos e imprimirlos con PDF-Writer.

Si tienes más información sobre Autocad y el formato PDF o conoces algún sitio web sobre el tema que sea interesante, por favor, envía un e-mail a mí o a mi traductor.

Microsoft Word y el formato PDF

L. Leurs, 2002
(traducción: Gustavo Sánchez Muñoz)

Muchas personas usan el formato PDF como una forma de imprimir profesionalmente documentos de Microsoft Office. Aunque esta es una idea bastante buena, hay que tener en cuenta algunas limitaciones de Microsoft Word.

La primera es que el uso de PDF-Writer es casi siempre una mala idea, al menos en lo que se refiere a impresión profesional. Lo recomendado es siempre imprimir a un fichero PostScript y después usar Acrobat Distiller o alguna herramienta similar para crear un PDF.

Si se instala Adobe Acrobat en un sistema que ya tenga instalada la suite Microsoft Office, se añaden macros a Word, Excel y Power Point que sirven para automatizar la creación de ficheros PDF. Siempre que se seleccione en estos programas la opción "exportar a PDF", la aplicación procederá a crear el fichero PostScript y después arrancará Distiller para convertir automáticamente ese código a PDF, lo que es algo bastante práctico.

Problemas de Word con los PDFs

Estos son algunos de los problemas que existen. Buena parte de la información que aquí se explica fue amablemente proporcionada por Dov Isaacs (Adobe) y Jacob Schäffer (Grafikhuset).

  1. Como la mayoría de las aplicaciones de Microsoft Office, Word se basa en el modelo gráfico del sistema sobre el que se esté ejecutando: GDI en Windows y QuickDraw en Macintosh. Al imprimir a un archivo PostScript, Word usa un controlador PostScript para generar el código correspondiente, salvo en el caso de los ficheros EPS, cuya información se limita a transmitir. Esto quiere decir que todos los colores del PDF resultante serán colores RGB y, aunque todos los RIPs PostScript más modernos pueden efectuar la separación de esos colores, el resultado podría no ser el esperado.

  2. Ese código RGB resultante arriba mencionado hace los elementos negros o con un porcentaje de negro (grises) se filmen en las cuatro planchas (CMYK) de una cuatricromía. Para los Windows de la familia 9.x existe una versión (4.4.1 y posteriores) que incluye la opción de forzar la salida de los textos y gráficos de línea con el valor equivalente de Negro (dejando los colores restantes en sus valores RGB). Además, hay en el mercado varias herramientas y extensiones que permiten la conversión de colores RGB a CMYK. Ese es el caso de Quite A Box Of Tricks , (Quite, para PDFs ya hechos) y de Colour Chameleon 2000 (Grafikhuset, para antes de hacer los PDFs).

  3. Cuando trabaja y componen los textos, Word toma los valores de medida de las fuentes (font metrics) de las unidades de resolución del dispositivo de salida que tenga fijado en ese momento, y no de medidas absolutas de alta resolución. Eso quiere decir que cada vez que especifica una impresora nueva (aunque se siga usando el mismo controlador) el texto puede refluir y los saltos de línea pueden ser diferentes. Esto es aún más notable si se altera la resolución del dispositivo. Además, parece que los márgenes de impresión (es decir, la especificación de las zonas no imprimibles en el PPD y los ajustes del dispositivo) también tienen su influencia. Hay un par de medidas que se pueden tomar para evitar estos problemas:

    • Una solución es trabajar seleccionando el controlador de impresora de Acrobat Distiller y fijándolo a la resolución que se vaya a usar finalmente (1.200 ppp, por ejemplo). Para no alterar nada, las impresiones se deben hacer con los PDFs desde el menú de impresión de Acrobat.

    • En el menú "Herramientas - Opciones - Compatibilidad", Microsoft Word tiene una opción "Usar las medidas en la impresora para dar formato al documento" que hace que el texto tienda a refluir aún más. Esta opción se debe desactivar antes de crear cualquier documento.

    • En lo que se refiere al formateo de los textos, no es buena idea mover documentos de Word de una plataforma a otra (Windows a Macintosh o viceversa). Tampoco es buena idea llevarlos de Windows 9.x a Windows NT o Windows 2.000. En ambos casos puede haber redistribuciones, pero no es un aregla fija.

    • Al fijar el interlineado de los textos es bueno evitar los interlineados automáticos ("sencillo", "multiple", etc…). Es mejor usar un valor fijo ("12 puntos", "14 puntos" …).

  4. Cuando se usan fuentes True Type con documentos de Word y se ha especificado en el controlador de impresora que las fuentes True Type deben enviarse a la impresora como "Fuentes de contorno", pudiera haber pequeñas diferencias en los espaciados de los carácteres tipográficos, especialmente en los finales de línea. Esto se puede solucionar diciéndole al controlador de impresora que incluya las fuentes True Type como fuentes de Tipo 42 (la persona que me informó de este problema, por cierto, estaba usando el PPD de Distiller 4 y el controlador PostScript Adobe PS 4.3.1)

  5. A veces los ficheros de Microsoft Word incluyen gráficos creados en Microsoft Excel. Esta hoja de cálculo ofrece a los usuarios varios grosores de trazo de línea. Uno de ellos es "fino" (hairline), que lo que hace es decirle al dispositivo de impresión que debe trazar la línea con un punto de impresión de anchura (lo que no es 1 punto de pica, por cierto). En una impresora de 300 ppp de resolución, esto es una línea muy fina. En una filmadora de 2.400 ppp es una rayita invisible. Hay en el mercado varias herramientas y extensiones que permiten cambiar el grosor de las líneas. Una es la ya mencionada Quite A Box Of Tricks , (Quite, para PDFs ya hechos). Otra es PitStop (de Enfocus Software).

  6. En el menú "Herramientas - Opciones - Imprimir" existe una opción "Permitir alternar entra A4 y Carta" para redimensionar el documento en determinadas circunstancias. Esta opción se debe desactivar para que el documento no cambie al crear el PDF.

PDF frente a otros formatos de ficheros (EPS, PostScript, XML, ficheros nativos...)

L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)

Hay unos cuantos formatos de ficheros informáticos cuyos resultados se acercan a los de PDF. Éstos son algunos de ellos, con sus diferencias y similitudes:

PDF frente a PostScript

Adobe, la compañía que desarrollo PostScript, fue también quien desarrolló PDF. De hecho, PDF está basado en el lenguaje PostScript. PDF Usa el conjunto de intrucciones de PostScript de un modo diferente: Mientras que PostScript es realmente un lenguaje de programación que se puede usar para escribir un juego de ajedrez o un procesador de textos, PDF es de objetivos más limitados. Sólo describe la composición de un documento (usando operadores PostScript). En ese sentido, PDF recuerda más a una base de datos que a un lenguaje de programación.

Las principales ventajas de PDF frente a PostScript son:

  • Los ficheros PDF tienden a ser más reducidos debido a los eficaces algoritmos de compresión que se pueden usar.

  • Los ficheros PDF se pueden ver fácilmente con el lector Acrobat Reader u otras herramientas.

  • Los ficheros PDF se pueden modificar más fácilmente, siempre que se tengan las herramientas apropiadas.

  • Los ficheros PDF son má independientes de los dispositivos. Los ficheros PostScript suelen estar creados para dispositivos concretos y pueden generar errores PostScript si se envían a otros aparatos.

  • Los ficheros PDF pueden ser más versatiler que los ficheros PostScript: Pueden contener enlaces a otros ficheros y elementos multimedia.

PDF frente a HTML

PDF se suele comparar con HTML (el formato de datos más usual en la creación de páginas web). En principio HTML fue creado para describir la estructura de un documento y no tanto para elaborar su apariencia. El aspecto de una página web viene determinado por el navegador, no por el creador del documento. Con el incremento en la popularidad de la World Wide Web, el énfasis de las nuevas versiones de HTML pasó de más la estructura a la apariencia. En cierto modo, HTML se desplazó hacia los objetivos de PDF.

Al mismo tiempo, Adobe incluyó cada vez más funcionalidades web dentro de PDF (se hizo posible añadir enlaces de Internet dentro de un documento PDF). Al mismo tiempo, se puso a la disposición del público una extensión para los navegadores Netscape Navigator y Microsoft Internet Explorer para poder mostrar ficheros PDF. Acrobat 4 incorporó la capacidad de convertir un sitio web (o parte de él) en un documento PDF. Adobe añadió a PDF la capacidad de descarga incremental de bytes (byte streaming) para que no fuera necesario descargar todo un fichero PDF antes de poder ver su primera página en Internet.

En cierto modo, HTML y PDF se están conviertiendo en estándares en competencia. Ahora mismo, PDF es mucho más potente en lo que se refiere decribir la apariencia de documentos. HTML es más apropiado para accesos de Internet de baja capacidad. Sin embargo, es perfectamente factible usar ficheros PDF en sitios web y usar documentos HTML en un catálogo electrónico distribuido en CD-ROM.

PDF frente a XML

XML (eXtensible Markup Language, "Lenguaje Extendido de Marcas"), es un formato que se puede usar para describir el contenido de un documento (similar a SGML, del que es un subconjunto). Ultimamente está en el centro de atención debido a que su gran flexibilidad permite una fácil integración con bases de datos y el intercambio de grandes masas de datos en Internet. En realidad, XML no compite con PDF. Mientras que XML describe el contenido de un documento, PDF describe su apariencia. No es fácil extraer el contenido de un fichero PDF (o al menos, no sin gran cantidad de trabajo manual) ya que las estructura de un documento se pierde cuando se transforma en fichero PDF.

Es muy interesante que PDF 1.3 incluya un mecanismo en forma de estructura en árbol que permite contener datos tipo XML. De este modo, es teóricamente posible que un fichero PDF contenga un resumen estructurado del contenido además de una representación exacta de su apariencia. Desgraciadamente, los programas necesarios para incluir datos XML en un fichero PDF (usando marcas PDF: pdfmarks) como, por ejemplo, una Xtension para Quark XPress, aun no existen. Si necesitas PDF y XML, de momento el único camino es crear dos ficheros separados a partir de un programa de diseño o de un sistema de plublicación de bases de datos.

Si quieres saber más sobre PDF y XML, hay un artículo muy interesante que Gordon Kent publicó en PlanetPDF.

PDF y Acrobat

Muchas personas confunden PDF (el formato de los datos) con Acrobat (el programa que la firma Adobe vende para generar, manipular y ver ficheros PDF). Esta confusión parece surgir del hecho de que casi todas las nuevas versiones de las especificaciones PDF van acompañadas de una nueva versión Acrobat. La versión 1.2 de las especificaciones PDF fueron acompañadas de Acrobat 3. Las especificaciones 1.3 de PDF, lo fueron de Acrobat 4.

Preps y el formato PDF

L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)

En los dos ultimos años he estado usando Preps (de Scenisoft) sobre todo para trabajos de imposición de páginas. Aunque echo de menos el interfaz de usuario de PressWise [de Imation, adquirida por Scenicsoft en 1999], Preps ha resultado ser un programa bastante sólido que cuenta con un impresionante equipo de apoyo técnico.

Preps 4.x

En el momento de escribir estas páginas, Preps se encuentra en la fase beta de su versión 4.0. Scenicsoft ha informado de que esta versión podrá trabajar plenamente con el formato PDF. Afirma que será capaz de leer, analizar e imponer directamente ficheros PDF si necesidad de convertirlos primero a ficheros PostScript. He echado un vistazo a la fase beta de esta versión y veo que es cierto. Desgraciadamente no han alterado el interfaz de usuario de Preps, lo que deberían hacer tarde o temprano.

[Nota del traductor español: L. Leurs escribió estas líneas en 2000. Actualmente (verano de 2002), Preps se encuentra en su versión 4.1.2, que es una actualización para quienes tienen Preps 4.0. Preps tiene versiones en español, por cierto.].

Preps 3.7

Preps 3.7 contaba con capacidad de reconocer ficheros PDF de nivel 1.3 (los creados por Acrobat 4). Sin embargo, aun necesitab convertir los ficheros PDF a PostScript antes de leerlos. En el caso de ficheros PDF de color que era necesario separar, no se podía confiar en el algoritmo de separación de Preps. Era mejor recurrir a una separación en el RIP.

Preps 3.5.x y 3.6

Aunque Preps 3.5 era teóricamente capaz de reconocer el formato PDF (procedente de Acrobat 3), lo tenía que hacer por medio de un atajo que se basaba en que nada más añadir un fichero PDF a la lista de trabajo, Preps arrancaba Acrobat Exchange y hacía que éste exportara en un segundo plano el PDF a un fichero PostScript. A continuación, Preps analizaba el fichero PostScript. Como el fichero PostScript era tan grande, al menos, como el fichero PDF, había que tenerlo en cuenta al considerar la capacidad de almacenamiento del sistema.

Las primeras versiones de Preps 3.5 tenían algunos problemas con este sistema de PDF a PostScript. Cuando se sustituía un fichero PDF por una versión más nueva, Preps no hacía caso de estas alteraciones y se empeñaba en mantener el primer fichero PostScript. Este fallo se corrigión en revisiones posteriores del programa.

En el caso de ficheros PDF de color que tuvieran que ser separados, no era fiable usar el algoritmo de separación de Preps, y era mejor usar una separación en el RIP.

Versiones anteriores a Preps 3.5

Que Preps comenzara a poder trabajar con ficheros PDF a partir de la versión 3.5 no quiere decir que no se pudieran importar ficheros PDF en versiones anteriores. Lo unico que había que hacer era abrir Acrobat y exportar a un fichero PostScript. He hecho esto con ficheros procedentes de diversas fuentes y siempre resultó bien con Preps 3.1e (que fue la primera versión de Preps capaz de trabajar en condiciones con sistemas de separación en el RIP de dispositivos de Agfa).

Una advertencia: En el caso de ficheros PDF de color que tuvieran que ser separados, no era fiable usar el algoritmo de separación de Preps y era mejor usar una separación en el RIP. Por eso habia que configurar Preps para que enviase el fichero PostScript compuesto al RIP y dejar que éste hciera el trabajo duro. Para los RIPs de Agfa, esto quería decir que hacía falta la versión 3.1c de Preps, que era ya capaz de admitir deparaciones hechas en el RIP ejecutando PSE 11 o posterior.

Quark XPress 4.x frente al formato PDF

L. Leurs, 2001
(traducción: Gustavo Sánchez Muñoz)

Información general

Según algunas fuentes, la firma Quark, fabricante de Quark XPress (probablemente el programa de maquetación más popular de los que existen) pretendió que Adobe pagara por incluir soporte para PDF en la versión 4 de Quark XPress. Adobe se negó y Quark sacó el programa sin funcionalidades PDF. Con esta estrategia a Quark le salió el tiro por la culata cuando el formato PDF se convirtió en un gran éxito. Quark tuvo entonces que prometer la creación de una Xtension para tratar el formato PDF. Aunque tardó algún tiempo en estar preparada, al final salió como Xtension gratuita disponible en el sitio web de Quark. Una vez instalada, esta Xtension añade dos funcionalidades importantes a Quark XPress:

  1. La capacidad de importar ficheros PDF dentro de una caja de imagen.

  2. La capacidad de exportar y crear ficheros PDF desde Quark Xpress.

Sin embargo, aunque esto pueda parecer una gran cosa, lo cierto es que no hay que ser muy listo para percatarse de que la Xtension tiene sus fallos. Es lenta y no reconoce los colores directos que se hayan usado como tales en el PDF. Ambas limitaciones se pueden obviar, sin embargo, exportando el PDF a un fichero EPS compatible con el nivel PostScript 1 desde el mismo Acrobat y luego trayendo el fichero EPS a Quark XPress como una imagen normal. Hay que destacar que esta "técnica" puede dar origen a ficheros EPS verdaderamente grandes, ya que las imágenes se descomprimen.

Otra desventaja de la Xtension se revela cuando se colocan ficheros PDF multipágina y después, por lo que sea, se actualizan. Quark XPress rebobina hasta la primera página de cada fichero PDF aquellos PDFs que estuvieran colocados dentro de cajas de imagen haciendo referencia a páginas distintas de la primera del PDF

En conjunto, la importación de ficheros PDF parece funcionar bien cuando se trata colocar sólo cosas como anuncios o pequeños ficheros PDF de una sóla página y de imprimir esto sólo en dispositivos de color compuesto (sin hacer separaciones).

Además, la idea de que se preparan y exportan ficheros PDF directamente desde Quark XPress no es del todo cierta. La Xtension meramente actua como una especie de controlador para Acrobat Distiller. Como ocurría en el caso de Quark XPress 3.x, perfiero imprimir a un fichero PostScript y después usar Acrobat Distiller o cualquier herramienta similar para convertir el fichero PostScript a PDF.

Problemas de Quark XPress 4.x con el formato PDF

Una cuestión importante que no hay que perder de vista es que los ficheros PDF son ficheros compuestos (composite), es decir que cada página lleva consigo la necesaria información de Cian, Magenta, Amarillo y Negro. No va cada color en una página separada. La limitación al respecto de Quark XPress nace de que sus ficheros PostScript compuestos no contienen toda la información necesaria sobre trapping. Las sobreimpresiones y calados se conservan, pero los reventados (chokes y spreads), se pierden. Este es un buen problema si no se dispone de un RIP o de alguna aplicación aparte capaces de encargarse del trapping. Además, aunque los valores de sobreimpresión de Quark XPress se pueden conservar en un PDF, esto no siempre ocurre.

Los gradientes y degradados creados con colores directos no se conservan muy bien, incluso aun cuando se haya configurado Acrobat para que respete los colores directos en el fichero PDF. Los colores directos se convierten a CMYK.

Otro problema está en las sangres de los documentos. En teoría el tamaño del PDF resultante es totalmente fiel al tamaño de la página del documento de Quark XPress (es decir, un A4 de Quark XPress es un A4 en Acrobat). Pero, por desgracia, Quark XPress no incluye sangrías al crear un PDF mediante la impresión a un archivo PostScript y posterior tratamiento con Acrobat Distiller (lee esto si quieres saber más).

Si se usan ficheros DCS dentro de un documento de Quark XPress, este programa sólo incluye las previsualizaciones de baja resolución al imprimir ficheros compuestos. La consecuencia es que los ficheros PDF resultantes sólo incluirán las imágenes de baja resolución.

las líneas de puntos de Quark XPress dan a veces problemas al crear ficheros PDF. Si la longitud de un filete no es completamente divisible por la cantidad de puntos (con la opción "Estirar hasta las esquinas" desactivada), a veces aparece una especie de punto perdido suelto al final de la línea.

Y un último problema. Puede darse el caso de que haya pequeñas diferencias entre los tamaños de la página definida en Quark XPress y la del PDF correspondiente (lo usual son diferencias de unos 0,3 mm). Esto se debe a que Quark XPress sólo usa números enteros (integers) al describir el tamaño de sus páginas en un fichero PostScript.

Mejorar la creación de ficheros PDF desde Quark XPress

Hay un par de cosas que se pueden hacer para afrontar algunos de los problemas descritos y complicarse al mínimo la vida cuando se tienen que generar muchos ficheros PDF con Quark XPress.

En primer lugar, existen varias aplicaciones comerciales que solucionan esos problemas. Apogee Create (Agfa) puede tratar los problemas de valores de sobreimpresión, gradientes, ficheros DCS y establecer las sangres de los documentos. En cierto modom se lo puede cnsiderar una versión de alto nivel de Acrobat Distiller.

La Xtension SmartXT, (Total Integration) sirve para volver a fusionar los datos DCS al imprimir a un fichero compuesto. En el sitio wev de Creo Prinergy se pueden obtener algunas extensiones gratuitas para Acrobat que sirven para resolver los problemas de sangres y gradientes.

La Xtension DCSMerger (Impressed) es útil para guardar ficheros DCS como ficheros de color compuesto para que se puedan usar en un sistema de trabajo basado en ficheros de color compuesto

Posiblemente existan en el mercado muchos productos de trapping que son capaces de volver a aplicar éste a un fichero en el caso de que Quark XPress se haya "olvidado" de añadir valores sensatos de trapping a sus ficheros compuestos. Estos productos están disponibles como programas con entidad propia (como es el caso de Trapwise, de Scenicsoft), como extensiones de Acrobat (por ejemplo, Supertrap de Heidelberg), o como módulos de un RIP (ese es el caso, por ejemplo, de la capacidad de separaciones en el RIP para los RIPs de Adobe o Harlequin, de Global Graphics).

TeX y el formato PDF

Por L. Leurs, 2000
(traducción: Gustavo Sánchez Muñoz)

Nunca he usado Tex y no lo conozco salvo por saber que es un lenguaje-programa de composición especialmente adecuado para materiales científicos con muchas fórmulas. Fue desarrollado hace ya varios años por el profesor Donald Knuth y es aún muy popular en el mundo universitario.

El único motivo de haber incluido aquí esta página sobre Tex es proporcionar un enlace a Y&Y, que tienen disponible un PDF [en inglés] sobre la creación de ficheros PDF desde Tex.

[Nota del traductor español: También se puede consultar Este documento PDF de D.P. Story, de la Universidad de Akron (Ohio, EEUU).]