Términos relacionados →  PDF , Preimpresión .

En esta página se explica brevemente cómo se almacena la información en los ficheros de formato PDF:

Convenciones generales

esta información puede ser de alguna utilidad para quien quiera editar directamente ficheros PDF. Estos documentos son simplemente ficheros de texto ASCII de 7-bits. Se pueden abrir en cualquier editor de texto puro y duro (como el Bloc de notas de Windows, por ejemplo). siempre que el texto no se haya comprimido.

En un fichero PDF, cada línea puede contener hasta 255 carácteres. Cada una de estas líneas debe terminar con un carácter de retorno de carro (que debe ir o no seguido de un carácter de nueva línea dependiendo de la plataforma usada para crear el fichero PDF). En los datos un fichero PDF se establecen diferencias entre mayúsculas y minúsculas (es un formato case-sensitive).

La estructura del fichero

El formato de ficheros PDF usa una estructura fija. Siempre contiene cuatro secciones:

  1. Una cabecera (header): Contiene información sobre qué especificación del estándar PDF sigue el fichero. Esta información es algo parecido a "%PDF-1.2" (donde 1.2 puede ser 1.0 o 1.1 en el caso de las versiones más antiguas).
  2. Un cuerpo (body area): Contiene la descripción de cada uno de los elementos usados en las páginas.
  3. Una tabla de referencias cruzadas (cross-reference table): Contiene la información de qué elementos se usan en las páginas del fichero PDF.
  4. Una coda (trailer): Que le dice al RIP dónde encontrar la tabla de referencias cruzadas y que termina siempre con un "%%EOF" (marca de final de fichero: End Of File). Si esta linea faltara, el fichero estaría incompleto y lo más probable es que un RIP no sea capaz de procesar el fichero. Esto no ocurre así con los ficheros PostScript, donde si falta la parte final del fichero (debido a un error de transmisión a una caída del sistema, etc...) aun es posible imprimir parte de la página (aunque sea de forma errónea). En un fichero PDF esto no ocurre. Se pierde todo.

Modificar los datos

Cada vez que se añaden nuevos datos a un fichero PDF (al editar por ejemplo un texto o al insertar nuevas páginas), se añaden sendas zonas nuevas de Cuerpo, Tabla de referencias y Coda. Si al guardar ese documento otra vez marcamos la opción "optimizar", Adobe Acrobat limpiará el fichero eliminando esas reduplicaciones de zonas y reorganizando el fichero.

Nota del traductor: Si quieres examinar y modificar la estructura de un PDF, existe un interesante programa llamado PDFCanOpener que te permitirá hacerlo.

Comentarios

Anónimo (no verificado)

Hola!

Quería saber si a la coda también se la llama código y si puede terminar con <<pdf>> en vez de %%EOF.

Gracias!!

gusgsm

Hola,

Hace mucho que no toco nada de PDF y estoy un poco oxidado (además de que mi nivel nunca fue muy alto), pero:

Las marcas << y >> se usan para marcar el inicio y final de un objeto diccionario:

Un objeto diccionario es una tabla que contiene parejas clave/valor. Se inicializa mediante "<<", se compone de una o varias entradas clave/valor y se finaliza con ">>":

<</Capitulo 29 /Encriptacion true /descripcion (no especificada)>>

(De pag 32, 37 y 38)

Me temo que eso quiere decir que %%EOF es imprescindible.

Sobre lo de código… es una traducción. Cada cual puede elegir la que crea más adecuada para trailer. Yo elijo la de coda.

Añadir nuevo comentario

El contenido de este campo se mantiene privado y no se mostrará públicamente.

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
Si quieres que te responda a una pregunta lee estas condiciones: La pregunta debe razonablemente pensada: No me preguntes porqué no te sale algo. Dime lo que quieres hacer, los pasos que estás dando para conseguirlo y las versiones de programas que estás usando. Es decir: Dame los datos completos. Si yo me tengo que pensar qué demonios me quieres decir, no voy a tomarme el esfuerzo que tú no te has tomado. "Hola", "Gracias" y "por favor": Ya no contesto a gente maleducada. Que esto sea gratis no quiere decir que te deba nada. Cualquier pregunta que no incluya eso, será ignorada y borrada. No respondo a peticiones ilegales: Sin más. Muchas cosas no las sé o puedo equivocarme. Hasta donde llego, llego. Más de una vez no sé qué es lo que ocurre o lo que deseas saber.

Índice de “La estructura y manipulación de los ficheros PDF”