lunes, 2 de abril de 2012

HOW-TO: Como concatenar, extraer y manipular archivos .PDF

Como concatenar, extraer y manipular archivos .PDF con "pdftk"

pdftk es una herramienta simple para manipulación de archivos .pdf.

Como instalar: sencillo, ejecutar "sudo apt-get install pdftk" y listo.

Con pdftk podemos realizar:
  • Combinar documentos PDF: 
  • Dividir páginas PDF en un documento nuevo
  • Rotación de los documentos o páginas PDF
  • Descifrar la entrada según sea necesario (Requiere contraseña)
  • Cifrar salida como desee
  • Rellenar formularios PDF con X / FDF de datos
  • Generar Plantillas FDF datos de formularios PDF
  • Aplicar una marca de agua de fondo o un sello de primer plano
  • Informe PDF métricas tales como metadatos y marcadores
  • Actualización de metadatos PDF
  • Adjuntar archivos a páginas PDF o al documento PDF
  • Descomprimir archivos adjuntos PDF
  • Explosión de un documento PDF en una sola página
  • Descomprimir y volver a comprimirlo Corrientes página
  • Reparación dañado PDF (si es posible)
  
Algunos comandos:

Combinar archivos pdf:
forma 1: pdftk doc1.pdf doc2.pdf cat output doc-result.pdf

forma 2 (usando etiquetas en los archivos): pdftk A=doc1.pdf B=doc2.pdf cat A B output doc-result.pdf

forma 3 (combinando todos los archivos .pdf ubicados en un directorio:
pdftk *.pdf cat output todos_los_pdfs.pdf

Extraer páginas de un archivo .pdf:
pdftk A=doc1.pdf cat A5-8 output doc-result.pdf (Extrae las páginas desde la 5 a la 8 del archivo doc1.pdf y crea con estas páginas el archivo doc-result.pdf).


Extraer páginas de múltiples .pdf y crear un archivo nuevo:
pdftk A=doc1.pdf B=doc2.pdf cat A5-8 B10-24 output doc-result.pdf (Extrae las páginas desde la 5 a la 8 del archivo doc1.pdf y desde 10 a 24 del archivo doc2.pdf y crea con estas páginas el archivo doc-result.pdf).

Invertir el orden de las páginas en un archivo .pdf:
pdftk A=doc1.pdf cat A10-1 output doc_result.pdf (Invierte el archivo doc1.pdf que contiene 10 páginas).

Extraer hoja por hoja un archivo .pdf:
pdftk doc1.pdf burst

Rotar 1ra página del archivo .pdf 90 grados sentido reloj:
pdftk doc1.pdf cat 1E 2-end output salida.pdf

Rotar 1ra página del archivo .pdf 90 grados sentido reloj:
pdftk doc1.pdf cat 1-endS output salida.pdf

Remover página de archivo .pdf (por ejemplo, la página 13):
pdftk doc1.pdf cat 1-12 14-end output salida.pdf

Marca de agua (o background) en un archivo .pdf:
pdftk doc1.pdf background fondo.pdf output salida.pdf