PDF in Theorie und Praxis

Erstellen • Analysieren • Bearbeiten • Drucken

Ralf König, [email protected] Technische Universität Chemnitz, Fakultät für Informatik

http://www.tu-chemnitz.de/informatik

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 1/46 Inhalt

● Inhalt Theorie ● Quellen Was ist PDF? Entwicklung und Geschichte PDF-Struktur Vergleich mit PostScript PDF erstellen

PDF analysieren Struktur von PDF-Dateien

PDF bearbeiten

PDF drucken und Praxis Troubleshooting

Rechtliches Erstellen von PDF-Dateien Spezialthemen Analysieren von PDF-Dateien Ende. Bearbeiten von PDF-Dateien Drucken von PDF-Dateien

Philosophie Spezialthemen

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 2/46 Quellen

● Inhalt ■ PDF Reference, Fourth Edition, Version 1.5 ● Quellen http://partners.adobe.com/asn/tech/pdf/specifications.jsp Was ist PDF? ■ PDF-Struktur Thomas Merz, c’t 07/2002, Ein Rezept für alle – Was im

PDF erstellen Portable Document Format steckt ■ PDF analysieren Thomas Merz, c’t 01/2003, Sorglos-Drucksache – PDF/X soll

PDF bearbeiten eine reibungslose Produktion garantieren PDF drucken und ■ Troubleshooting Thomas Merz, PostScript & Acrobat/PDF, Springer 1997,

Rechtliches ISBN 3-540-60854-0. ■ Spezialthemen Thomas Merz, Die PostScript- & PDF-Bibel, d.punkt Verlag

Ende. 2002, ISBN 3-935320-01-9. ■ news://comp.text. ■ Troubleshooting von PDF-Dateien im URZ

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 3/46 ● Inhalt ● Quellen

Was ist PDF? ● PDF - Ein paar Beispiele ● Entwicklung von PDF ● Gemeinsamkeiten von PostScript und PDF ● Unterschiede zwischen Was ist PDF? PostScript und PDF ● Konvertierung zwischen PostScript und PDF

PDF-Struktur

PDF erstellen

PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 4/46 PDF - Ein paar Beispiele

● Inhalt PDF ist ein Container-Format für verschiedenste digitale ● Quellen Inhalte. Was ist PDF? ● PDF - Ein paar Beispiele ● Entwicklung von PDF ■ elektronische Dokumente mit druckbarem Inhalt (ähnlich ● Gemeinsamkeiten von PostScript und PDF PostScript) ● Unterschiede zwischen PostScript und PDF ■ ● Konvertierung zwischen gelocht und mit runden Ecken? ;-) PostScript und PDF ■ mit Animation PDF-Struktur ■ PDF erstellen mit Klang ■ PDF analysieren mit eingebetteten beliebigen Dateien (ähnlich einem

PDF bearbeiten Zip-Archiv)

PDF drucken und ■ Troubleshooting als Formular zum Ausfüllen, mit selbstberechnenden Feldern ■ Rechtliches als kleine Anwendung (Taschenrechner, Spiel)

Spezialthemen ■ als E-Book mit erweiterten Maßnahmen für Digital Rights Ende. Management (DRM)

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 5/46 Entwicklung von PDF

● Inhalt ■ geschaffen von Adobe-Mitgründer John Warnock, 1990 ● Quellen (Projektname: Camelot, später Carousel) Was ist PDF? ● PDF - Ein paar Beispiele ■ ● Entwicklung von PDF begann als vereinfachte Version von PostScript, später ● Gemeinsamkeiten von PostScript und PDF immer mehr Web-Features ● Unterschiede zwischen PostScript und PDF PostScript 1 1985 ● Konvertierung zwischen PostScript und PDF .ai format 1988 PDF-Struktur PDF 1.0 Acrobat 1 1993 214 S. PDF erstellen PDF 1.1 Acrobat 2 1994 298 S. PDF analysieren PDF 1.2 Acrobat 3 1996 394 S. PDF bearbeiten

PDF drucken und PDF 1.3 Acrobat 4 1999 696 S. Troubleshooting PDF 1.4 Acrobat 5 2001 978 S. Rechtliches PDF 1.5 Acrobat 6 2003 1172 S. Spezialthemen

Ende. PDF 1.6? Acrobat 7 2005? (Reader Beta seit 15.9.) Genauer: http://www.prepressure.com/pdf/history/history01.htm

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 6/46 Gemeinsamkeiten von PostScript und PDF

● Inhalt ■ beide eignen sich zur Beschreibung physischer Seiten mit ● Quellen grafischen Elementen als Inhalt als Basis für den Druck Was ist PDF? ● PDF - Ein paar Beispiele ■ ● Entwicklung von PDF ähnliche Ausdrucksmöglichkeiten für Zeichen-Anweisungen, ● Gemeinsamkeiten von PostScript und PDF gleiche Logik (Adobe Grafik-Modell) ● Unterschiede zwischen ■ PostScript und PDF Namen der Operatoren wurden in PDF abgekürzt (PS: ● Konvertierung zwischen PostScript und PDF „moveto“, PDF: „m“, .ai-Format) PDF-Struktur ■ Grund: in PostScript-Dateien hatte jeder sein eigenes PDF erstellen Dictionary aufgebaut

PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 7/46 Unterschiede zwischen PostScript und PDF

● Inhalt ● Quellen PostScript PDF

Was ist PDF? stack-basierte Seitenbeschreibungssprache ● PDF - Ein paar Beispiele ● Entwicklung von PDF Programmiersprache mit (+ JavaScript für begrenzte ● Gemeinsamkeiten von PostScript und PDF allen Eigenschaften Programmierbarkeit) ● Unterschiede zwischen PostScript und PDF ● Konvertierung zwischen nur druckbare Objekte zusätzliche Web-Features: PostScript und PDF Hyperlinks, Formulare, PDF-Struktur Verschlüsselung, mehr PDF erstellen Kompressionsalgorithmen PDF analysieren Seiten hängen voneinander Seiten sind voneinander PDF bearbeiten ab (lineare Struktur) unabhängig (Baum-Struktur) PDF drucken und Troubleshooting nur Schriften und Bilder sind digitale Objekte fast jeden Rechtliches sinnvoll einzubetten Typs können eingebettet Spezialthemen werden (Plug-In Ende. mechanismus in AR)

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 8/46 Konvertierung zwischen PostScript und PDF

● Inhalt ■ PS ⇒ PDF (z.B. zur Bereitstellung im Web): ● Quellen ◆ interpretieren des PS, ausrechnen aller Was ist PDF? ● PDF - Ein paar Beispiele Zeichenkommandos ● Entwicklung von PDF ◆ ● Gemeinsamkeiten von ersetzen aller Makros durch ihr Ergebnis bei Ausführung PostScript und PDF ◆ ● Unterschiede zwischen ausrechnen eines Graphics State für jede Seite (macht PostScript und PDF ● Konvertierung zwischen die Seiten unabnhängig voneinander) PostScript und PDF ◆ komprimieren der eingebetteten Schriften und Bilder PDF-Struktur ◆ pdfmark-Mechanismus für Anweisungen in der PDF erstellen PostScript-Quelle an den Distiller PDF analysieren ■ ⇒ PDF bearbeiten PDF PS (eg. beim Drucken auf einen PostScript-Drucker): ◆ PDF drucken und dekomprimieren der druckbaren Seiteninhalte, wie Text Troubleshooting und Vektorgrafik Rechtliches ◆ hinzufügen eines Makro-Dictionary zum Ummappen der Spezialthemen Operatoren Ende. ◆ ersetzen mancher Operatoren ◆ dekomprimieren der eingebetteten Schriften und Bilder ◆ Rest (Javascript Code, etc.) wird meist verworfen.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 9/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur ● Struktur ● Beispiel PDF-Struktur PDF erstellen

PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 10/46 Struktur

● Inhalt Folien von Jim King (Adobe) ● Quellen http://www.planetpdf.com/planetpdf/pdfs/seyboldseminars/ny02/king_jim_PDFAsPackageAnnot.pdf Was ist PDF? Zusammenfassung: PDF-Struktur ● Struktur ■ Graph von nummerierten Objekten mit Referenzen ● Beispiel ■ PDF erstellen jedes Objekt hat eine Objekt-ID und ein Revision-Level, z. B. 75 0 obj PDF analysieren ■ PDF bearbeiten Streams können komprimiert oder umkodiert werden PDF drucken und ■ ⇒ Troubleshooting xref Tabelle, um die Objekte schnell zu finden erschwert

Rechtliches Modifikationen ■ Spezialthemen aber: die meisten PDF-Tools versuchen eine Reparatur der

Ende. xref Tabelle

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 11/46 Beispiel

● Inhalt LAT X-Einzeiler: ● Quellen E Was ist PDF? \documentclass{article} PDF-Struktur ● Struktur \begin{document} ● Beispiel Hello World PDF erstellen \end{document} PDF analysieren

PDF bearbeiten PS-Datei: test1.ps (12 kB) PDF drucken und PDF-Datei: test1.pdf (7 kb) Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 12/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur

PDF erstellen ● Mehrere Wege PDF erstellen ● 1. Erstellung über Postscript ● 2. Nativer PDF-Export ● 3. Tools für Bilder ● PDF-Bibliotheken

PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 13/46 Mehrere Wege

● Inhalt 1. über PostScript und Konvertierung ● Quellen Was ist PDF? Anwendung PS PDF PDF-Struktur

PDF erstellen ● Mehrere Wege ● 1. Erstellung über Postscript ● 2. Nativer PDF-Export 2. direkt aus einer Anwendung exportieren ● 3. Tools für Bilder ● PDF-Bibliotheken

PDF analysieren Anwendung PDF

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches 3. für Einzelbilder gibt es auch weitere Tools (z.B. tiff2pdf,

Spezialthemen jpeg2pdf, svg2pdf, png2pdf)

Ende. Bild-Format PDF

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 14/46 1. Erstellung über Postscript

Anwendung PS PDF

● Inhalt ● Quellen Adobe Distiller: konvertiert von Postscript nach PDF (viele Was ist PDF? Optionen) PDF-Struktur

PDF erstellen ● Mehrere Wege ■ ● 1. Erstellung über Postscript Ghostscript: ps2pdf ist ähnlich zum Distiller. Möglichst neue ● 2. Nativer PDF-Export ● 3. Tools für Bilder Ghostscript-Version (AFPL 8.14) nutzen. ● PDF-Bibliotheken ■ Bequemer PDF-Druckertreiber (Alternative zu Adobe PDF analysieren Distiller): PDF bearbeiten ◆ Linux: meist schon eingerichtet nach Installation, wandelt PDF drucken und Troubleshooting PS nach PDF mit Hilfe von GhostScript Rechtliches ◆ Windows: es gibt mehrere Wrapper für Ghostscript, z.B. Spezialthemen FreePDF Ende. ◆ für MS Office gibt es GhostWord, ähnlich zu Adobe PDFMaker (per pdfmark: Links erhalten, Bookmarks generieren)

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 15/46 2. Nativer PDF-Export

Anwendung PDF

● Inhalt ● Quellen Adobe PDFWriter: arbeitet auch als Druckertreiber, Was ist PDF? konvertiert direkt nach PDF ohne Umweg über Postscript (nur PDF-Struktur Basisfunktionalität, aber schneller als Distiller) PDF erstellen ● Mehrere Wege ● 1. Erstellung über Postscript ● 2. Nativer PDF-Export Programme unter Linux mit PDF-Export ● 3. Tools für Bilder ● PDF-Bibliotheken ■ OpenOffice (eigene Bibliothek) (suboptimal, z.B. Kreise PDF analysieren zusammengesetzt aus Geradenstücken) PDF bearbeiten ■ (eigene libpdf) (sieht ganz gut aus, aber PDF drucken und Troubleshooting beschränkter Umfang) Rechtliches ■ pdfTeX (eigene Bibliothek) (sehr mächtig) Spezialthemen ■ vTeX/free (sogar eigener PostScript-Interpreter GeX) Ende. ■ Sketch (über reportlab) ■ lout (Dokument-Formattierer)

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 16/46 3. Tools für Bilder

Bild-Format PDF

● Inhalt ● Quellen Konvertieren (vor allem aus Bildformaten): Was ist PDF? ■ tiff2pdf, tiff2ps PDF-Struktur ■ PDF erstellen jpeg2ps, jpeg2pdf ● Mehrere Wege ■ ● 1. Erstellung über Postscript png2pdf ● 2. Nativer PDF-Export ● 3. Tools für Bilder ■ convert aus Imagemagick ● PDF-Bibliotheken ■ PDF analysieren SVG Transcoder aus Batik (SVG to PDF)

PDF bearbeiten

PDF drucken und Spezialkonverter sind den Allzweck-Tools meist überlegen, Troubleshooting z. B. tiff2pdf erhält G4 Kompression, convert (nutzt Rechtliches Ghostscript) nicht Spezialthemen Ende. tiff2pdf eignet sich ganz gut zum Erstellen von gescannten Büchern in PDF

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 17/46 PDF-Bibliotheken

● Inhalt ■ vor allem für Entwickler interessant ● Quellen ■ Was ist PDF? Scribus hat begonnen, eine libpdf zu schreiben, es gibt aber

PDF-Struktur auch schon viele andere Ansätze ■ PDF erstellen bis jetzt keine Konvergenz erkennbar ● Mehrere Wege ● 1. Erstellung über Postscript ■ (C++), pdflib lite (C), reportlab (Python), iText, pjx, ● 2. Nativer PDF-Export ● 3. Tools für Bilder pdfbox (alle Java), fpdf (PHP), . . . ● PDF-Bibliotheken ■ PDF analysieren Link-Sammlung: http://rnvs.informatik.tu-chemnitz.de/twiki/bin/view/Main/FreePdfUtilitiesAndLibraries PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 18/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur PDF erstellen PDF analysieren PDF analysieren ● Streams ● Streams entpacken ● Werkzeuge für die Analyse

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 19/46 Streams

● Inhalt ■ Ziel: „Gutes“ von „schlechtem“ PDF unterscheiden. ● Quellen ■ Was ist PDF? Gutes PDF: für die entsprechenden Objekte werden auch

PDF-Struktur die passenden Datentypen genutzt, es wird nicht unnötig

PDF erstellen konvertiert (Bsp. Kreis zu Linienstücken) ■ PDF analysieren wenig redundanter Code, dazu analysiert man die Content ● Streams ● Streams entpacken Streams ● Werkzeuge für die Analyse ■ Bilder in gut komprimierenden Formaten, dazu analysiert PDF bearbeiten

PDF drucken und man die XObjects Troubleshooting ■ content stream enthält Text, Vektorgraphik and Referenzen Rechtliches zu XObjects Spezialthemen BT Ende. /F1 24 Tf 1 0 0 1 260 330 Tm (Hello World)Tj ET 100 100 200 200 re

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 20/46 Streams entpacken

● Inhalt vorher: die interessanten Objekte im PDF sind gepackt ● Quellen

Was ist PDF? nachher: alle sinnvoll zu entpackenden Objekte sind entpackt PDF-Struktur und können editiert werden

PDF erstellen

PDF analysieren ■ einzelnes Objekt entpacken: ● Streams ● Streams entpacken pdftosrc ● Werkzeuge für die Analyse ■ gesamtes Dokument: aus Multivalent: PDF bearbeiten

PDF drucken und tool.pdf.Uncompress, tool.pdf.Compress Troubleshooting ■ alternativ mit pdftk uncompress, compress Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 21/46 Werkzeuge für die Analyse

● Inhalt ■ Multivalent PDF Tools: tool.pdf.Info, ● Quellen tool.pdf.Decrypt, tool.pdf.Validate, Was ist PDF? tool.font.view PDF-Struktur ■ PDF erstellen pdftk (PDF Tool Kit): pdftk dump_data, update_info,

PDF analysieren repair, unpack_files ● Streams ■ ● Streams entpacken pdfinfo, pdffonts (xpdf) ● Werkzeuge für die Analyse ■ Editor: xemacs, vim PDF bearbeiten ■ PDF drucken und Viewer: acroread, xpdf, gpdf, gv, ggv, Troubleshooting kghostview Rechtliches ■ Rasterizer: gs, pdftoppm (xpdf) Spezialthemen ■ Ende. Extrahieren von Resourcen: ◆ Rasterbilder: pdfimages (xpdf) ◆ Text: pdftotext (xpdf) ◆ Vektorgraphik (am einfachsten: ganze Seite extrahieren, dann MediaBox oder CropBox ändern)

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 22/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur PDF erstellen PDF bearbeiten PDF analysieren

PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 23/46 Auswahl und Anordnung der Seiten

● Inhalt Ausschießen ist selbst mit Acrobat (pur) nur schwer zu ● Quellen machen. Acrobat kann man aber skripten, es gibt dafür Was ist PDF? mehrere Plug-Ins. PDF-Struktur ■ pdfpages (LAT X package) PDF erstellen E ■ pdfnup.c A pdfpages PDF analysieren (Wrapper um pdfLTEX und ) ■ PDF bearbeiten pdfjam =(pdf90, pdfnup, pdfjoin) (Wrapper um ● Auswahl und Anordnung der A Seiten pdfLT X und pdfpages) ● Information hinzufügen E ● Nutzung von ■ tool.pdf.Split, Merge, Impose PDF-Bibliotheken (Multivalent): Seiten ● Grafisches Editieren umarrangieren, n-up Drucken, Seiten auf einem Bogen PDF drucken und Troubleshooting anordnen

Rechtliches ■ pdftk cat burst: Seiten umarrangieren, Spezialthemen Einzel-PDF-Seiten erzeugen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 24/46 Information hinzufügen

● Inhalt ■ Lesezeichen hinzufügen: mbtpdfasm o ● Quellen ■ Was ist PDF? Stempel (z.B. fürs Druckdatum) hinzufügen: mbtpdfasm t,

PDF-Struktur T ■ PDF erstellen Watermarks: pdftk background PDF analysieren ■ pdfLATEX mit pdfpages und eso-pic PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 25/46 Nutzung von PDF-Bibliotheken

● Inhalt ■ für eigene Tools, die es bis jetzt noch nicht gibt ● Quellen ■ Was ist PDF? manche (nicht alle!) der oben genannten Bibliotheken eignen

PDF-Struktur sich auch für den PDF-Import ■ PDF erstellen dann kann man Konverter bauen, die das PDF nach den

PDF analysieren eigenen Wünschen umbauen

PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 26/46 Grafisches Editieren

● Inhalt ■ Scribus (PDF-Import seit V1.2, vorher PS-Import) ● Quellen ■ Was ist PDF? pstoedit (Umwandeln in andere Vektorformate) und dann

PDF-Struktur Vektorzeichenprogramme verwenden

PDF erstellen

PDF analysieren

PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 27/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur PDF erstellen PDF drucken und Troubleshooting PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting ● Drucken ● Druck-Werkzeuge ● Verbreitete Probleme beim Drucken ● Lösungsansätze

Rechtliches

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 28/46 Drucken

PDF PS Separieren Rastern Druck

● Inhalt ● Quellen Was passiert wo? Was ist PDF? 1. Host: Druckstrom vorrastern, in einer druckerspez. Sprache PDF-Struktur an den Drucker schicken (von Ghostscript gerastert, GDI) PDF erstellen

PDF analysieren PDF PS Separieren Rastern Druck PDF bearbeiten 2. Host: Wandlung nach PostScript plus PPD, dann PS (oder PDF drucken und Troubleshooting PCL) an den Drucker schicken ● Drucken ● Druck-Werkzeuge ● Verbreitete Probleme beim PDF PS Separieren Rastern Druck Drucken ● Lösungsansätze 3. Direkt: PDF zum Drucker auf neueren PS 3 Druckern Rechtliches (kostenpflichtiger Zusatz); Druckeinstellungen über externen Spezialthemen Kanal, oder über LPR-Queues (wird drucker-intern zuerst in Ende. PS gewandelt und dann gerastert, i.a. kein direktes Rendering) PDF PS Separieren Rastern Druck

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 29/46 Druck-Werkzeuge

● Inhalt ● Quellen Preprocessing: Ausschieß-Werkzeuge für Seitenauswahl, Was ist PDF? Broschürendruck wurden bereits genannt

PDF-Struktur Wichtig: PDF enthält (idealerweise) keine drucker-abhängigen PDF erstellen Einstellungen, Ausnahmen (Profi-Bereich): PDF analysieren ■ Job Ticket (hat nicht so richtig Fuß gefasst) PDF bearbeiten ■ PDF drucken und OPI (Open Prepress Interface) (veraltet) Troubleshooting ● Drucken ■ Output-Intent, Rendering-Intent ● Druck-Werkzeuge ● Verbreitete Probleme beim Drucken ● Lösungsansätze PDF PS

Rechtliches ■ Spezialthemen pdftops (xpdf)

Ende. ■ acroread -toPostScript ■ pdf2ps (gs) Dann mit PostScript-Viewer (gv, ggv, kghostview, gsview) prüfen.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 30/46 Verbreitete Probleme beim Drucken

● Inhalt ■ problematische Eingabe-Dateien durch mangelhafte ● Quellen Konverter (Komplexität wächst, z.B. Zerlegen von Was ist PDF? GIF-Bildern mit Transparenz in tausende Bitmap-Bildchen PDF-Struktur durch Distiller, 9 Seiten 20.000 Bilder) PDF erstellen ■ PDF analysieren Verschlüsselung und Zugriffseinstellungen (Dokument lässt

PDF bearbeiten sich nicht richtig drucken, wegen Zugriffsbeschränkungen

PDF drucken und lässt es sich nicht ohne weiteres korrigieren) Troubleshooting ● Drucken ■ fehlende Schriften (nicht eingebettet) und Abbildungen ● Druck-Werkzeuge ● Verbreitete Probleme beim (lo-res statt hi-res) Drucken ● Lösungsansätze ■ Probleme mit Standardschriften (unterschiedliche Namen Rechtliches und Kodierungen) Spezialthemen ■ eingebettete Schriften fehlerhaft Ende. ■ Profi-Druck: falscher Farbraum (RGB statt CMYK), Probleme bei Overprint/Trapping

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 31/46 Lösungsansätze

● Inhalt „Preflighting“ ● Quellen

Was ist PDF? ■ Analyse der Dateien vor dem Druck PDF-Struktur ■ Reaktion: Ablehnen des Jobs, automatische Korrektur oder PDF erstellen menschliche Eingriffe in den Druckprozess PDF analysieren ■ Selbst teure kommerzielle Tools rechnen sich im grafischen PDF bearbeiten Gewerbe. PDF drucken und Troubleshooting ■ ● Drucken Verbessertes grafisches Preview. ● Druck-Werkzeuge ■ ● Verbreitete Probleme beim Was machen wir an der Uni? (gs) Drucken ● Lösungsansätze PDF/X: Rechtliches standardisierter Workflow im grafischen Gewerbe (siehe auch Spezialthemen Folie „PDF/X“) Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 32/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur PDF erstellen Rechtliches PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 33/46 Zum Vergleich: Adobe Produkte

● Inhalt ● Quellen Reader kostenlos mit restriktiver Lizenz

Was ist PDF? Acrobat verschiedene Versionen, PDF-Struktur Server-Einsatz nicht erlaubt PDF erstellen Acrobat Document Server Server-Einsatz PDF analysieren AR Extension Server Zusatzfunktionen für AR PDF bearbeiten freischalten PDF drucken und Troubleshooting SDK Bibliothek für Rechtliches ● Zum Vergleich: Adobe Software-Entwicklung Produkte ● Copyright von PDF Adobe Capture OCR von gescannten Seiten ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software Gerade die Server Produkte sind sehr teuer, vor allem das

Spezialthemen Erzeugen von PDF mit Adobe-Software. Bei den Viewern

Ende. hängt Adobe bei deutlich hinterher (MacOS und Win haben neueste Version).

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 34/46 Copyright von PDF

● Inhalt ■ Datenstrukturen und Operatoren sind (C) Adobe ● Quellen ■ Was ist PDF? PDF spec, Abschnitt 1.4: Intellectual Property

PDF-Struktur ■ Jeder darf die Datenstrukturen nutzen, solange er sich an PDF erstellen folgende Vorgaben hält: ◆ PDF analysieren Dokumentenzugriffsrechte müssen beachtet werden ◆ PDF bearbeiten Copyright-Notice von Adobe muss enthalten sein PDF drucken und ◆ Zugriff auf Dokumente im Widerspruch zu den Troubleshooting Dokumentenzugriffsrechte gilt als Verstoß des Copyright Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF In der Vergangenheit war Adobe immer recht großzügig mit ● Viele eigene Patente auf den Viewer den Spezifikationen. Allerdings wurden schon öfter Teile ● Welche externe Software hat Adobe genutzt? zurückgehalten. Nun sind Teile nicht mehr (oder bewusst noch ● Freie Software nicht) veröffentlicht (Reader Extensions). Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 35/46 Viele eigene Patente auf den Viewer

● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur

PDF erstellen

PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 36/46 Welche externe Software hat Adobe genutzt?

● Inhalt Auswahl: ● Quellen ■ Code aus einigen Open Source Projekten (libtiff, Apache, X Was ist PDF? Consortium, XFree) PDF-Struktur ■ PDF erstellen viele amerikanische Unis (es steht nicht genau da, welche

PDF analysieren Software) ■ PDF bearbeiten Berkeley (Sockets) PDF drucken und ■ Troubleshooting Mach Kernel (wahrscheinlich für MacOS X port) ■ Rechtliches Eric Young (Kryptographie, wahrscheinlich SSL, https, ● Zum Vergleich: Adobe Produkte WebCapture) ● Copyright von PDF ● Viele eigene Patente auf den ■ Viewer David Koblas (GIF Dekomprimierung, wahrscheinlich ● Welche externe Software hat Adobe genutzt? WebCapture) ● Freie Software ■ Netscape, Hewlett-Packard, RSA, Palm, Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 37/46 Freie Software

● Inhalt ■ Eine sehr lange Liste steht auf: ● Quellen http://rnvs.informatik.tu-chemnitz.de/twiki/bin/view/Main/FreePdfUtilitiesAndLibraries Was ist PDF? ■ PDF-Struktur Was vor allem noch fehlt sind grafische Editierwerkzeuge

PDF erstellen und Werkzeuge zum Ausfüllen von PDF-Formularen. ■ PDF analysieren PDF-Konverter könnten besser werden. PDF bearbeiten ■ Offenbar ist vielen Entwicklern das Format nicht frei genug. PDF drucken und Troubleshooting

Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software

Spezialthemen

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 38/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur PDF erstellen Spezialthemen PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen ● Sicherheit und DRM ● Verschlüsseln von PDF-Dateien ● Von Adobe PDF abgeleitete Formate ● PDF-Formulare

Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 39/46 Sicherheit und DRM

● Inhalt ■ es gibt mehrere Security Handler ● Quellen ■ Was ist PDF? Standard Security ◆ PDF-Struktur praktische Sicherheit gering ◆ PDF erstellen RC4, 40 Bits (nicht mehr zeitgemäß), jetzt bis 128 Bit ◆ PDF analysieren sinnvoll nur, wenn user password und owner password

PDF bearbeiten gesetzt sind PDF drucken und ■ Public-Key mit Zertifikaten (kaum eingesetzt) Troubleshooting ■ Rechtliches externe Firmen können weitere Verfahren bei Adobe

Spezialthemen anmelden ● Sicherheit und DRM ■ ● Verschlüsseln von E-Books (Adobe DRM): eigenes Verfahren, schon PDF-Dateien ● Von Adobe PDF abgeleitete gebrochen (Elcomsoft), nicht veröffentlicht Formate ● PDF-Formulare Externe Methoden meist mit Wrappern um AR (Snake-Oil?): Ende. http://www.locklizard.com, http://www.linkdata.com/index.htm#pdfcops

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 40/46 Verschlüsseln von PDF-Dateien

● Inhalt ■ Standard Security Handlers: 40 Bit (seit PDF 1.1) oder 128 Bit (seit ● Quellen PDF 1.4) Was ist PDF? ◆ PDF-Struktur Ghostscript:

PDF erstellen http://casper.ghostscript.com/~ghostgum/pdftips.htm#encrypt ◆ PDF analysieren ps2pdf14 -sOwnerPassword#owner

PDF bearbeiten -sUserPassword#user -dEncryptionR#3 PDF drucken und -dKeyLength#128 -dPermissions#-3904 in.ps Troubleshooting

Rechtliches out.pdf

Spezialthemen Permissions: Print, Extract text and graphics, . . . ● Sicherheit und DRM ◆ ● Verschlüsseln von Multivalent tool.pdf.Encrypt PDF-Dateien ● Von Adobe PDF abgeleitete ◆ pdftk encrypt_40bit encrypt_128bit allow Formate ● PDF-Formulare ■ Password Recovery: Ende. ◆ http://www.elcomsoft.com/prs.html ◆ RC4 Challenge

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 41/46 Von Adobe PDF abgeleitete Formate

● Inhalt Spezielle „stripped-down“ : ● Quellen

Was ist PDF? ■ PDF/X - PDF Exchange PDF-Struktur ◆ Untermenge von Adobe PDF, speziell für den PDF erstellen zuverlässigen Datenaustausch in der Druckvorstufe PDF analysieren ◆ ISO 15930 „Graphic technology – Prepress digital data PDF bearbeiten exchange“ PDF drucken und ◆ Verleger fordern zunehmend PDF/X, v. a. von Troubleshooting Anzeigenkunden Rechtliches ◆ Details: http://www.pdf-x.com/pdfx_123_1.php Spezialthemen ● Sicherheit und DRM ● Verschlüsseln von ■ PDF-Dateien PDF/A - PDF for Archival Storage ● Von Adobe PDF abgeleitete ◆ Formate Ziel: ISO-Standard ● PDF-Formulare ◆ Details: http://www.aiim.org/pdf_a/ Ende.

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 42/46 PDF-Formulare

● Inhalt Erstellen ● Quellen ■ OpenOffice (etwas verstecktes Menü mit den Was ist PDF? Formular-Elementen) PDF-Struktur ■ PDF erstellen pdfLaTeX ■ PDF analysieren grafisch: Scribus (Entwicklung)

PDF bearbeiten PDF drucken und Ausfüllen Troubleshooting Problem: Rechtliches acroread arbeitet nicht bei LANG=de_DE.UTF-8. Spezialthemen ● Sicherheit und DRM ● Verschlüsseln von Workaround: PDF-Dateien ● Von Adobe PDF abgeleitete Deshalb wird in /usr/bin/acroread auf LANG=C Formate ● PDF-Formulare umgeschalten. Folge: Umlaute lassen sich nicht eingeben.

Ende. pdftk fill_form – Formulare automatisiert ausfüllen pdftk flatten – Formulardaten mit Hintergrund verbinden

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 43/46 ● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur PDF erstellen Ende. PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende. ● Fragen? ● Diese Präsentation

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 44/46 Fragen?

● Inhalt ● Quellen

Was ist PDF?

PDF-Struktur

PDF erstellen

PDF analysieren

PDF bearbeiten

PDF drucken und Troubleshooting

Rechtliches

Spezialthemen

Ende. ● Fragen? ● Diese Präsentation

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 45/46 Diese Präsentation

● Inhalt ■ LAT X, dvips, ps2pdf ● Quellen E ◆ latex slides.tex Was ist PDF? ◆ dvips -o slides.ps slides.dvi PDF-Struktur ◆ ps2pdf slides.ps PDF erstellen ■ PDF analysieren documentclass: prosper.cls ■ PDF bearbeiten zusätzlich: HA-prosper.sty PDF drucken und ■ Troubleshooting Stil: HAPHA.sty (kommt mit HA-prosper) ■ Rechtliches Grafiken: pstricks, pst-node

Spezialthemen

Ende. ● Fragen? ● Diese Präsentation

Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 46/46