PDF in Theorie und Praxis
Erstellen • Analysieren • Bearbeiten • Drucken
Ralf König, [email protected] Technische Universität Chemnitz, Fakultät für Informatik
http://www.tu-chemnitz.de/informatik
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 1/46 Inhalt
● Inhalt Theorie ● Quellen Was ist PDF? Entwicklung und Geschichte PDF-Struktur Vergleich mit PostScript PDF erstellen
PDF analysieren Struktur von PDF-Dateien
PDF bearbeiten
PDF drucken und Praxis Troubleshooting
Rechtliches Erstellen von PDF-Dateien Spezialthemen Analysieren von PDF-Dateien Ende. Bearbeiten von PDF-Dateien Drucken von PDF-Dateien
Philosophie Spezialthemen
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 2/46 Quellen
● Inhalt ■ PDF Reference, Fourth Edition, Version 1.5 ● Quellen http://partners.adobe.com/asn/tech/pdf/specifications.jsp Was ist PDF? ■ PDF-Struktur Thomas Merz, c’t 07/2002, Ein Rezept für alle – Was im
PDF erstellen Portable Document Format steckt ■ PDF analysieren Thomas Merz, c’t 01/2003, Sorglos-Drucksache – PDF/X soll
PDF bearbeiten eine reibungslose Produktion garantieren PDF drucken und ■ Troubleshooting Thomas Merz, PostScript & Acrobat/PDF, Springer 1997,
Rechtliches ISBN 3-540-60854-0. ■ Spezialthemen Thomas Merz, Die PostScript- & PDF-Bibel, d.punkt Verlag
Ende. 2002, ISBN 3-935320-01-9. ■ news://comp.text.pdf ■ Troubleshooting von PDF-Dateien im URZ
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 3/46 ● Inhalt ● Quellen
Was ist PDF? ● PDF - Ein paar Beispiele ● Entwicklung von PDF ● Gemeinsamkeiten von PostScript und PDF ● Unterschiede zwischen Was ist PDF? PostScript und PDF ● Konvertierung zwischen PostScript und PDF
PDF-Struktur
PDF erstellen
PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 4/46 PDF - Ein paar Beispiele
● Inhalt PDF ist ein Container-Format für verschiedenste digitale ● Quellen Inhalte. Was ist PDF? ● PDF - Ein paar Beispiele ● Entwicklung von PDF ■ elektronische Dokumente mit druckbarem Inhalt (ähnlich ● Gemeinsamkeiten von PostScript und PDF PostScript) ● Unterschiede zwischen PostScript und PDF ■ ● Konvertierung zwischen gelocht und mit runden Ecken? ;-) PostScript und PDF ■ mit Animation PDF-Struktur ■ PDF erstellen mit Klang ■ PDF analysieren mit eingebetteten beliebigen Dateien (ähnlich einem
PDF bearbeiten Zip-Archiv)
PDF drucken und ■ Troubleshooting als Formular zum Ausfüllen, mit selbstberechnenden Feldern ■ Rechtliches als kleine Anwendung (Taschenrechner, Spiel)
Spezialthemen ■ als E-Book mit erweiterten Maßnahmen für Digital Rights Ende. Management (DRM)
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 5/46 Entwicklung von PDF
● Inhalt ■ geschaffen von Adobe-Mitgründer John Warnock, 1990 ● Quellen (Projektname: Camelot, später Carousel) Was ist PDF? ● PDF - Ein paar Beispiele ■ ● Entwicklung von PDF begann als vereinfachte Version von PostScript, später ● Gemeinsamkeiten von PostScript und PDF immer mehr Web-Features ● Unterschiede zwischen PostScript und PDF PostScript 1 1985 ● Konvertierung zwischen PostScript und PDF .ai format 1988 PDF-Struktur PDF 1.0 Acrobat 1 1993 214 S. PDF erstellen PDF 1.1 Acrobat 2 1994 298 S. PDF analysieren PDF 1.2 Acrobat 3 1996 394 S. PDF bearbeiten
PDF drucken und PDF 1.3 Acrobat 4 1999 696 S. Troubleshooting PDF 1.4 Acrobat 5 2001 978 S. Rechtliches PDF 1.5 Acrobat 6 2003 1172 S. Spezialthemen
Ende. PDF 1.6? Acrobat 7 2005? (Reader Beta seit 15.9.) Genauer: http://www.prepressure.com/pdf/history/history01.htm
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 6/46 Gemeinsamkeiten von PostScript und PDF
● Inhalt ■ beide eignen sich zur Beschreibung physischer Seiten mit ● Quellen grafischen Elementen als Inhalt als Basis für den Druck Was ist PDF? ● PDF - Ein paar Beispiele ■ ● Entwicklung von PDF ähnliche Ausdrucksmöglichkeiten für Zeichen-Anweisungen, ● Gemeinsamkeiten von PostScript und PDF gleiche Logik (Adobe Grafik-Modell) ● Unterschiede zwischen ■ PostScript und PDF Namen der Operatoren wurden in PDF abgekürzt (PS: ● Konvertierung zwischen PostScript und PDF „moveto“, PDF: „m“, .ai-Format) PDF-Struktur ■ Grund: in PostScript-Dateien hatte jeder sein eigenes PDF erstellen Dictionary aufgebaut
PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 7/46 Unterschiede zwischen PostScript und PDF
● Inhalt ● Quellen PostScript PDF
Was ist PDF? stack-basierte Seitenbeschreibungssprache ● PDF - Ein paar Beispiele ● Entwicklung von PDF Programmiersprache mit (+ JavaScript für begrenzte ● Gemeinsamkeiten von PostScript und PDF allen Eigenschaften Programmierbarkeit) ● Unterschiede zwischen PostScript und PDF ● Konvertierung zwischen nur druckbare Objekte zusätzliche Web-Features: PostScript und PDF Hyperlinks, Formulare, PDF-Struktur Verschlüsselung, mehr PDF erstellen Kompressionsalgorithmen PDF analysieren Seiten hängen voneinander Seiten sind voneinander PDF bearbeiten ab (lineare Struktur) unabhängig (Baum-Struktur) PDF drucken und Troubleshooting nur Schriften und Bilder sind digitale Objekte fast jeden Rechtliches sinnvoll einzubetten Typs können eingebettet Spezialthemen werden (Plug-In Ende. mechanismus in AR)
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 8/46 Konvertierung zwischen PostScript und PDF
● Inhalt ■ PS ⇒ PDF (z.B. zur Bereitstellung im Web): ● Quellen ◆ interpretieren des PS, ausrechnen aller Was ist PDF? ● PDF - Ein paar Beispiele Zeichenkommandos ● Entwicklung von PDF ◆ ● Gemeinsamkeiten von ersetzen aller Makros durch ihr Ergebnis bei Ausführung PostScript und PDF ◆ ● Unterschiede zwischen ausrechnen eines Graphics State für jede Seite (macht PostScript und PDF ● Konvertierung zwischen die Seiten unabnhängig voneinander) PostScript und PDF ◆ komprimieren der eingebetteten Schriften und Bilder PDF-Struktur ◆ pdfmark-Mechanismus für Anweisungen in der PDF erstellen PostScript-Quelle an den Distiller PDF analysieren ■ ⇒ PDF bearbeiten PDF PS (eg. beim Drucken auf einen PostScript-Drucker): ◆ PDF drucken und dekomprimieren der druckbaren Seiteninhalte, wie Text Troubleshooting und Vektorgrafik Rechtliches ◆ hinzufügen eines Makro-Dictionary zum Ummappen der Spezialthemen Operatoren Ende. ◆ ersetzen mancher Operatoren ◆ dekomprimieren der eingebetteten Schriften und Bilder ◆ Rest (Javascript Code, etc.) wird meist verworfen.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 9/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur ● Struktur ● Beispiel PDF-Struktur PDF erstellen
PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 10/46 Struktur
● Inhalt Folien von Jim King (Adobe) ● Quellen http://www.planetpdf.com/planetpdf/pdfs/seyboldseminars/ny02/king_jim_PDFAsPackageAnnot.pdf Was ist PDF? Zusammenfassung: PDF-Struktur ● Struktur ■ Graph von nummerierten Objekten mit Referenzen ● Beispiel ■ PDF erstellen jedes Objekt hat eine Objekt-ID und ein Revision-Level, z. B. 75 0 obj PDF analysieren ■ PDF bearbeiten Streams können komprimiert oder umkodiert werden PDF drucken und ■ ⇒ Troubleshooting xref Tabelle, um die Objekte schnell zu finden erschwert
Rechtliches Modifikationen ■ Spezialthemen aber: die meisten PDF-Tools versuchen eine Reparatur der
Ende. xref Tabelle
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 11/46 Beispiel
● Inhalt LAT X-Einzeiler: ● Quellen E Was ist PDF? \documentclass{article} PDF-Struktur ● Struktur \begin{document} ● Beispiel Hello World PDF erstellen \end{document} PDF analysieren
PDF bearbeiten PS-Datei: test1.ps (12 kB) PDF drucken und PDF-Datei: test1.pdf (7 kb) Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 12/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur
PDF erstellen ● Mehrere Wege PDF erstellen ● 1. Erstellung über Postscript ● 2. Nativer PDF-Export ● 3. Tools für Bilder ● PDF-Bibliotheken
PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 13/46 Mehrere Wege
● Inhalt 1. über PostScript und Konvertierung ● Quellen Was ist PDF? Anwendung PS PDF PDF-Struktur
PDF erstellen ● Mehrere Wege ● 1. Erstellung über Postscript ● 2. Nativer PDF-Export 2. direkt aus einer Anwendung exportieren ● 3. Tools für Bilder ● PDF-Bibliotheken
PDF analysieren Anwendung PDF
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches 3. für Einzelbilder gibt es auch weitere Tools (z.B. tiff2pdf,
Spezialthemen jpeg2pdf, svg2pdf, png2pdf)
Ende. Bild-Format PDF
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 14/46 1. Erstellung über Postscript
Anwendung PS PDF
● Inhalt ● Quellen Adobe Distiller: konvertiert von Postscript nach PDF (viele Was ist PDF? Optionen) PDF-Struktur
PDF erstellen Linux ● Mehrere Wege ■ ● 1. Erstellung über Postscript Ghostscript: ps2pdf ist ähnlich zum Distiller. Möglichst neue ● 2. Nativer PDF-Export ● 3. Tools für Bilder Ghostscript-Version (AFPL 8.14) nutzen. ● PDF-Bibliotheken ■ Bequemer PDF-Druckertreiber (Alternative zu Adobe PDF analysieren Distiller): PDF bearbeiten ◆ Linux: meist schon eingerichtet nach Installation, wandelt PDF drucken und Troubleshooting PS nach PDF mit Hilfe von GhostScript Rechtliches ◆ Windows: es gibt mehrere Wrapper für Ghostscript, z.B. Spezialthemen FreePDF Ende. ◆ für MS Office gibt es GhostWord, ähnlich zu Adobe PDFMaker (per pdfmark: Links erhalten, Bookmarks generieren)
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 15/46 2. Nativer PDF-Export
Anwendung PDF
● Inhalt ● Quellen Adobe PDFWriter: arbeitet auch als Druckertreiber, Was ist PDF? konvertiert direkt nach PDF ohne Umweg über Postscript (nur PDF-Struktur Basisfunktionalität, aber schneller als Distiller) PDF erstellen ● Mehrere Wege ● 1. Erstellung über Postscript ● 2. Nativer PDF-Export Programme unter Linux mit PDF-Export ● 3. Tools für Bilder ● PDF-Bibliotheken ■ OpenOffice (eigene Bibliothek) (suboptimal, z.B. Kreise PDF analysieren zusammengesetzt aus Geradenstücken) PDF bearbeiten ■ Scribus (eigene libpdf) (sieht ganz gut aus, aber PDF drucken und Troubleshooting beschränkter Umfang) Rechtliches ■ pdfTeX (eigene Bibliothek) (sehr mächtig) Spezialthemen ■ vTeX/free (sogar eigener PostScript-Interpreter GeX) Ende. ■ Sketch (über reportlab) ■ lout (Dokument-Formattierer)
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 16/46 3. Tools für Bilder
Bild-Format PDF
● Inhalt ● Quellen Konvertieren (vor allem aus Bildformaten): Was ist PDF? ■ tiff2pdf, tiff2ps PDF-Struktur ■ PDF erstellen jpeg2ps, jpeg2pdf ● Mehrere Wege ■ ● 1. Erstellung über Postscript png2pdf ● 2. Nativer PDF-Export ● 3. Tools für Bilder ■ convert aus Imagemagick ● PDF-Bibliotheken ■ PDF analysieren SVG Transcoder aus Batik (SVG to PDF)
PDF bearbeiten
PDF drucken und Spezialkonverter sind den Allzweck-Tools meist überlegen, Troubleshooting z. B. tiff2pdf erhält G4 Kompression, convert (nutzt Rechtliches Ghostscript) nicht Spezialthemen Ende. tiff2pdf eignet sich ganz gut zum Erstellen von gescannten Büchern in PDF
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 17/46 PDF-Bibliotheken
● Inhalt ■ vor allem für Entwickler interessant ● Quellen ■ Was ist PDF? Scribus hat begonnen, eine libpdf zu schreiben, es gibt aber
PDF-Struktur auch schon viele andere Ansätze ■ PDF erstellen bis jetzt keine Konvergenz erkennbar ● Mehrere Wege ● 1. Erstellung über Postscript ■ xpdf (C++), pdflib lite (C), reportlab (Python), iText, pjx, ● 2. Nativer PDF-Export ● 3. Tools für Bilder pdfbox (alle Java), fpdf (PHP), . . . ● PDF-Bibliotheken ■ PDF analysieren Link-Sammlung: http://rnvs.informatik.tu-chemnitz.de/twiki/bin/view/Main/FreePdfUtilitiesAndLibraries PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 18/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur PDF erstellen PDF analysieren PDF analysieren ● Streams ● Streams entpacken ● Werkzeuge für die Analyse
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 19/46 Streams
● Inhalt ■ Ziel: „Gutes“ von „schlechtem“ PDF unterscheiden. ● Quellen ■ Was ist PDF? Gutes PDF: für die entsprechenden Objekte werden auch
PDF-Struktur die passenden Datentypen genutzt, es wird nicht unnötig
PDF erstellen konvertiert (Bsp. Kreis zu Linienstücken) ■ PDF analysieren wenig redundanter Code, dazu analysiert man die Content ● Streams ● Streams entpacken Streams ● Werkzeuge für die Analyse ■ Bilder in gut komprimierenden Formaten, dazu analysiert PDF bearbeiten
PDF drucken und man die XObjects Troubleshooting ■ content stream enthält Text, Vektorgraphik and Referenzen Rechtliches zu XObjects Spezialthemen BT Ende. /F1 24 Tf 1 0 0 1 260 330 Tm (Hello World)Tj ET 100 100 200 200 re
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 20/46 Streams entpacken
● Inhalt vorher: die interessanten Objekte im PDF sind gepackt ● Quellen
Was ist PDF? nachher: alle sinnvoll zu entpackenden Objekte sind entpackt PDF-Struktur und können editiert werden
PDF erstellen
PDF analysieren ■ einzelnes Objekt entpacken: ● Streams ● Streams entpacken pdftosrc
PDF drucken und tool.pdf.Uncompress, tool.pdf.Compress Troubleshooting ■ alternativ mit pdftk uncompress, compress Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 21/46 Werkzeuge für die Analyse
● Inhalt ■ Multivalent PDF Tools: tool.pdf.Info, ● Quellen tool.pdf.Decrypt, tool.pdf.Validate, Was ist PDF? tool.font.view PDF-Struktur ■ PDF erstellen pdftk (PDF Tool Kit): pdftk dump_data, update_info,
PDF analysieren repair, unpack_files ● Streams ■ ● Streams entpacken pdfinfo, pdffonts (xpdf) ● Werkzeuge für die Analyse ■ Editor: xemacs, vim PDF bearbeiten ■ PDF drucken und Viewer: acroread, xpdf, gpdf, gv, ggv, Troubleshooting kghostview Rechtliches ■ Rasterizer: gs, pdftoppm (xpdf) Spezialthemen ■ Ende. Extrahieren von Resourcen: ◆ Rasterbilder: pdfimages (xpdf) ◆ Text: pdftotext (xpdf) ◆ Vektorgraphik (am einfachsten: ganze Seite extrahieren, dann MediaBox oder CropBox ändern)
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 22/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur PDF erstellen PDF bearbeiten PDF analysieren
PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 23/46 Auswahl und Anordnung der Seiten
● Inhalt Ausschießen ist selbst mit Acrobat (pur) nur schwer zu ● Quellen machen. Acrobat kann man aber skripten, es gibt dafür Was ist PDF? mehrere Plug-Ins. PDF-Struktur ■ pdfpages (LAT X package) PDF erstellen E ■ pdfnup.c A pdfpages PDF analysieren (Wrapper um pdfLTEX und ) ■ PDF bearbeiten pdfjam =(pdf90, pdfnup, pdfjoin) (Wrapper um ● Auswahl und Anordnung der A Seiten pdfLT X und pdfpages) ● Information hinzufügen E ● Nutzung von ■ tool.pdf.Split, Merge, Impose PDF-Bibliotheken (Multivalent): Seiten ● Grafisches Editieren umarrangieren, n-up Drucken, Seiten auf einem Bogen PDF drucken und Troubleshooting anordnen
Rechtliches ■ pdftk cat burst: Seiten umarrangieren, Spezialthemen Einzel-PDF-Seiten erzeugen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 24/46 Information hinzufügen
● Inhalt ■ Lesezeichen hinzufügen: mbtpdfasm o ● Quellen ■ Was ist PDF? Stempel (z.B. fürs Druckdatum) hinzufügen: mbtpdfasm t,
PDF-Struktur T ■ PDF erstellen Watermarks: pdftk background PDF analysieren ■ pdfLATEX mit pdfpages und eso-pic PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 25/46 Nutzung von PDF-Bibliotheken
● Inhalt ■ für eigene Tools, die es bis jetzt noch nicht gibt ● Quellen ■ Was ist PDF? manche (nicht alle!) der oben genannten Bibliotheken eignen
PDF-Struktur sich auch für den PDF-Import ■ PDF erstellen dann kann man Konverter bauen, die das PDF nach den
PDF analysieren eigenen Wünschen umbauen
PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 26/46 Grafisches Editieren
● Inhalt ■ Scribus (PDF-Import seit V1.2, vorher PS-Import) ● Quellen ■ Was ist PDF? pstoedit (Umwandeln in andere Vektorformate) und dann
PDF-Struktur Vektorzeichenprogramme verwenden
PDF erstellen
PDF analysieren
PDF bearbeiten ● Auswahl und Anordnung der Seiten ● Information hinzufügen ● Nutzung von PDF-Bibliotheken ● Grafisches Editieren
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 27/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur PDF erstellen PDF drucken und Troubleshooting PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting ● Drucken ● Druck-Werkzeuge ● Verbreitete Probleme beim Drucken ● Lösungsansätze
Rechtliches
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 28/46 Drucken
PDF PS Separieren Rastern Druck
● Inhalt ● Quellen Was passiert wo? Was ist PDF? 1. Host: Druckstrom vorrastern, in einer druckerspez. Sprache PDF-Struktur an den Drucker schicken (von Ghostscript gerastert, GDI) PDF erstellen
PDF analysieren PDF PS Separieren Rastern Druck PDF bearbeiten 2. Host: Wandlung nach PostScript plus PPD, dann PS (oder PDF drucken und Troubleshooting PCL) an den Drucker schicken ● Drucken ● Druck-Werkzeuge ● Verbreitete Probleme beim PDF PS Separieren Rastern Druck Drucken ● Lösungsansätze 3. Direkt: PDF zum Drucker auf neueren PS 3 Druckern Rechtliches (kostenpflichtiger Zusatz); Druckeinstellungen über externen Spezialthemen Kanal, oder über LPR-Queues (wird drucker-intern zuerst in Ende. PS gewandelt und dann gerastert, i.a. kein direktes Rendering) PDF PS Separieren Rastern Druck
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 29/46 Druck-Werkzeuge
● Inhalt ● Quellen Preprocessing: Ausschieß-Werkzeuge für Seitenauswahl, Was ist PDF? Broschürendruck wurden bereits genannt
PDF-Struktur Wichtig: PDF enthält (idealerweise) keine drucker-abhängigen PDF erstellen Einstellungen, Ausnahmen (Profi-Bereich): PDF analysieren ■ Job Ticket (hat nicht so richtig Fuß gefasst) PDF bearbeiten ■ PDF drucken und OPI (Open Prepress Interface) (veraltet) Troubleshooting ● Drucken ■ Output-Intent, Rendering-Intent ● Druck-Werkzeuge ● Verbreitete Probleme beim Drucken ● Lösungsansätze PDF PS
Rechtliches ■ Spezialthemen pdftops (xpdf)
Ende. ■ acroread -toPostScript ■ pdf2ps (gs) Dann mit PostScript-Viewer (gv, ggv, kghostview, gsview) prüfen.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 30/46 Verbreitete Probleme beim Drucken
● Inhalt ■ problematische Eingabe-Dateien durch mangelhafte ● Quellen Konverter (Komplexität wächst, z.B. Zerlegen von Was ist PDF? GIF-Bildern mit Transparenz in tausende Bitmap-Bildchen PDF-Struktur durch Distiller, 9 Seiten 20.000 Bilder) PDF erstellen ■ PDF analysieren Verschlüsselung und Zugriffseinstellungen (Dokument lässt
PDF bearbeiten sich nicht richtig drucken, wegen Zugriffsbeschränkungen
PDF drucken und lässt es sich nicht ohne weiteres korrigieren) Troubleshooting ● Drucken ■ fehlende Schriften (nicht eingebettet) und Abbildungen ● Druck-Werkzeuge ● Verbreitete Probleme beim (lo-res statt hi-res) Drucken ● Lösungsansätze ■ Probleme mit Standardschriften (unterschiedliche Namen Rechtliches und Kodierungen) Spezialthemen ■ eingebettete Schriften fehlerhaft Ende. ■ Profi-Druck: falscher Farbraum (RGB statt CMYK), Probleme bei Overprint/Trapping
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 31/46 Lösungsansätze
● Inhalt „Preflighting“ ● Quellen
Was ist PDF? ■ Analyse der Dateien vor dem Druck PDF-Struktur ■ Reaktion: Ablehnen des Jobs, automatische Korrektur oder PDF erstellen menschliche Eingriffe in den Druckprozess PDF analysieren ■ Selbst teure kommerzielle Tools rechnen sich im grafischen PDF bearbeiten Gewerbe. PDF drucken und Troubleshooting ■ ● Drucken Verbessertes grafisches Preview. ● Druck-Werkzeuge ■ ● Verbreitete Probleme beim Was machen wir an der Uni? (gs) Drucken ● Lösungsansätze PDF/X: Rechtliches standardisierter Workflow im grafischen Gewerbe (siehe auch Spezialthemen Folie „PDF/X“) Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 32/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur PDF erstellen Rechtliches PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 33/46 Zum Vergleich: Adobe Produkte
● Inhalt ● Quellen Reader kostenlos mit restriktiver Lizenz
Was ist PDF? Acrobat verschiedene Versionen, PDF-Struktur Server-Einsatz nicht erlaubt PDF erstellen Acrobat Document Server Server-Einsatz PDF analysieren AR Extension Server Zusatzfunktionen für AR PDF bearbeiten freischalten PDF drucken und Troubleshooting Adobe Acrobat SDK Bibliothek für Rechtliches ● Zum Vergleich: Adobe Software-Entwicklung Produkte ● Copyright von PDF Adobe Capture OCR von gescannten Seiten ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software Gerade die Server Produkte sind sehr teuer, vor allem das
Spezialthemen Erzeugen von PDF mit Adobe-Software. Bei den Viewern
Ende. hängt Adobe bei UNIX deutlich hinterher (MacOS und Win haben neueste Version).
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 34/46 Copyright von PDF
● Inhalt ■ Datenstrukturen und Operatoren sind (C) Adobe ● Quellen ■ Was ist PDF? PDF spec, Abschnitt 1.4: Intellectual Property
PDF-Struktur ■ Jeder darf die Datenstrukturen nutzen, solange er sich an PDF erstellen folgende Vorgaben hält: ◆ PDF analysieren Dokumentenzugriffsrechte müssen beachtet werden ◆ PDF bearbeiten Copyright-Notice von Adobe muss enthalten sein PDF drucken und ◆ Zugriff auf Dokumente im Widerspruch zu den Troubleshooting Dokumentenzugriffsrechte gilt als Verstoß des Copyright Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF In der Vergangenheit war Adobe immer recht großzügig mit ● Viele eigene Patente auf den Viewer den Spezifikationen. Allerdings wurden schon öfter Teile ● Welche externe Software hat Adobe genutzt? zurückgehalten. Nun sind Teile nicht mehr (oder bewusst noch ● Freie Software nicht) veröffentlicht (Reader Extensions). Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 35/46 Viele eigene Patente auf den Viewer
● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur
PDF erstellen
PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 36/46 Welche externe Software hat Adobe genutzt?
● Inhalt Auswahl: ● Quellen ■ Code aus einigen Open Source Projekten (libtiff, Apache, X Was ist PDF? Consortium, XFree) PDF-Struktur ■ PDF erstellen viele amerikanische Unis (es steht nicht genau da, welche
PDF analysieren Software) ■ PDF bearbeiten Berkeley (Sockets) PDF drucken und ■ Troubleshooting Mach Kernel (wahrscheinlich für MacOS X port) ■ Rechtliches Eric Young (Kryptographie, wahrscheinlich SSL, https, ● Zum Vergleich: Adobe Produkte WebCapture) ● Copyright von PDF ● Viele eigene Patente auf den ■ Viewer David Koblas (GIF Dekomprimierung, wahrscheinlich ● Welche externe Software hat Adobe genutzt? WebCapture) ● Freie Software ■ Netscape, Hewlett-Packard, RSA, Palm, Microsoft Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 37/46 Freie Software
● Inhalt ■ Eine sehr lange Liste steht auf: ● Quellen http://rnvs.informatik.tu-chemnitz.de/twiki/bin/view/Main/FreePdfUtilitiesAndLibraries Was ist PDF? ■ PDF-Struktur Was vor allem noch fehlt sind grafische Editierwerkzeuge
PDF erstellen und Werkzeuge zum Ausfüllen von PDF-Formularen. ■ PDF analysieren PDF-Konverter könnten besser werden. PDF bearbeiten ■ Offenbar ist vielen Entwicklern das Format nicht frei genug. PDF drucken und Troubleshooting
Rechtliches ● Zum Vergleich: Adobe Produkte ● Copyright von PDF ● Viele eigene Patente auf den Viewer ● Welche externe Software hat Adobe genutzt? ● Freie Software
Spezialthemen
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 38/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur PDF erstellen Spezialthemen PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen ● Sicherheit und DRM ● Verschlüsseln von PDF-Dateien ● Von Adobe PDF abgeleitete Formate ● PDF-Formulare
Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 39/46 Sicherheit und DRM
● Inhalt ■ es gibt mehrere Security Handler ● Quellen ■ Was ist PDF? Standard Security ◆ PDF-Struktur praktische Sicherheit gering ◆ PDF erstellen RC4, 40 Bits (nicht mehr zeitgemäß), jetzt bis 128 Bit ◆ PDF analysieren sinnvoll nur, wenn user password und owner password
PDF bearbeiten gesetzt sind PDF drucken und ■ Public-Key mit Zertifikaten (kaum eingesetzt) Troubleshooting ■ Rechtliches externe Firmen können weitere Verfahren bei Adobe
Spezialthemen anmelden ● Sicherheit und DRM ■ ● Verschlüsseln von E-Books (Adobe DRM): eigenes Verfahren, schon PDF-Dateien ● Von Adobe PDF abgeleitete gebrochen (Elcomsoft), nicht veröffentlicht Formate ● PDF-Formulare Externe Methoden meist mit Wrappern um AR (Snake-Oil?): Ende. http://www.locklizard.com, http://www.linkdata.com/index.htm#pdfcops
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 40/46 Verschlüsseln von PDF-Dateien
● Inhalt ■ Standard Security Handlers: 40 Bit (seit PDF 1.1) oder 128 Bit (seit ● Quellen PDF 1.4) Was ist PDF? ◆ PDF-Struktur Ghostscript:
PDF erstellen http://casper.ghostscript.com/~ghostgum/pdftips.htm#encrypt ◆ PDF analysieren ps2pdf14 -sOwnerPassword#owner
PDF bearbeiten -sUserPassword#user -dEncryptionR#3 PDF drucken und -dKeyLength#128 -dPermissions#-3904 in.ps Troubleshooting
Rechtliches out.pdf
Spezialthemen Permissions: Print, Extract text and graphics, . . . ● Sicherheit und DRM ◆ ● Verschlüsseln von Multivalent tool.pdf.Encrypt PDF-Dateien ● Von Adobe PDF abgeleitete ◆ pdftk encrypt_40bit encrypt_128bit allow Formate ● PDF-Formulare ■ Password Recovery: Ende. ◆ http://www.elcomsoft.com/prs.html ◆ RC4 Challenge
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 41/46 Von Adobe PDF abgeleitete Formate
● Inhalt Spezielle „stripped-down“ PDFs: ● Quellen
Was ist PDF? ■ PDF/X - PDF Exchange PDF-Struktur ◆ Untermenge von Adobe PDF, speziell für den PDF erstellen zuverlässigen Datenaustausch in der Druckvorstufe PDF analysieren ◆ ISO 15930 „Graphic technology – Prepress digital data PDF bearbeiten exchange“ PDF drucken und ◆ Verleger fordern zunehmend PDF/X, v. a. von Troubleshooting Anzeigenkunden Rechtliches ◆ Details: http://www.pdf-x.com/pdfx_123_1.php Spezialthemen ● Sicherheit und DRM ● Verschlüsseln von ■ PDF-Dateien PDF/A - PDF for Archival Storage ● Von Adobe PDF abgeleitete ◆ Formate Ziel: ISO-Standard ● PDF-Formulare ◆ Details: http://www.aiim.org/pdf_a/ Ende.
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 42/46 PDF-Formulare
● Inhalt Erstellen ● Quellen ■ OpenOffice (etwas verstecktes Menü mit den Was ist PDF? Formular-Elementen) PDF-Struktur ■ PDF erstellen pdfLaTeX ■ PDF analysieren grafisch: Scribus (Entwicklung)
PDF bearbeiten PDF drucken und Ausfüllen Troubleshooting Problem: Rechtliches acroread arbeitet nicht bei LANG=de_DE.UTF-8. Spezialthemen ● Sicherheit und DRM ● Verschlüsseln von Workaround: PDF-Dateien ● Von Adobe PDF abgeleitete Deshalb wird in /usr/bin/acroread auf LANG=C Formate ● PDF-Formulare umgeschalten. Folge: Umlaute lassen sich nicht eingeben.
Ende. pdftk fill_form – Formulare automatisiert ausfüllen pdftk flatten – Formulardaten mit Hintergrund verbinden
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 43/46 ● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur PDF erstellen Ende. PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende. ● Fragen? ● Diese Präsentation
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 44/46 Fragen?
● Inhalt ● Quellen
Was ist PDF?
PDF-Struktur
PDF erstellen
PDF analysieren
PDF bearbeiten
PDF drucken und Troubleshooting
Rechtliches
Spezialthemen
Ende. ● Fragen? ● Diese Präsentation
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 45/46 Diese Präsentation
● Inhalt ■ LAT X, dvips, ps2pdf ● Quellen E ◆ latex slides.tex Was ist PDF? ◆ dvips -o slides.ps slides.dvi PDF-Struktur ◆ ps2pdf slides.ps PDF erstellen ■ PDF analysieren documentclass: prosper.cls ■ PDF bearbeiten zusätzlich: HA-prosper.sty PDF drucken und ■ Troubleshooting Stil: HAPHA.sty (kommt mit HA-prosper) ■ Rechtliches Grafiken: pstricks, pst-node
Spezialthemen
Ende. ● Fragen? ● Diese Präsentation
Ralf Koenig, 28. September 2004 PDF in Theorie and Praxis - p. 46/46