Datenformate
PDF als Präsentations- und Druckformat
Das Dateiformat PDF (Portable Document Format) der Softwarefirma Adobe ist eine Weiterentwicklung des Dateienformats PostScript (PS). PostScript wurde 1983 ebenfalls von der Firma Adobe Systems als Seitenbeschreibungssprache entwickelt. PostScript ist eine Programmiersprache mit Grafikfunktionen, die in der Lage ist, geometrische Objekte, Schriften und Rasterbilder in einem Dokument anzuordnen. Die wichtigste Eigenschaft von PS-Dateien ist jedoch die Bereitstellung einer normierten, geräteunabhängigen Schnittstelle für die Ausgabe von Postscript Dateien auf Druckern, Kopierern, Bildschirmen, Belichtungs- oder Publishing-Geräten. Das heißt, PostScript-Dateien lassen sich auf den unterschiedlichsten Druckern ausdrucken bzw. unabhängig von Hersteller und Marke auf so gut wie allen Bildschirmen darstellen.
Im World Wide Web, das gekennzeichnet ist durch Hyperlinks und Verknüpfungen von Dokumenten unterschiedlichsten Medientyps, ist es von grundlegender Bedeutung ein Format zu entwickeln, das ebenso wie Postscript geräte- und auflösungsunabhängig Dokumente darstellt, andererseits aber auch Hyperlinks realisieren kann.
PDF ist eine seitenorientierte Sprache. PDF implementiert aber auch Features wie Links, Anmerkungen, Bookmarks, interaktive Elemente, sprachspezifische Zeichen und zahlreiche Präsentationsoptionen. Ein großer Nachteil der Postscript Datei war ihre Größe, die beim Transport über das Internet zu zeitaufwändigen Ladezeiten führen kann (spielt heute noch beim Gebrauch von Modems eine Rolle). PDF wurde deshalb durch eine interne Komprimierung in der Datenmenge reduziert, wodurch die Ladezeiten aus dem Internet für PDF-Dokumente deutlich reduziert worden sind. Darüber hinaus kann ein PDF-Dokument vom Endanwender auf den verschiedensten Druckern ohne Layouteinbußen ausgedruckt werden.
In der Ordnung der Dokumentformate gehört PDF zu den Präsentationsformaten. Diese Gattung zeichnet sich dadurch aus, dass sie eine Endstufe der Be- und Verarbeitung des Veröffentlichungsprozesses ist. Ähnlich dem papiergebundenen Buch sind in dem fertig erzeugten PDF-Format kaum Änderungen mehr möglich. Vorhandene Strukturen des Ausgangstextes, die strukturelle oder semantische Bedeutungen beinhalten, werden - soweit sie nicht in Inhaltsverzeichnissen oder Links umgesetzt werden - weitgehend aufgehoben.
PDF als Archivierungsformat für Online-Dissertationen
Grundsätzlich bearbeitet die Deutsche Nationalbibliothek - wie in der Regel auch die meisten Hochschulbibliotheken - natürlich jede Hochschulschrift, unabhängig davon, in welchem Format sie vom Autor an die Hochschulbibliothek abgeliefert wird. Es ist zwar nicht optimal, dass so viele Dokumente in PDF abgeliefert werden, also in einem proprietären Format; wünschenswert wären archivierungsfreundlichere Formate, z. B. XML. Solange PDF jedoch die Praxis dominiert, wird und muss PDF auch archiviert werden.
Aus Sicht der Langzeitarchivierung sollte ein PDF-Dokument möglichst unverschlüsselt an die Hochschulbibliothek / Deutsche Nationalbibliothek weiter geleitet werden. Wenn es vom Autor bzw. der Universität ein berechtigtes Interesse gibt, die Dissertation nur mit Einschränkungen öffentlich zugänglich zu machen, dann sollten etwaige Zugriffsbeschränkungen durch Verschlüsselung erst für die Veröffentlichung des Dokuments im Internet durch die veröffentlichende Bibliothek appliziert werden. Das bedeutet: Der Autor liefert an die archivierende Organisation ein gänzlich ungeschütztes Format mit der Auflage, bei einer öffentlichen Zugänglichkeit das Dokument in entsprechend den eigenen Vorgaben geschützer Form anzubieten. So könnte die Bibliothek beispielsweise bei Festlegung der Sicherheitseigenschaften des PDF-Dokuments in Acrobat die Option "Kopieren von Inhalt unzulässig" aktivieren. Nur so ließe sich eine Diskrepanz auflösen, welche zwischen den Anforderungen des Archivs zur Langzeitarchivierung und den Schutzwünschen des Autors besteht.
Aus pragmatischer bzw. an der Praxis gemessener Sicht der Koordinierungsstelle DissOnline sollte das DRUCKEN des PDF-Dokuments allerdings in jedem Fall möglichst zulässig bleiben. Die Deaktivierung der Druckmöglichkeit stellt nach allem Ermessen eine zu weitgehende Einschränkung der auch laut Urheberrecht erlaubten wissenschaftlichen und privaten Nutzung von Dokumenten dar. Gerade weil es sich bei Dissertationen um hochwissenschaftliche Arbeiten handelt, die am Bildschirm oft nur mit einem hohen Verlust an Komfort und Anmerkungsmöglichkeiten zu lesen sind, sollte hierbei das Ausdrucken unbedingt möglich sein. Die Empfehlung ist also, das Drucken zulässig zu lassen.
Zu beachten ist: Ein an die Hochschulbibliotheken / Deutsche Nationalbibliothek abgeliefertes PDF-Dokument muss natürlich in jedem Fall archivierbar sein. Primär darf also zwangsläufig die Möglichkeit des Speicherns für die PDF-Dokumente nicht ausgeschaltet sein, sonst könnten diese nicht auf Servern gespeichert bzw. zur Datensicherung migriert werden.
Die Initiative AIIM (international authority on Enterprise Content Management) hat sich zum Ziel gesetzt, Bedingungen für die Erstellung eines PDF aufzuführen, die eine sinnvolle Langzeitarchivierung sicher stellen. Danach sollten z. B. PDF-Version (und, falls zutreffend) Verschlüsselungsebene in den Metadaten des Dokuments vermerkt sein.
Konvertierung in PDF
Bei der Konvertierung einer Ausgangsdatei in das Druckformat PDF wird die Kodierungsweise der Daten verändert. Dieser Übertragungsprozess wird durch einen Konverter vollautomatisch vorgenommen. Als Erfinder des Datenformates PDF stellt die Softwarefirma Adobe einen dem aktuellsten PDF Format (z. Zt. 1.7) entsprechenden Konverter kommerziell zur Verfügung. Die gesamte Konverterumgebung wird unter dem Namen Acrobat 8.0 angeboten.
Die Bedienung der Acrobat-Software ist im Allgemeinen einfach. Bei der Konvertierung aus dem Textverarbeitungssystem Word z. B. hat der Benutzer zwei Möglichkeiten
- Mit der Installation von Adobe Acrobat 8.0 wird auf dem Computer ein Wordmakro, der PDF Maker, installiert. Dieses Makro wird durch den Menüeintrag: 'Datei, Adobe PDF erstellen...' gestartet. Mehrere Vorteile für die Erstellung eines PDF-Dokumentes bietet dieses Makro. Es wird die Kapitelstruktur, Unterkapitel ..., der entsprechenden Formatvorlagen übernommen und daraus automatisch Lesezeichen für ein Inhaltsverzeichnis erzeugt. Querverweise werden ebenfalls übernommen und in Links innerhalb des Dokuments oder in Internetlinks abgespeichert.
- Möglich ist auch, den Ausdruck der Arbeit dem Adobe Distiller zu übergeben, der zusammen mit einem Postscript Druckertreiber aus dieser Datei PDF erzeugt. Dazu muss man das Menü: 'Datei, Drucken...' aufrufen und wählt Adobe Distiller aus. Im Unterschied zum Verfahren oben wird die Dokumentstruktur hier nicht für die Erzeugung von Lesezeichen benutzt und Querverweise werden nicht in Links abgespeichert.
Neben der Benutzung der Originalsoftware von Adobe gibt es auch weitere Programme, die PDF erzeugen. Das damit gewonnene PDF unterscheidet sich jedoch vom "originalen PDF". Beim Ausdruck der Arbeit sind zwar kaum Unterschiede zu erkennen, geht es allerdings darum, PDF-Dateien im Volltext durchsuchbar zu machen, Lesezeichen bzw. Inhaltsverzeichnisse dem Leser anzubieten, die einer besseren Navigation dienen, sind die Unterschiede groß. Von den alternativen PDF-Konvertern wird - neben der Möglichkeit, PDF standardmäßig aus StarOffice / OpenOffice erzeugen zu können - am häufigsten "Ghostscript" gewählt.
Zu beachten ist: Um durch letztere Möglichkeit ein PDF-File zu erzeugen, das später durch Suchmaschinen als Volltext recherchierbar ist, muss die Version von Ghostscript ab der Version 5.50 (z. Zt. erhältlich: Version 8.54) verwendet werden. Bei älteren Versionen ist die Erzeugung einer recherchierbaren PDF-Datei nicht möglich. Die Alternative Ghostscript ist nicht zu empfehlen für den Aufbau eines Publikationsservers, da die Implementierung des PDF-Formats unterschiedlich ist und nicht mit absoluter Sicherheit davon ausgegangen werden kann, dass das erzeugte PDF im Volltext recherchierbar ist.
Es gibt inzwischen noch viele weitere, teils kommerzielle, teils freie Programme zur Erzeugung von PDF, die in unterschiedlichem Umfang beanspruchen, dem Adobe-PDF zu entsprechen. Vor der Entscheidung, eines dieser Programme zu verwenden, sollte die Umsetzung dieses Anspruchs jeweils geprüft werden, insbesondere hinsichtlich der (Volltext-)Recherchierbarkeit der PDFs.
Informationen
der Firma Adobe zu PDF
Leitfaden
zur Erstellung barrierefreier PDFs
Studienarbeit
"Dateiformate für das elektronische Publizieren"
AIIM:
PDF Archive
PDF-A
Tutorial
"Elektronisches Publizieren im PDF-Format"
"Word in PDF"
eine Schritt-für-Schritt-Anleitung der UB Trier
Ghostscript
Bewertung
von PDF-Konvertern