Datenformate

DiML und XDiML

Auszeichnung von Dokumenten mit der DiML-DTD

DiML (Dissertation Markup Language) ist eine Auszeichnungssprache, in die Dissertationen, die als Textverarbeitungsdatei vorliegen, zur Archivierung übertragen werden. Das heißt, DiML bietet speziell für die Archivierung von Dissertationen einen Katalog von Auszeichnungselementen, die gezielt auf die individuellen Strukturen dieses Dokumententyps zugeschnitten sind. Je genauer ein archivierter Text und seine zentralen Bausteine aufgeschlüsselt und separat definiert werden, umso gezielter können in der Folge diese einzelnen Elemente maschinell gesucht und in sekundenschnelle aufgefunden werden.

Grundsätzlich werden alle mit DiML ausgezeichneten Dateien in drei grundlegende Abschnitte aufgeteilt

Die Elemente, die den Bereich Titelblatt (front) strukturieren, bilden gleichzeitig die Metadaten des Dokumentes. Das heißt, hier werden vom Verfasser über Titel, Gutachter und Abgabetermin alle wichtigen bibliografischen Informationen erfasst und verwahrt.

Der eigentliche Textkorpus der Doktorarbeit wird von dem tag (body) eingerahmt. Neben wichtigen strukturellen Merkmalen wie Kapitel, Absätze, Überschriften, Tabellen und Abbildungen können im Hauptteil (body) auch zentrale semantische Elemente und indexierte Begriffe wie Zitate, Definitionen, Orts- oder Personennamen und Schlüsselbegriffe markiert und ausgezeichnet werden, nach denen in der Folge gezielt gesucht werden kann. Außerdem können Multimediaelemente (markiert durch den tag (mm)) als eigene Elementenklasse beschrieben und mit Hilfe von Zusatzinformationen individuell ausgezeichnet werden. Folgende Kürzel stehen speziell für die Unterscheidung von Multimediaelementen zur Verfügung

Für die dissertationstypischen Anhänge ist ein dritter und letzter Abschnitt (back) vorgesehen. In diesen Bereich gehören die Bibliografie und die Veröffentlichungsliste sowie der vom Doktorand geforderte Lebenslauf, die Selbständigkeitserklärung und gegebenenfalls die Danksagung. Außerdem fallen in diesen Abschnitt alle möglichen Arten von Zusatz- oder Beispielmaterialien wie Tabellenanhänge, Abbildungskataloge, Versuchsprotokolle oder Quellcodes von Programmen.

Das Rechenzentrum der Humboldt-Universität zu Berlin hat für Benutzer von Textverarbeitungsprogrammen einen Katalog der wichtigsten Formatvorlagen von A(bbildungen) bis Z(itate) für die Auszeichnung von Doktorarbeiten erstellt, die digital veröffentlicht werden sollen. An der Humboldt-Universität müssen alle Dissertationen, die elektronisch veröffentlicht werden sollen, mit diesem Formatvorlagenkatalog ausgezeichnet werden. Dieser Auszeichnungskatalog entsprechend der verwendeten Software sowie dazugehörige Anleitungen können vom Dokumenten- und Publikationsserver der HU Berlin heruntergeladen werden.

Mittlerweile ist die DiML zu XDiML weiterentwickelt worden. Das neue Format entspricht den aktuellen XML-Standards, auch in der Definition in Form der DTD / des Schemas. XDiML ist in einzelnen Modulen aufgebaut, dadurch können zusätzliche Module von Autoren verwendet werden bzw. nicht benötigte Module können gelöscht werden. XDiML beinhaltet auch Standard-DTDs wie MathML oder für Tabellen die CALS-Table.DTD.

XDiML unterstützt die Textverarbeitung im StarOffice7-Format. Dieses Dateiformat ist vollständig in XML umgesetzt und wird von freien Textverarbeitungsprogramme wie KOffice, OpenOffice unterstützt. Mit der Integration selbst definierter Filter können Erweiterungen vorgenommen werden (Speichern unter XDiML).

DiML - DTD der HU Berlin in XML
XDIML - Dokumentationsstandard für Dissertationen in XML
Dokumentvorlage der HU Berlin für Microsoft Word
Dokumentvorlage der HU Berlin für StarOffice oder OpenOffice

 
E-Mail-IconUta Ackermann