Das Projekt

Zwischen Mai 2004 und August 2009 wurden am Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier die ersten vier Bände des Goethe-Wörterbuchs (GWb) digitalisiert, in XML annotiert und im Internet publiziert. Seit November 2005 sind die ersten drei Bände (A – Gesäusel) des GWb frei im Internet zugänglich, seit April 2007 auch der vierte Band (Geschäft – inhaftieren). Das Projekt wurde von der DFG im Rahmen des Programms „Retrospektive Digitalisierung von Bibliotheksbeständen“ gefördert und in Kooperation mit der Interakademischen Kommission für das Goethe-Wörterbuch  erarbeitet.

Auf dem Weg zur elektronischen Version des GWb im Internet waren im Wesentlichen vier Arbeitsschritte durchzuführen:

  1. die retrospektive Digitalisierung der noch nicht in elektronischer Fassung vorliegenden Bände 1 bis 3,
  2. die Auszeichnung der logischen Struktur des Wörterbuchs und seiner Informationseinheiten,
  3. die Konvertierung der Satzdaten von Band 4,
  4. der Import der ausgezeichneten Wörterbuchdaten in eine Datenbank und die Entwicklung einer grafischen Benutzerschnittstelle für die Bereitstellung des GWb im Internet.

Bei allen Arbeitsschritten konnte unmittelbar auf Erfahrungen zurückgegriffen werden, die in vergleichbaren, ebenfalls am Trierer Kompetenzzentrum durchgeführten Projekten gesammelt wurden. Im Verbund mittelhochdeutscher Wörterbücher, im Digitalen Verbund von Dialektwörterbüchern, vor allem aber bei der elektronischen Publikation des Deutschen Wörterbuchs von Jacob Grimm und Wilhelm Grimm auf CD-ROM und im Internet wurden Routinen entwickelt, die – mit Modifikationen – bei der Digitalisierung des GWb eingesetzt werden konnten.

Konvertierung der Satzdaten von Band 4

Anders als die ersten drei Bände des GWb musste der vierte Band (Gestaltbarkeitinhaftieren, 2004) nicht retrodigitalisiert werden. Im Juli 2006 stellte der Verlag W. Kohlhammer dem Projekt die Satzdaten dieses Bandes sowie eine Übersicht über die darin enthaltenen Satzcodierungen zur Verfügung. Diese Codierungen wurden genutzt, um die Daten des vierten Bandes in dasselbe TEI-konforme XML-Format zu überführen wie die Daten der ersten drei Bände. Dieser Konvertierungsschritt erfolgte weitgehend automatisiert mittels eigens entwickelter Programmroutinen, die allerdings durch manuelle Prüf- und Korrekturschritte ergänzt wurden.