Erschienen in der taz (13.11.1997, S.18) und im Netpol-Digest 5 (26.11.1997).

Schwarten zu Bytescharen

Ein Umzug mit Büchern macht sinnfällig, daß an gewichtigen Worten schwer zu tragen ist. Trotzdem zog die deutsche Dependance des Projekts Gutenberg [1] dieser Tage erneut um, und statt sich dabei an bleischweren Bücherkartons einen Bruch zu heben, konnte Gunter Hille, Initiator und Betreuer des Projekts, eine CD-Rom in die Tasche stecken.

Das Archiv hat nun beim deutschen Ableger von America Online (Bertelsmann-AOL) ein Unterkommen gefunden. In den vergangenen Jahren gewährten die Hamburger Informatiker der Textsammlung Gastrecht, bis ihnen das Datenaufkommen schließlich zu hoch erschien. Nach einer Zwischenstation in Hilles Firma tritt jetzt der Online-Dienst als Sponsor auf, indem er die Kosten für die Hardware und die Netzanbindung übernimmt. Im Gegenzug erscheint neuerdings buchbezogene Werbung auf den Seiten des Projekts. Die Werbeeinnahmen sollen geteilt werden, und Hille hofft, mit seiner Hälfte eine Stelle für die Projektbetreuung finanzieren zu können. Auf Seiten von AOL wird mit einer imagefördernden Wirkung des Engagements gerechnet. Außerdem soll die Attraktivität des eigenen Angebots gesteigert werden, indem der Zugriff auf das Archiv für die Kunden vereinfacht wird.

Das Ziel von Gutenberg-DE ist nichts weniger als ein elektronisches Archiv klassischer deutscher Literatur. Damit orientiert sich das Projekt am amerikanischen Vorbild. 1971 brachte Michael Hart an der Universität von Illinois den Stein ins Rollen. Seitdem sammelt und ediert er englische Texte für die Benutzung am Computer. Nach dem Auftakt mit der amerikanischen Unabhängigkeitserklärung konnte im September der Eingang des tausendsten elektronischen Textes vermeldet werden, darunter nun auch eine Übersetzung von Dantes »Göttlicher Komödie«. [2] In Deutschland existiert das Archiv erst seit 1994. Den Anfang machten einige Märchen, die auf einem Rechner des Fachbereichs Informatik der Universität Hamburg bereitlagen. Mittlerweile ist der Bestand kontinuierlich auf 500 Bände ausgeweitet worden. Die Liste der Autoren reicht von Hartmann von Aue über Heinrich von Kleist bis hin zu Frank Wedekind. Was mit einem punktuellen Ausschnitt begann, deckt nun ein breites Spektrum ab, in dem nicht nur Theodor Fontane, sondern auch dessen unbekannterer Zeitgenosse Karl Gutzkow auf einen Mausklick zur Verfügung stehen.

Die Beschränkung auf ältere Literatur erfolgt dabei nicht freiwillig, sondern muß sich am Urheberrecht orientieren. Das Projekt Gutenberg kann nur Texte führen, deren Autoren seit mindestens 70 Jahren verstorben sind. Dementsprechend werden Kafka und Rilke angeboten, Mann und Döblin dagegen sind tabu. Innerhalb dieses Rahmens geben die Vorlieben der Beteiligten den Ausschlag für die Auswahl der Autoren und ihrer Werke. Das wird verständlich durch einen Blick auf die zugrundeliegende Arbeit. Mittels eines Scanners, eines digitalen Fotokopierers, wird das Foto einer Buchseite als Datei abgelegt. Eine Worterkennungs-Software untersucht die Datei auf Buchstabenmuster und erstellt eine Textdatei, die idealerweise den Text der fotokopierten Seite beinhaltet. Als problematisch erweisen sich allerdings die »Tippfehler« der Software. Zwar wird die Schreibweise jedes Wortes mit einem Wörterbuch abgeglichen, aber dem inhaltlichen Unterschied von »Ritter« und »Retter« schenkt die Software keine Beachtung. Deshalb bemüht sich Gerd Bouillon, einer der Aktivsten im Projekt, um ein »intensives Lesen«, bei dem er jeden einzelnen Satz inhaltlich nachvollzieht. So kommt es, daß derzeit vorwiegend belletristische Werke angeboten werden, denn die Aussicht, sich z.B. mit Hegels »Phänomenologie des Geistes« auseinandersetzen zu müssen, wirkt eher abschreckend.

Die Wahl der Bücher wird außerdem durch die Technik eingeschränkt. Die Software erkennt nur die heute üblichen Antiqua-Schriften. Da in Deutschland bis in die dreißiger Jahre hinein die Frakturschrift vorherrschte, scheidet ein Großteil der antiquarischen Bücher als Vorlage aus, wenn sich niemand die Mühe macht, sie abzutippen. Daraus ergibt sich erneut ein Problem, weil auf jüngere Ausgaben zurückgegriffen werden muß, für die Herausgeber oder Verlage unter Umständen Urheberrechte reklamieren können.

Das Archiv bereitet Arbeit über die Digitalisierung der Texte hinaus. Zum einen müssen die eingesandten Texte der freiwilligen Helfer in das Textformat des World Wide Web überführt und zum anderen muß die Struktur des Archivs insgesamt übersichtlich gehalten werden. Zusätzlich zur unbezahlten Arbeit entstehen mit der Bereitstellung im Netz Kosten beim Provider. Daher sah sich Gunter Hille schon früh gezwungen, um Unterstützung zu bitten. Mit seinem Ansinnen stieß er jedoch auf Ablehnung und Unverständnis.

So verfolgen die Verlage das Projekt mit deutlicher Zurückhaltung. Die Idee, sich an dem Vorhaben zu beteiligen, könnte ihnen nicht ferner liegen. Beim Deutschen Klassiker Verlag sieht man das Verwertungsinteresse der Verlage im Netz nicht gewährleistet. Die kostenintensiv erarbeiteten Textfassungen der Klassiker umsonst zur Verfügung zu stellen, erscheint dort schlicht unsinnig. Auch der enzyklopädische Hang des Projekts Gutenberg wird, etwa von Seiten des Reclam-Verlags in Stuttgart, mißtrauisch beäugt: Muß es gleich der ganze Text sein? Täten es nicht auch Appetit-Happen?

Die Verlage nehmen das Projekt als Konkurrenz wahr. Ob sie damit richtig liegen, darf noch bezweifelt werden. Aber wozu soll das Archiv gut sein, wenn nicht zum Lesen? Zwar liegen die Zugriffszahlen für deutsche Verhältnisse sehr hoch, und die Bewertungen für die Seiten des Gutenberg-Projekts fallen regelmäßig überdurchschnittlich aus, aber über den tatsächlichen Nutzen, den Besucher aus der Sammlung ziehen, kann nur spekuliert werden. Und da fällt es selbst den Beteiligten schwer, sich vorzustellen, daß die bereitgestellten Bücher tatsächlich am flimmernden Bildschirm gelesen werden. Der fließende, knetbare Hypertext mit seinem Flattersatz, der sich in der Darstellung der Fenstergröße anpaßt, markiert einen allzu deutlichen Gegensatz zum Buch mit seinen übersichtlich angeordneten und beruhigend unveränderlichen Textportionen.

Es scheint eher vorstellbar, daß die Texte dem Stöbern und Anlesen dienen. Diesen Zweck können sie möglicherweise besser erfüllen als eine Buchhandlung, weil die Regale nie leer werden und ein bequemer Sitzplatz immer garantiert ist. Damit deutet sich an, welche Funktion das Projekt auch erfüllen kann, nämlich die einer öffentlich zugänglichen Bibliothek, in dem auch solche Autoren und Werke einen Platz finden, die sonst durch die Kosten-Nutzen-Rechnungen der Verlage außen vor blieben. Zudem können sich, sind die Texte erst einmal digitalisiert, andere Möglichkeiten des Gebrauchs ergeben, die auf den ersten Blick nicht absehbar sind. So entstand der Versuch einer Sprachausgabe über den PC, um die Bücher auch für Blinde zugänglich zu machen.

Privatwirtschaftliches Engagement und reges Interesse eines internationalen Nutzerkreises bilden einen starken Kontrast zur Reaktion von offizieller Seite. Die Bonner Ministerien, bei denen Hille um Unterstützung nachsuchte, halten die Geldsäckel fest verschlossen oder schieben die Zuständigkeiten weiter. So speiste das Bundesministerium für Forschung und Technologie (BMFT) den Bittsteller mit dem Hinweis ab, man kümmere sich um technische Projekte, er hingegen betreibe Geisteswissenschaften.

Die bemerkenswerte These des BMFT findet keine Zustimmung. So moniert der Hamburger Literaturwissenschaftler Klaus Bartels, daß die Texte nicht zitierfähig seien, also wissenschaftlichen Ansprüchen nicht genügten. Hille läßt dieser Einwand ungerührt, Literaturwissenschaftler hätten sich bei ihm bislang kaum gemeldet und als Informatiker könne er keine Textkritik leisten. Für ihn steht die pragmatische Forderung einer Übereinstimmung von Vorlage und digitalisiertem Text im Vordergrund.

Die Diskrepanz zwischen Enthusiasmus von privater Seite und öffentlicher Mißachtung irritiert; denn es handelt sich nur vordergründig um eine akademische Frage, ob sich mit dem Unterschied vom Online-Goethe zur Hamburger Ausgabe die Kluft zwischen Hypertext und linearem Text auftut. Kleinere Rechner haben, jetzt ausgestattet mit leistungsfähigen Prozessoren und ausreichend Speicher, schon vor längerer Zeit Taschenbuchgröße erreicht. Die Phantasie fordert nur noch die Ausstattung mit Funkmodem und kontrastreichen Bildschirmen, um damit ein Gerät zu entwerfen, daß sich in einer Form von Mimikry dem Gebrauch des Buches nähert: Aufschlagen und lesen. Wenn sich dann die Trennung der Software Text von der Hardware Buch als praktikabel herausstellt und nur noch mit der papiernen Gewohnheit brechen muß, kann der Umzug der Literatur von der Gutenberg- in die Turing-Galaxis (Wolfgang Coy) zu handgreiflichen Umwälzungen führen.

[1] http://gutenberg.aol.de/
[2] http://promo.net/pg/