Korrekturlesen zum Wissenserhalt

Posted on 5. Januar 2010

0



Der erste Januar war „Public Domain Day“. Übersetzen kann man dies als „Tag der Gemeinfreiheit“. Denn jeder erste Januar ist der Stichtag, an dem bestehende Urheberrechte verschiedenster Werke auslaufen können. In der Regel geschieht dasdann, wenn der Urheber bereits eine nicht geringe Zeit (70 Jahre) verschieden ist. Dann werden die Werke dieses Menschen gemeinfrei (engl.: public domain). Wer möchte, kann dies auch entsprechend feiern, wie z. B. die Schweizer Piraten es getan haben.

Aber was hat man denn nun genau davon, dass ein Werk, sagen wir ein Buch, gemeinfrei ist? Das bedeutet zunächst einmal, dass im Prinzip jeder damit machen kann, was er möchte. Vor allem auch, es zu vervielfältigen und es auf jede nur erdenkliche Weise unters Volk zu bringen.

Eine Variante davon dürfte nahezu jeder während der Schulzeit kennen gelernt haben: Reclams Universal-Bibliothek. Diese Buchreihe, über die noch heute Schüler an so manchen Klassiker herangeführt werden bestand zu Beginn ausschließlich und auch heute noch zu einem großen Teil aus gemeinfreien Werken, was neben der simplen Aufmachung maßgeblich mit dafür verantwortlich war und ist, dass diese Büchlein so billig sind.

Doch das ist nur einer von vielen Wegen, Bücher unters Volk zu bringen. Immer populärer wird seit einigen Jahren, neben den klassischen Wegen, auch das elektronische Buch. Zumal die entsprechenden Lesegeräte immer besser und immer günstiger werden.

Ein Projekt, dass letzteren Weg gewählt hat, ist das freie internationale Project Gutenberg (Achtung: nicht zu verwechseln mit einem deutschen kommerziellenProjekt  sehr ähnlichen Namens). Dieses möchte möglichst viele gemeinfreie Werke in verschiedenen Formaten der Allgemeinheit in elektronischer Form zugänglich machen. So weit so gut. Aber wie läuft so etwas ab?

In der Regel beginnt es mit einem ganz klassischen Buch. Dieses wird zunächst eingescannt. Das ist jedoch nur der erste Schritt, denn mit dem Ergebnis des Scannens kann noch kein Programm oder Lesegerät etwas anfangen. Das sind ja Bilder und die müssen erst noch in Text umgewandelt werden. Diese Umwandlung geschieht dann immerhin automatisch per Texterkennungs-Software. Doch dabei ergibt sich ein Problem.

So eine Software kann naturgemäß nicht perfekt arbeiten und alles richtig erkennen. Und diese Schwierigkeiten nehmen natürlich auch in dem Maße zu, in dem die optische Qualität des Ausgangsmaterials nachlässt. Vielleicht waren die Einstellungen beim Scannen oder der Scanner selbst nicht optimal. Vielleicht war das gescannte Buch auf Grund seines Alters schon recht mitgenommen. Woran auch immer es letzten Endes lag: das, was die Texterkennungs-Software als Ergebnis liefert, wird immer den ein oder anderen Fehler enthalten. Mal mehr, mal weniger. Und selbst, wenn sie es nicht täte: sicherheitshalber ist eh zu tun, was man wegen möglicher Fehler tun muss. Also müssen alle, wirklich alle Seiten Korrektur gelesen werden. Das ist eine Menge Arbeit.

Teile und herrsche...

Teile und herrsche... (gemeinfreies Bild aus den Wikimedia Commons)

Diese Arbeit lässt sich am einfachsten erledigen, wenn man sie aufteilt. Wenn viele Leute nur ein Paar Seiten lesen erhält man sehr schnell… moment… mal nachrechnen… Viel * ein Bisschen = mehr als Viel… also ungefähr sehr viel… also man erhält sehr schnell sehr viele Seiten. Mit recht wenig Aufwand für den Einzelnen.

Zu diesem Zweck wurde das Projekt Distributed Proofreaders ins Leben gerufen. Dabei wird genau das getan: das Korrekturlesen in kleinen Happen auf möglichst viele Leute verteilt. Dazu muss man sich natürlich beim Projekt anmelden, was aber recht schmerzfrei ist und einfach von statten geht. Nachdem man dies getan hat bekommt man Zugriff auf Texte, die sich aktuell in Bearbeitung befinden. Wenn man aus der Projektliste eines auswählt, um darin Korrektur zu lesen, bekommt man in einem Browserfenster zwei Dinge präsentiert. Zum einen das Bild, der eigescannten Seite, die einem zugeteilt wurde. Zum anderen in einem Editor das, was die Texterkennungs-Software daraus gemacht hat. Die Aufgabe ist es nun, beides zu vergleichen und dafür zu sorgen, dass Letzteres möglichst so aussieht wie ersteres. Klingt einfach und ist es in den meisten Fällen auch. Und für alle Probleme und Problemchen, die dabei auftreten können, gibt es ausführliche Hilfestellungen und Anleitungen.

So kann jeder mit äußerst geringem Aufwand dazu beitragen, dass gemeinfreie Werke erhalten bleiben und auch tatsächlich frei der Allgemeinheit zur Verfügung stehen. Sehr piratig.

Advertisements
Posted in: Allgemeines