Handschriftenerkennung für Linux

Spracherkennung und Handschriftenerkennung waren bislang den Anwendern proprietärer Produkte vorbehalten.

Zumindest für die Umwandlung von Handschriften in Maschinen-Text existiert jetzt auch eine quelloffene Alternative. CellWriter unterstützt die gängisten Linux-Desktops, wie etwa Debian. Das Projekt leitet Michael Levin, Student an der University of Minnesota.

Auch die Bedienung der Software läuft einfach. In Eingabgegräten, wie etwa einem Tablet, kann man einen Text in ein Fenster hineinschreiben. Über einen Befehl wandelt das Programm die Handschrift in Maschinentext um.

Allerdings muss man zunächst mit der Software trainieren. Denn die Packages: libxtst6, libgtk2.0-0 und libgnome2-0 kommen ohne jegliche Beispiele. Ein Knopfdruck auf ‘Train’ und das Training beginnt. Zeigt die Software bei bestimmten Buchstaben öfter Fehler an, so lassen sich für diese mehrere Varianten eingeben. Je öfter man die Software trainiert, desto besser wird natürlich die Erkennung. CellWriter zeigt die Buchstaben, die bereits trainiert wurden über unterschiedliche Farben an.

Zudem lassen sich die einzelnen Zellen, in die ein Buchstabe eingegeben wird, konfigurieren. Etwa die Stärke der Eingabe. Erkennt die Software dennoch nicht den richtigen Buchstaben, so lässt der sich über Rechtsklick in die Zelle einfügen. Über eine so genannte On-Screen-Tastatur lassen sich zusätzlich bestimmte Tasten drücken.

Neben der lateinischen Schrift unterstützt CellWriter etwa Kyrillisch, Thai sowie auch das internationale phonetische Alphabet. Derzeit sei es für asiatische Nutzer jedoch sehr schwer, mit der Software zu arbeiten, gibt Levin zu. Er hofft nun auf Mitstreiter für sein ehrgeiziges Projekt, die ihm bei der weiteren Entwicklung zur Seite stehen.

Entwickler Levin verteidigt seinen Ansatz, jeden Anwender zunächst mit der Software trainieren zu lassen. Jeder Mensch besitze seine eigene Handschrift. Eine vorgefertigte Erkennung, basiere daher auf einem sehr kleinen gemeinsamen Nenner. In seinem Modell lerne die Software die Handschrift jedes Anwenders in einem Trial-and-Error-Verfahren von Grund auf.