Switch to the CitySwitch to the City

Computer lernen auf Spielwiese alte Schriften zu lesen

Kategorie: Startseite

Die Projektgruppe vom Institut für Mathematik der Universität Rostock: Tobias Strauß, Roger Labahn, Gundram Leifert und Tobias Grüning (v. l.), Foto: Universität Rostock, IT- und Medienzentrum / Julia Tetzke

Die Projektgruppe CITlab am Institut für Mathematik der Universität Rostock und die Schweriner Firma „Planet intelligent systems GmbH“, die gemeinsam die besten Software-Systeme für Schrift-und Handschriftlesung auf der Welt entwickeln, erhalten für ihre Schrifterkennung einen internationalen Preis. Die genauen Platzierungen wurden noch nicht veröffentlicht, sondern werden erst auf der  international wichtigsten Tagung zur Handschrifterkennung  Anfang September auf Kreta bekanntgegeben.

Die Mathematiker  aus Rostock und die Praktiker aus Schwerin machen sich jetzt in einem weiteren, neuen Forschungsprojekt gemeinsam daran, handgeschriebene Texte aus dem europäischen Kulturerbe zu entschlüsseln. Es handelt sich dabei um  historische Schriften, die zwischen 1500 bis 1800 entstanden sind, geschätzt sind das fünf bis zehn Milliarden DIN A-4 Seiten. „Das Papier droht zu zerfallen, deshalb werden die Texte zunächst gescannt“, erläutert Planet-Chef Welf Wustlich, der an der Universität Rostock Physik studierte und gemeinsam mit Bruder Hagen, einem Betriebswirtschaftler, die 30-köpfige Firma in der Landeshauptstadt leitet.

Jetzt wollen  die Forscher  und Praktiker ihre bereits entwickelte Technologie, die nachrüstbar ist, auch bei der Dokumentenanalyse einsetzen.  Die Voraussetzungen könnten besser nicht sein:  Die vorliegende Software  identifiziert Adressdaten inzwischen bestens. Sie erkennt und analysiert sowohl gedruckte als auch teilweise handgeschriebene Adressen und unterscheidet automatisch zwischen dem Adressblock des Absenders und des Empfängers. Vor welchen Aufgaben stehen aber nun Forscher und Praktiker? Die entwickelte Software bildet vereinfacht die Struktur und Funktion eines Gehirns nach, sie kann aus Beispielen lernen, ähnlich einem kleinen Kind, das lesen lernt. Aktuell  beschreiben Welf Wustlich und Uni-Privatdozent Dr. Roger Labahn die Aufgabe so:  Um in einem Haufen gescannter Bilder ähnlich wie bei Google etwas suchen zu können, muss der Computer vorher Texte finden und entschlüsseln. Das Problem jedoch bei historischen Texten: Der Computer muss die Sprache verstehen, Satzkonstruktionen kennen, wissen, was Adverb und Prädikat sind, kurzum ein Sprachgefühl aufbauen. „Das bringen wir dem Computer bei“, ist Welf Wustlich überzeugt. Er arbeitet seit zehn Jahren gemeinsam mit den Mathematikern der Universität Rostock an verschiedenen Themen der Schrift- und Spracherkennung.  Sowohl die Theoretiker als auch Praktiker hätten es in dieser Zeit gelernt, „effektiv zusammenzuwirken“. Schon mehrfach sind beide Seiten in der Vergangenheit zu neuen Ergebnissen gekommen. „Wenn unsere Arbeit in ein Produkt mündet, empfinden wir eine starke Motivation, die weit über das Akademische hinausgeht“, beschreibt Dr. Labahn das Engagement seines Teams.

Der Schlüssel für das aktuelle Forschungsthema sind so genannte Künstliche Neuronale Netze. Das sind technische, mathematische Strukturen, die dem menschlichen Hirn nachempfunden sind und es vermögen, aus großen Datenmengen zu erlernen, neue Bilder zu lesen. Damit das funktioniert, haben  die Forscher der Universität  für die Praktiker Algorithmen entwickelt und in Testszenarien implementiert.  „Man zeigt dem Neuronalen Netz immer wieder Wörter und Sätze in verschiedenen Schriftarten und sagt dem Computer,  was da steht“, sagt Roger Labahn. Das kann zwei Tage, jedoch auch bis zu zwei Monate dauern“. „Der Computer ist aber sehr lernfähig“. Wie? „Wir lernen für die neue Aufgabe mit dem Computer nicht nur einzelne Worte, sondern ganze Sätze“, sagt Welf Wustlich. In der Hoffnung, dass „der Computer schlau ist“, werde sein Gehirn künstlich designt, also Neuronen miteinander verbunden.  Der Computer bekommt eine „Spielwiese“, die aus historischen Dokumenten besteht und dort wird ihm im Trainingsmodus aus alten Schriften vorgelesen. Immer und immer wieder.  Im Anwendungsmodus muss er schließlich alleine lesen können. Das soll er in zwei Jahren  können. Dabei kommt der Universitätsbibliothek Rostock eine Schlüsselrolle zu. Sie bereitet die so genannte Spielwiese mit vor und  rüstet  am Ende die Datenbanken so auf, damit Nutzer auch von zu Hause aus in ältesten Beständen, die jetzt nicht zugänglich sind, recherchieren können. In der Universitätsbibliothek liegen derzeit noch über 500 000 Kärtchen aus den Jahren 1851 bis 1959 brach, die Dank des Projektes dann auch elektronisch katalogisiert und somit gelesen werden können.

Das Bundeswirtschaftsministerium  fördert diese  Forschung an der Universität Rostock über das Zentrale Innovationsprogramm Mittelstand (ZIM) mit über 300 000 Euro.

Text: Wolfgang Thiel

Kontakt: Dr. Roger LabahnMathematisch-Naturwissenschaftliche FakultätInstitut für MathematikTel.: +49 381 498-6631E-Mail: roger.labahn(at)uni-rostock.de

Authors: Universität Rostock

Lesen Sie mehr http://www.uni-rostock.de/aktuelles/alle-meldungen/detailansicht-der-news/news-artikel/computer-lernen-auf-spielwiese-alte-schriften-zu-l/

  • Autor
  • Das neuste vom Autor
  • Video
  • Galerie
Anzeigen
zum Seitenanfang
JSN Boot template designed by JoomlaShine.com