Noch Mühe mit der Handschrift
Neue Texterkennung für PC und Mac

Der Softwarespezialist Readiris will sich kein X für ein U vormachen lassen. Eine Erkennungsrate von mehr als 99 Prozent verspricht der Anbieter bei der neuen Version seines gleichnamigen Texterkennungsprogrammes.

HB FRANKFURT. In Verbindung mit einem Scanner wandelt das nützliche Werkzeug gedruckte Vorlagen in kürzester Zeit zum Archivieren oder Weiterbearbeiten in digitale Texte um - pro Sekunde erkennt die Software bis zu 1 600 Zeichen.

Die Schnittstelle zum Scanner ist schnell eingerichtet. Readiris sucht bereits bei der Installation, ob es einen Twain-Treiber für einen Scanner gibt. Danach kann man den Scanvorgang direkt aus Readiris starten. Anschließend stellt die Software verschiedene Optionen zur Wahl, um etwa einen kontinuierlichen Text zu erzeugen oder das Originalformat mit Spalten beizubehalten. Hier kann man auch einstellen, ob die im Scan enthaltenen Grafiken eingeschlossen werden sollen. Schließlich wird das Ausgabeformat gewählt. RTF eignet sich am besten für die Weiterverarbeitung in einem Textprogramm. Außerdem stehen HTML, der Zeichensatz Unicode und PDF zur Verfügung.

Gedruckte Texte erkennt Readiris schnell und fast fehlerfrei. Im Test mit einem dreispaltigen Zeitungstext tauchten sieben falsch erkannte Buchstaben auf, was bei 2 752 Zeichen eine Erkennungsrate von 99,75 Prozent bedeutet. Die falsch interpretierten Zeichen sind schnell korrigiert - so wird gern einmal ein „n“ als „h“ gelesen oder ein „v“ als ein „y“. Da das OCR-Verfahren (Optical Character Recognition) in der Version elf noch einmal verbessert wurde, lässt sich Readiris kein X für ein U vormachen.

Wenn das Spaltenformat bei der Texterkennung beibehalten wird, kann es etwas Korrekturbedarf bei der Worttrennung geben. Der Ausgabetext wird an die Standardseitenbreite des Textverarbeitungsprogramm angepasst, was meist andere Spaltenbreiten ergibt. Daher löscht man am besten alle Trennzeichen und lässt dann die Silbentrennung über den Text gehen, um einen sauberen Blocksatz zu erstellen.

Erstmals versucht sich Readiris auch an handschriftlichen Texten - allerdings zunächst mit bescheidenem Erfolg. Selbst wenn man sich alle Mühe gibt und wie verlangt in Blockschrift schreibt, wird nur etwa jeder vierte Buchstabe erkannt, was für eine sinnvolle Nutzung zu wenig ist. Bei einer weiteren Neuerung arbeitet Readiris verlässlicher: Die Software kann erstmals als Strichcode-Scanner eingesetzt werden und die in den waagrechten Balken verschlüsselten Daten in Klartext ausgeben. Die Unternehmensversion von Readiris setzt die Strichcode-Technik ein, um die erfassten Texte mit einem transparenten Code zu belegen und so für einen Index vorzubereiten.

Weiter ergänzt wurde die Sprachunterstützung der Texterkennung, die jetzt mit Texten in 123 Sprachen umgehen kann - darunter optional auch Hebräisch, Japanisch, Chinesisch und Koreanisch. Explizit unterstützt wird erstmals auch das Schweizer Deutsch.

Readiris elf gibt es für Windows (von 98SE bis Vista) ebenso wie für den Mac (ab OS X). Die Software kostet im Online-Handel 90 bis 130 Euro.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%