Saarbrücker Forscher bauen Wortschatzdatenbank auf
Computer aktualisiert Wörterbuch

Saarbrücker Linguisten haben ein computerbasiertes Verfahren entwickelt, mit dem ein Wörterbuch automatisch aktualisiert werden kann. Manfred Pinkal, Computerlinguist an der Universität des Saarlandes, und das Forscherteam der Firma CLT Sprachtechnologie haben mit dem Verfahren erstmals die Neuauflage des Wörterbuchs "Wahrig. Die deutsche Rechtschreibung" erstellt.

DÜSSELDORF. Dabei wurde der Computer mit deutschsprachigen Artikeln aus Zeitschriften und Zeitungen gefüttert, wobei Filter alle Doppelungen, Verschreiber, Zahlen und Eigennamen eliminieren. Interessant wird das Computerprogramm vor allem dadurch, dass es Wörtern die Wortarten selbstständig zuordnen kann. Das bietet auch Potenzial für automatische Korrekturen: Bisherige Rechtschreibprüfungen am Computer kranken daran, dass der Rechner zum Beispiel Substantive von Verben nicht unterscheiden kann. "Wir besitzen schon jetzt ein brauchbares Grammatikkorrektursystem", sagt Pinkal. Bis es allerdings hundertprozentig genau arbeitet, könnten noch Jahre vergehen, räumt Pinkal ein.

Für das Saarbrücker Forschungsteam bestand eine große Überraschung in der Erkenntnis, wie viele Neuwörter es noch gibt. "Wir haben gedacht, wir müssten neue Wörter mit der Lupe suchen, doch wir sind von dem Bestand der neuen Wörter geradezu erschlagen worden", sagt Pinkal. 1,5 Millionen neue Wörter haben die Forscher im gesamten Korpus entdeckt. 5 000 interessante Wörter haben die Forscher mit statistischen Verfahren ausgewählt. 1 100 Wörter hiervon nahm der Verlag in die Neuauflage auf. Insgesamt umfasst die Textwörterdatenbank mittlerweile 500 Millionen Einträge.

Bei den Neuzugängen handelt es sich nicht nur um Wörter aus dem Englischen. Neben "Beamer" oder "Cheerleader" haben sich manche deutsche Neubildungen durchgesetzt. So kam etwa Mitte der 90er-Jahre das Verb "schwächeln" auf - zunächst nur im Sport. Mittlerweile "schwächelt" alles: Schüler, Aktien oder auch die Wirtschaft allgemein.

Die Forscher wollen mit ihrer riesigen Wortschatzdatenbank jedoch nicht nur Wörterbücher aktualisieren, sondern denken schon einen Schritt weiter. So könnte die Datenbank als Basis für einen Sprachassistenten für ausländische Mitbürger genutzt werden.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%