Was mit digitalen Sprachsystemen bald alles möglich ist
Das Handy als Reiseführer

Computer können alles. Alles? Nicht ganz, denn mit dem Sprechen hapert es in den meisten Fällen noch. Und das, obwohl Spracherkennungs- und Sprachsoftware für PCs eigentlich ein alter Hut sind.

ddp HANNOVER. Computer können alles. Alles? Nicht ganz, denn mit dem Sprechen hapert es in den meisten Fällen noch. Und das, obwohl Spracherkennungs- und Sprachsoftware für PCs eigentlich ein alter Hut sind, so alt, dass Experte Wolfgang Karpstein vom Branchenriesen IBM in Stuttgart darüber am liebsten gar nicht mehr reden mag. Seit mehr als 30 Jahren beschäftigt sich sein Unternehmen, bei dem er als Manager für den Bereich Voicesystems verantwortlich ist, mit dem zuhörenden und sprechenden Heimcomputer, der Gesprochenes speichert und selbst auch Texte vorliest. "Das Thema ist durch", winkt Karpstein ab, «da gibt es nichts wirklich Neues mehr". Kein Wunder bei einer inzwischen erreichten Sprach-Erkennungsquote zwischen 98 und 99 Prozent.



Doch die Zukunft der digitalen Sprachverarbeitung liegt seinen Worten nach ganz woanders. "Internet-basierte Multichannel-Architektur", nennt es Manager Karpstein und schwärmt von den baldigen Vorzügen dieser Technik. Beispiel E-Mails: "Sie rufen von unterwegs per Handy einfach ihren Mail-Server an, der ihnen dann prompt die neueste Post vorliest", freut sich Karpstein über die Entwicklung. Wer wolle, könne dann auch gleich die Mails beantworten - indem er diktiert, versteht sich. Nur die Adressierung neuer E-Mails macht Karpstein noch Sorgen. Bislang lassen sich telefonisch nämlich nur Nachrichten an bereits im Adressbuch gespeicherte Empfänger versenden. Das Aufsprechen neuer E-Mail-Adressen ist wegen der oft komplizierten Aussprache noch zu schwierig für das System. "Noch", wie Experte Karpstein mit hochgezogenen Brauen betont. "Aber das kann sich bald ändern".



Die Zukunft seiner Branche sieht Karpstein in den so genannten "Voice-Portalen" im Internet, die dem Anwender wiederum über Handy beispielsweise die neuesten Börsen- und Weltnachrichten vorlesen. IBM setzt voll auf diese Technologie, für die man bereits im Jahr 2005 über zwei Milliarden Nutzer erwartet. Der Manager glaubt, dass viele Voice-Portale dem Nutzer dann vor allem individuelle Dienstleistungen bieten werden - beispielsweise als telefonischer Reiseführer im Urlaub, der durch genaue Ortung erkennt, vor welcher Sehenswürdigkeit sich der Nutzer gerade aufhält, und der ihm dann automatisch die wichtigsten Fakten zu Monument, Gebäude oder Kunstwek vorliest.



Etwas pessimistischer sieht Karpsteins Prognose in Sachen Spracherkennung bei mobilen Organizern aus. Das Ziel, diesen in naher Zukunft ein komplettes Diktierprogramm für E-Mails einzupflanzen, bewertet der IBM-Manager als eher unrealistisch. Dafür bräuchte man wie bei den großen Rechnern einen Chip, der eine Million Wörter erkennt, und einen Pentium-III Prozessor, der allerdings für die kleinen Handheld-Computer noch nicht zu haben ist. "Und das wird noch eine ganze Weile so bleiben", ist der Fachmann absolut sicher.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%