Sprechende Portale für schnelle Informationen aus dem Netz
„Das menschlichste Computer-Sprachdialogsystem"

Für schnelle, gezielte Informationen ist das Internet manchmal schrecklich langsam. Erst muss der PC gestartet werden, dann Browser und Online-Verbindung. Ist die Web-Site der Kino- oder Telefonauskunft gefunden, muss man sich noch durch mehrere Eingabefelder hangeln, bis die gewünschten Daten gefunden sind. "Wir wählen den komfortableren Weg und machen es möglich, dass Informationen aus dem Internet am Telefon abgerufen werden können", sagt der Gründer und Vorstandsvorsitzende der Clarity AG, Christoph Pfeiffer.

WiWo/ap FRANKFURT/M. Auf der in der Cebit in Hannover will Clarity-Chef Pfeiffer "das menschlichste Computer-Sprachdialogsystem der Welt" vorstellen (Halle 27, Stand F01/1). Mit dem Einsatz von IBM-Bausteinen für die Sprachtechnologie hat das Unternehmen aus dem hessischen Bad Homburg die vollständige Kette zwischen Telefon und Internet abgebildet:

1) Zuerst ruft der Nutzer beim Sprachportal an und kann nach dem Begrüßungstext seine Frage in freier Umgangssprache stellen. Dabei reiche es, wenn das Spracherkennungssystem etwa 80 Prozent verstehe, erklärt IBM-Fachmann Steffen Güntzler. "Um eine Datenbankabfrage auslösen zu können, müssen nur die Schlüsselbegriffe verstanden werden." Diese Begriffe wurden von Sprechern unterschiedlicher Dialekte aufgenommen und in das Spracherkennungssystem eingespeist.

2) Die Spracherkennung des angerufenen Sprachportals wandelt die gesprochene Sprache in Text um.

3) Der Text wird analysiert und für die Abfrage bei der Datenbank vorbereitet. Entscheidend ist dabei, in welchem Kontext die Begriffe auftauchen - das System soll auch so schwierige Aufgaben wie die Frage "Wie wird das Wetter in Wetter?" - also der Stadt an der Ruhr - bewältigen.

4) Das Sprachportal füttert die Internet-Datenbank mit den Schlüsselbegriffen und empfängt die auf die Anfrage passenden Daten. Für das "Voice User Interface" (VUI) kommt als zentrales Dateiformat VoiceXML zum Einsatz, eine auf die Sprachtechnologie angepasste Version von XML, dem künftig wohl wichtigsten Standard für die digitale Darstellung von Daten.

5) Die XML-Daten werden vom Sprachausgabesystem, dem "Text-to-Speech-Engine", in Sprache umgewandelt. Statt einer scheppernden Computerstimme im Stil des Computers im "Raumschiff Enterprise" wird eine möglichst menschlich wirkende Stimme erzeugt.

6) Der Anrufer hört die Antwort am Telefon.

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%