Spracherkennung
Computer lernen Lippenlesen

Lippenlesen ist eine Kunst, die nur von wenigen Menschen wirklich perfekt beherrscht wird. Deswegen arbeiten Wissenschaftler an Computern, die das übernehmen sollen. Doch die Herausforderungen sind groß.

BerlinWas wäre, wenn die Bilder einer Überwachungskamera ausreichen würden, um die Worte eines Verdächtigen zu verstehen? Wenn Piloten im Rauschen des Cockpits lautlose Befehle geben könnten? Die Technik dafür erhoffen sich Forscher von Computern, die von den Lippen lesen können. Doch trotz großer Fortschritte sind die Maschinen noch nicht praxistauglich.

„Ein solches System könnte für eine ganze Reihe von Anwendungen benutzt werden“, sagt Helen Bear von der britischen University of East Anglia. Die Informatikerin und ihr Team haben ein Programm entwickelt, das ihrer Studie zufolge deutlich bessere Ergebnisse als bisherige Ansätze liefert – für eine Anwendung unter realen Bedingungen reicht es aber noch nicht.

Die Krux: Auf den Lippen sehen viele Töne praktisch gleich aus. Computer müssen lernen, die feinen Unterschiede zu interpretieren, die Menschen verborgen bleiben. Dafür braucht es kluges Training. „Die Sprache sieht bei uns allen unterschiedlich aus, also brauchen wir Modelle, die bei jedem funktionieren“, sagt Bear.

Schon 1968 beschrieb der Science-Fiction-Klassiker „2001: Odyssee im Weltraum“ die Idee: Der Supercomputer HAL 9000 liest im Film heimlich die Lippenbewegungen von Astronauten durch eine Scheibe. Sie hatten sich eingeschlossen, damit er ihre Pläne nicht mitbekommt. „Das zeigt, wie alt das Thema ist“, sagt Tanja Schultz, Professorin für Kognitive Systeme an der Universität Bremen.

Wie hängen Video und Audio zusammen?

Das klassische Vorgehen: Der Computer identifiziert auf einem Video den Bereich der Lippen. Während der Sprecher redet, nimmt das Programm Aussehen und Abfolge der Bewegung (Viseme) sowie die geäußerten Laute (Phoneme) auf. Im dritten Schritt wird es mit einem statistischen Modell trainiert: Wie hängen Video und Audio zusammen?

Diese Lernstrategien sind ein entscheidender Teil der Forschung. „Menschen können durch gutes Training gut Lippen lesen, aber sie sind nicht perfekt“, sagt Schultz.

Die Laute p, b und m etwa sind auf den Lippen fast nicht zu unterscheiden. Daher braucht das Programm mehr Informationen: Die vorhandenen Wörter einer Sprache schränken die möglichen Phonemketten schon ein. Weitere Hinweise geben erlaubte Satzkonstruktion und Sinn der Aussage.

Hilfreich, fast schon unerlässlich: eine Datenbank mit Zusammenhängen von Audio und Text. Ein menschlicher Lippenleser kennt Ausdrücke und Redewendungen seiner Sprache und den Kontext einer Unterhaltung – für Computer ist das schwieriger.

Seite 1:

Computer lernen Lippenlesen

Seite 2:

Lautlose Passwörter als Ersatz für die PIN

Serviceangebote
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%