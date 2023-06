Düsseldorf Vor einigen Monaten stockte Yu Takagi der Atem. Die Fotos auf seinem Bildschirm wirkten so überzeugend. Der japanische Forscher ging ins Badezimmer, schaute in den Spiegel und dachte: „Okay, das Spiegelbild sieht normal aus. Vielleicht werde ich doch nicht verrückt.“

Der Grund für die Bestürzung: Ein KI-Modell hatte die Gehirnsignale von Testpersonen in Bilder übersetzt – und die glichen erstaunlich den vorher angeschauten Fotos. „Das hätte ich wirklich nicht erwartet“, sagt der Neurowissenschaftler und angehende Professor an der Osaka-Universität.

„Neuronal Decoding“ nennt sich das Wissenschaftsgebiet. Künstliche Intelligenz (KI) kann anhand der Gehirnaktivitäten von Menschen nicht nur zuvor gesehene Bilder, sondern auch gehörte Musik oder Sprache rekonstruieren. „Der Fortschritt ist exponentiell“, sagt Sead Ahmetovic, Chef von We Are Developers, Europas größter Entwicklerplattform.

Überall in der Welt erzielen nicht nur Informatiker und Neurowissenschaftler immer mehr Verbesserungen an dem Verfahren. Auch Start-ups wie Neuralink oder Kernel und Tech-Konzerne mischen mit – auch wenn kommerzielle Anwendungen noch weit in der Zukunft liegen. Es geht um die ultimative Kommunikation zwischen Mensch und Maschine.

Takagi wurde nach Veröffentlichung seiner Studie im September 2022 förmlich mit Anfragen überschüttet. Vor allem Marketingfirmen wollten mithilfe der Technologie erforschen, wie gut ihre Werbung ankommt. Auch seien Rüstungsunternehmen dabei gewesen, erzählt der Japaner. Aber: „Das geht aus ethischen Gründen nicht, jeder muss mit einer Untersuchung einverstanden sein – auch wenn es der Feind ist.“

Oben die Bilder, die sich Versuchsteilnehmer angesehen hatten. Unten das, was die Maschine aus den Hirnsignalen der Probanden herausgelesen hat. (Foto: MS COCO dataset/Flickr) Experiment von Yu Takagi

Das Interesse der Unternehmen oder Risikokapitalgeber an Takagis Studie mit dem Titel „High-resolution image reconstruction with latent diffusion models from human brain activity“ ist verständlich angesichts der vielen potenziellen Anwendungsbereiche.

Die „Hochauflösende Bildrekonstruktion“ von Gehirnaktivitäten führten Takagi und sein Kollege Shinji Nishimoto mit dem Programm Stable Diffusion durch, das an der LMU München entwickelt und von dem englischen Start-up Stable AI auf den Markt gebracht wurde.

„Ich bin überrascht, was für unterschiedliche Anwendungen mit Stable Diffusion gemacht werden“, sagt Björn Ommer, Professor für Informatik an der LMU München. Das Deep-Learning-Modell ist vor allem dafür da, aus Texteingaben Bilder zu generieren. Takagi und sein Kollege haben eine Art Übersetzer vor Stable Diffusion gesetzt, der die Hirnsignale für die KI verständlich macht. „Es kann sicherlich keine Gedanken lesen“, sagt Ommer. „Aber es ist spannend, dass es funktioniert.“

Gehörte Sprache rekonstruieren

So aufregend die Ergebnisse sind, so liegt doch vieles noch im Unklaren. „Wir wissen nicht, wie das Gehirn Formen oder Farben genau erstellt“, sagt Thirza Dado, kognitive Neurowissenschaftlerin an der Radbout-Universität in Nimwegen. „Aber die KI wird immer besser darin, die Muster zu erkennen.“

Niemand weiß bis ins letzte Detail, was sowohl im Gehirn als auch in den neuronalen Netzen vor sich geht – aber die Ergebnisse sind einfach gut. So ließen in einer vor wenigen Tagen veröffentlichten Studie Forscher der University of Texas drei Freiwillige 16 Stunden lang Podcasts und längere Radiobeiträge hören. Die vom MRT ausgelesenen Signale wertete ein Sprachmodell aus.

Die Neurowissenschaftlerin forscht in den Niederlanden. (Foto: Privat) Thirza Dado

Der Transformer – eine KI ähnlich der von ChatGPT von OpenAI oder Bard von Google – konnte anhand der Muster die Gehirnsignale nicht immer fehlerfrei, aber doch erstaunlich akkurat decodieren. So hatte beispielsweise ein Teilnehmer den Satz „Ich habe noch keinen Führerschein“ gehört. Bei der KI las sich das so: „Sie hat noch einmal angefangen, das Fahren zu lernen.“

Als Schülerin wurde Thirza Dado gefragt, was sie später einmal machen wolle. „Ich möchte eine Traummaschine bauen“, sagte sie 2008 mehr aus Spaß. Heute ist die 30-Jährige dieser Vision näher, als sie es jemals gedacht hätte. Sie forscht im Neural Coding Lab der Radbout-Universität und rekonstruiert wie ihr Kollege Takagi in Japan mit KI-Modellen Bilder.

Das Experiment von Thirza Dado: Die erste Zeile zeigt das tatsächliche Foto, die beiden weiteren Zeilen das, was die KI aus den Hirnströmen der Teilnehmer gelesen hat. (Foto: Thirza Dado) Erinnerungen an Gesichter

Das Neural Coding Lab unter Leitung von Dr. Umut Güclü wendet das Verfahren bereits bei der Rekonstruktion von gesehenen Filmen an. Der nächste Schritt wäre es, die von Menschen nur vorgestellten Bilder zu rekonstruieren. Danach könnte man rein theoretisch Träume aufzeichnen und auswerten. Das liegt laut der Forscherin noch in weiter Zukunft. Aber selbst wenn es gelänge, wüsste man wahrscheinlich nie genau, ob es wirklich unsere Träume waren.

Die Gehirnaktivitäten messen die Neurowissenschaftler mit einem sogenannten fMRT – dem „funktionellen Magnetresonanztomografen“. Wenn das Gehirn in bestimmten Bereichen aktiv wird, braucht es Sauerstoff. Blut fließt in diese Bereiche, und dessen Bewegung verfolgen die Forscher anhand des Eisens, das sich in roten Blutkörpern findet. „Eine direkte Messung der neuronalen Aktivitäten durch ein Implantat würde zu viel genaueren Ergebnissen führen“, sagt die Doktorandin. „Aber das ist noch sehr gefährlich für den Menschen.“

Elon Musks Neuralink macht klinischen Test

Allerdings könnten manche Menschen bereit sein, das Risiko in Kauf zu nehmen, wenn sie beispielsweise an Amyotropher Lateralsklerose (ALS) leiden. Das ist eine unheilbare, schwere Erkrankung des Nervensystems. Vor wenigen Tagen erhielt Neuralink, die von Tesla-Chef Elon Musk 2016 gegründete Biotechfirma, von der US-Gesundheitsbehörde die Genehmigung für einen klinischen Test für ein Implantat – ein großer Schritt, der bislang noch keinem Biotechunternehmen gelang.

Neuralink will dem Patienten ein sogenanntes „Brain Computer Interface“ (BCI) einsetzen. Das „Hirn-Computer-Interface“ heißt N1 und belauscht an 1024 Punkten die elektrischen Signale der Nervenzellen – oder regt sie umgekehrt mit elektrischen Impulsen an.

Das N1 hat einen Durchmesser von rund 2,5 Zentimetern und arbeitet drahtlos. Seit 2019 laufen bereits Versuche mit Makaken, die Affen können beispielsweise mit einem BCI ein Pingpong-Videospiel steuern. Allerdings warnt Professor Ommer, auch: „Neuralink ist führend in der PR-Kommunikation, aber nicht unbedingt in der wissenschaftlichen Forschung.“

Der chirurgische Eingriff birgt Gefahren, die der Forscher bei gesunden Menschen für nicht akzeptabel hält. Daher arbeiten viele Firmen und Forscher an neuen Sensoren und Technologien, die Gehirnaktivitäten mit weniger Aufwand messen können. Beispielsweise die „Nahinfrarotspektroskopie“, bei der die Testpersonen nur eine Art Kappe tragen, die mit dem Computer verbunden ist.

Was denkt Katze Lolo?

Es wird nach Ansicht von Takagi von der Osaka-Universität noch mindestens ein Jahrzehnt dauern, bis kommerziell anwendbare Verfahren zu erwarten sind.

Eine Hoffnung des 34-Järigen: die Gehirnaktivitäten von Tieren zu entschlüsseln. „Ich würde schon gern wissen, was für Bilder meine Katze Lolo im Kopf hat, wenn sie mich sieht“, sagt Takagi. Seine Hoffnung: Lolo sieht sein Gesicht, so, wie es ist. Seine Befürchtung: Die KI zeigt einen Leckerbissen.

