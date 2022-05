„Wer zu spät kommt, den bestraft das Leben“, soll der ehemalige sowjetische Präsident Michail Gorbatschow 1989 gesagt haben. Ein Satz, der Wladimir Putin derzeit durchaus zu denken geben könnte. Das Gegenteil kann aber auch stimmen: Wer zu früh kommt, den bestraft das Leben – zum Beispiel in der weitreichenden Ablehnung durch Kundschaft oder Zielgruppe.

So erging es Google vor knapp zehn Jahren, als der Technologiekonzern mit „Google Glass“ die erste Brille auf den Markt bringen wollte, die ans Internet angeschlossen war. Bevor die Markteinführung richtig starten konnte, wurde das Produkt zum Rohrkrepierer. Datenschützer wehrten sich gegen die Einführung der Brille, mit der Trägerinnen und Träger ihre Umgebung ausspähen konnten, ohne dass das Gegenüber das mitbekam. Wer die Google-Brille trug, wurde symbolisch zum „Glasshole“.

Ganz am Schluss seiner jährlichen Entwicklerkonferenz I/O präsentierte Google nun eine weitere Brille. Das neue Modell hat noch keinen Namen, offenbar keine Kamera und sieht aus wie eine normale Brille. Aber sie kann Unterhaltungen simultan in andere Sprachen übersetzen. In einem Demovideo redet eine ältere Frau mit ihrer Tochter, die eine spricht Mandarin, die andere Englisch. Und sie verstehen sich.

Das mag überraschen, aber dahinter steckt eine spannende Strategie. Die Wiederbelebung der Brille ist ein Indikator dafür, wie Google die Zukunft der Mensch-Maschine-Kommunikation sieht – als permanenten Austausch, der das Leben leichter macht.

In der Fachsprache heißt das „Ambient Computing“. Mithilfe von Künstlicher Intelligenz kommunizieren smarte Agenten in Brillen, Lampen, Lautsprechern, ja ganzen Beleuchtungs-, Heizungs- und Energieversorgungssystemen naht- und bruchlos mit den Menschen in ihrer Umgebung. Und wir interagieren friktionslos mit den Maschinen, die unser Leben durch Information, Übersetzungen, Licht und Musik anreichern.

In dieser Vorstellung steckt die Zukunftsvision von Googles wichtigstem Geschäft, der Internetsuche. Zum einen wird sich die Eingabemaske verändern, in die wir heute den Suchbegriff eintippen. Sie wird irgendwann durch einen künstlichen intelligenten virtuellen Gefährten ersetzt werden, der rund um die Uhr verfügbar ist, um auf unsere Bedürfnisse und Wünsche zu reagieren, und zwar, ohne dass wir sie konkret aussprechen oder eintippen müssen. Blicke, Bewegungen, Verhaltensmuster, sie alle werden Teil einer Berechnung für einen perfekt personalisierten Service, der jedem Einzelnen jederzeit Unterstützung darin bietet, was er oder sie gerade braucht.

Zum Zweiten wird diese in den Alltag integrierte „Umgebungssuche“ die Konsumwelt verändern. Ein Beispiel: Auf der Suche nach einem Kleid für eine Hochzeitsparty kann ich dann in Text, Sprache oder Bildern das Gefühl beschreiben, das mir das Kleid geben soll und das ich auf der Party ausstrahlen möchte.

Google macht mir dann ein Angebot, das ich so lange verändern und anpassen kann, bis das Kleid gefühlsmäßig passt. Größe oder Schnitt sind erst mal egal, denn dieses Kleid wird dann auf Basis meiner bevorzugten Stile und Körpergröße überhaupt erst produziert.

Je besser diese KI-Sprachmodelle werden, desto leichter und intuitiver wird es für Menschen

Hier geht es also um weit mehr als eine Internetsuche. Es geht um die personalisierte Kreation und Herstellung neuer Produkte, die eine angereicherte intelligente Suche für uns erschaffen hat - von der Haute Couture zur Haute Creature.

Wenn uns das alles vorkommt wie eine Szene aus dem Hollywood-Film „Her“ aus 2013, dann deshalb, weil es genau das ist. Nicht mehr nur Joaquin Phoenix spricht dann mit seinem Operating System (das durch die Stimme von Scarlett Johansson tatsächlich zum Verlieben ist). Wir können das auch.

Was 2013 technisch als reine Science-Fiction rüberkam, rückt nun realistisch näher. Die rasante Entwicklung von Natural Language Processing - die Analyse natürlicher Sprache - als eine Ausrichtung von Machine Learning im Feld der Künstlichen Intelligenz macht das möglich. Google lässt diese Variante des Machine Learnings über den Tensor Flow Chip direkt auf seinen Geräten laufen, ob Smartphone, Google Home oder das neueste Modell der Brille. Je besser diese KI-Sprachmodelle werden, desto leichter und intuitiver wird es für Menschen, mit ihnen zu interagieren. Wir sprechen dann mit den virtuellen Agenten wie mit einem guten Freund - und eben genauso, wie „Her“ das vorgezeichnet hat.

Ambient Computing: Alternativmodell zum Metaverse

Googles Forschungsabteilung Deep Mind hat soeben in einem wissenschaftlichen Aufsatz ein Beispiel für einen „generalistischen Agenten“ vorgestellt, der Sprachmodelle (Large Language Models) nutzt, um wahrlich Wunder zu vollbringen. Der Agent namens „GATO“ kann Computerspiele spielen, Bilder beschreiben, chatten oder einen Roboterarm dabei steuern, Bauklötze aufeinanderzustapeln. Das ist tatsächlich revolutionär. Die Mensch-Maschine-Kommunikation wird flexibel. Alle Frageformen (Text, Bild, Video, Gestik) können in alle Antwortformen übersetzt werden.

Wem angesichts solcher Aussichten die Haare zu Berge stehen, dem hilft womöglich der Vergleich zum derzeitigen Hypethema: dem Metaverse. Ambient Computing könnte der Zugang zu einer AR-Welt, einer durch „Augmented Reality“ angereicherten Welt, werden und damit ein Alternativmodell zum Metaverse.

Was wollen wir zukünftig lieber tun: Unsere reale Welt durch künstliche Intelligenz anreichern, um uns besser in ihr zurechtzufinden und unsere Wünsche zu verwirklichen? Oder einen wachsenden Teil unseres Lebens in einer virtuellen Zweitwelt verbringen, während unsere reale Umwelt vor sich hingammelt? Ein Wort hat man auf der diesjährigen Google-I/O-Konferenz vermisst: das Metaverse.

