Kolumne „Kreative Zerstörung“: Das Buch Genesis der Künstlichen Intelligenz

Die Sprache ist eines der mächtigsten Werkzeuge der Menschheit. Erst mit ihr kam die Möglichkeit der Kollaboration, der Abstimmung und konzertierten Aktion in die Welt. Wer das jenseits der eigenen Sprachgrenzen nutzen wollte, musste lernen und sich das aneignen, was man eine Fremdsprache nennt.
Was aber ist eine Fremdsprache, wenn Künstliche Intelligenz jeden Text, jede gestammelte Äußerung dieser Welt in jede andere Sprache und Bedeutung übersetzen kann? Es bleibt dann nicht mehr als eine kurzfristige Differenzcodierung, die von KI angeglichen werden muss.
Google hatte das schon mit der zweiten Generation seiner intelligenten Brille gezeigt: Mutter und Tochter unterhalten sich fließend, obwohl die eine nur Chinesisch, die andere nur Englisch spricht. Die Übersetzung übernimmt die Brille in Echtzeit – und das war vor ChatGPT & Co.
Es könnte einen riesigen Produktivitätsschub auslösen, wenn Menschen in allen Teilen der Welt sich einfach verstehen können – sofern es gelingen sollte, die kulturellen Differenzen ebenso gut zu übersetzen, wie die Buchstaben oder Schriftzeichen einzelner Wörter. Es würde auch einen erheblichen Machtzuwachs der Menschheit bedeuten, wenn die Hürde des Missverständnisses zumindest niedriger gehängt wäre, als das derzeit noch immer der Fall ist.
Gott wusste schon, warum er beim Turmbau zu Babel den Menschen ins Handwerk fuhr. „Lasst uns hinabsteigen und dort ihre Sprache verwirren, dass keiner mehr die Sprache des anderen versteht,“ so heißt es im Buch Genesis. Gott hatte schlicht keinen Bock darauf zuzusehen, wie die Menschen einen Turm bis zum Himmel bauten, um dann in seinem Revier herumzupfuschen.
Apple geht auf Nummer sicher
Inzwischen beobachten wir: Die ersten Stockwerke dieses Turms sind gebaut, und er schickt sich an, weiter himmelwärts zu wachsen. Die Baumeister bei OpenAI, Google und Apple wissen, was sie wollen: die Sprachinteraktionsschnittstelle ihrer großen Sprachmodelle so bauen, dass ihre Anwendungen zu unseren persönlichen Agenten, zu individuellen Gesprächspartnern unseres Vertrauens werden. Das wird eine Revolution. Wir treten ein in eine andere Welt der Mensch-Maschine-Verständigung – und zwar auf zwei möglichen Wegen.
Da gibt es einmal den Ansatz, den Apple gewählt hat und der aufgrund von Differenzen des Konzerns mit der EU vorerst in Europa gar nicht verfügbar sein wird. Apple stützt seine Sprachagentin – uns unter dem Namen Siri bekannt – auf ein kleines Modell, das zwischen unterschiedlichen Spezialanwendungen wechseln und damit immer noch direkt auf dem iPhone laufen kann. Alles, was auf dem iPhone geschieht, ist verschlüsselt.
Damit sind die persönlichen Daten dieser Konversationen bestmöglich gesichert. Aber diese Sicherheit hat ihren Preis: Die neue Siri ist zwar die größere Schwester der bereits bekannten, aber sie wirkt nicht so, als hätte sie in Sachen Intelligenz einen evolutionären Schritt gemacht. Gespräche fühlen sich oft immer noch so an, als stünde jemand sehr fest auf der Leitung.
Apple hat sich für das Modell „Copilot“ entschieden – eine KI, die zwar bei Bedarf auf die Cloud zugreifen kann, aber im Wesentlichen auf dem Smartphone läuft, um Missbrauch und Datenkorruption zu vermeiden. Natürlich stehen wir noch am Anfang einer Softwareentwicklung, deren Möglichkeiten sich Schritt für Schritt entwickeln werden. Dennoch: Es gibt einen zweiten Weg. Den hat OpenAI gewählt, und er unterscheidet sich diametral.
OpenAI nutzt die volle Kraft seines riesigen Sprachmodells GPT-4o. Die Funktion, die bei uns noch nicht nutzbar ist, aber in Kürze freigeschaltet werden soll, geht mit einem Konversationskraftprotz in die Vollen. Das System arbeitet nicht nur multimodal, kann also Text, Bild, Ton in Sprache verwandeln und zurück.
Es agiert auch wie ein menschlicher Gesprächspartner – eine Simulationsmaschine für Kommunikation und Emotionen, die man mühelos mit einem besten Freund oder einer Geschäftspartnerin verwechseln kann. Das ist beeindruckend im Ergebnis, aber auch etwas spukhaft.
Während man auch bei der neuen Siri gelegentlich den Eindruck hat, man müsse einem begriffsstutzigen Kind erklären, was Sache ist, kommt bei GPT-4o das glücklich-gruselige Gefühl auf, man spreche mit einem beseelten Gegenüber. OpenAI zielt also auf genau das ab, was Apple aus guten Gründen vermeiden will.
Welcher der beiden Ansätze wird die Zukunft der Sprachschnittstellen prägen? Menschen haben noch nie langfristig aus Vernunftgründen auf technologische Leistungsfähigkeit verzichtet. So wird es auch hier sein: Die Kraft der Modelle und die Macht derjenigen, die sie in den Markt bringen, werden jede Vorsichtsmaßnahme überrollen.
Das wird eine Entscheidung nicht nur über die Sprachagenten, mit denen wir alle in Zukunft unseren Tag und unser Leben verbringen werden. Es wird auch eine Entscheidung, die beeinflusst, wie KI sich insgesamt weiterentwickelt.
Wenn wir uns erst einmal daran gewöhnt haben, mit KI wie mit einem Partner, einer Freundin, einem Lehrer, einer Therapeutin zu sprechen, ist es nur noch ein kleiner Schritt dahin, KI eine Persönlichkeit zuzuweisen, die mitreden und über sich selbst bestimmen kann. Das hat nichts mit „vernünftiger“ KI zu tun, aber sehr viel mit unvernünftiger Technologieimplementierung durch Menschen.






Ganz so, wie der amerikanische Dichter Robert Frost es 1915 in seinem berühmten Gedicht „Zwei Wege“ beschrieben hat: „Zwei Wege gab es da im Wald, und ich – ich nahm den häufiger begangenen nicht, und das den Unterschied hat ausgemacht.“
Wir nehmen vermutlich den häufiger begangenen Weg – den Trampelpfad der Mensch-Maschine-Kommunikation – und schaffen damit einen Genesis-Moment der Künstlichen Intelligenz.
Mehr: Wider die Löseritis






