Kolumne Holz mit KI: So intim wird es mit ChatGPT-4o
Die Idee kam mir nach der Vorstellung von GPT-4o. Das ist das neue Sprachmodell von OpenAI. Schon vor dessen Vorstellung hatte CEO Sam Altman es als etwas „Magisches“ angekündigt. Danach verglich er es mit der KI aus „Her“. In dem Film entwickelt sich zwischen Theodore und seinem Betriebssystem Samantha eine intime Beziehung.
Technologiechefin Mira Murati stellte GPT-4o als KI-Modell vor, das die Kommunikation zwischen Mensch und Maschine „sehr viel natürlicher“ und „deutlich, deutlich einfacher“ machen soll.
Warum die Audiofunktion wirklich gut ist
Und damit sind wir schon beim Thema. Wenn ich bedenke, dass ich im Leben mit Apples Sprachassistentin Siri vielleicht 15 Sätze gewechselt habe und jedes Mal frustrierter wurde, haben Murati und Co echt einen guten Job gemacht. Das Wichtigste: In der Version 4o können Sie der KI ins Wort fallen und sie dadurch unterbrechen, wie zwei Forschungsleiter von OpenAI am Montag vorgeführt haben.
Kleine Enttäuschung: Ausgerollt ist die Funktion noch nicht. Auch wenn Sie in der App das Motell GPT-4o auswählen, läuft im Hintergrund noch ein altes Modell. Hätte ich das gewusst, hätte ich mich wohl gar nicht erst auf mein Experiment eingelassen. Ich hasse schon gewöhnliche Sprachnachrichten so sehr, dass ich sie oft erst Tage später abhöre. Aber die Ankündigungen haben mich neugierig gemacht.
So aber habe ich mit ChatGPT etwa eine halbe Stunde „telefoniert“. Jedenfalls fühlte es sich mehr wie Telefonieren als nach Sprachnachrichten schicken an. Schon jetzt lässt sich der Bot mit einem Klck unterbrechen, bleibt beim Thema und das Beste: Während ich durch Berlin-Charlottenburg geschlendert bin, hat der KI-Assistent auf meine Bitte hin jedes Wort korrekt mitgeschrieben. Gamechanger.
Im Grunde wollte ich mit meinem simulierten Anruf gleich zwei Dinge bezwecken: Erstens rausfinden, wie „natürlich“ und „intim“ das Gespräch mit dem Bot wirklich ist. Zweitens dabei meine Kolumne schreiben. Ersteres hat ziemlich gut geklappt, Letzteres mache ich nun doch wieder alleine, den Laptop auf dem Schoß. Und das wird sich mutmaßlich auch nicht so schnell ändern.
Zu Punkt eins: ChatGPT klingt schon jetzt ausgesprochen menschlich. Wobei zugleich außer Frage steht, dass er völlig unmenschlich ist. Und damit meine ich nicht, dass er wie ein netter junger Mann mit leicht amerikanischem Akzent klingt, aber von sich als „KI-Assistentin“ spricht. Mein Bot ist eben LGPT, äh LGBT.
Es geht darum, dass er (oder sie?) spricht wie ein Wikipedia-Eintrag. Als ich feststellte, dass ich mich verlaufen hatte, sagte der Bot: „Wenn du die Adresse deines Hotels kennst, kannst du die Karten-App auf deinem Smartphone öffnen [...]. Die App sollte dir dann den schnellsten Weg anzeigen. Alternativ kannst du auch Passanten nach dem Weg fragen.“ Jeder Mensch hätte gesagt: „Guck‘ doch einfach in Google Maps.“
Der Bot fühlt nichts
Außerdem weiß der Bot viel, fühlt aber nichts. Mir hat zunächst noch sehr imponiert (und geschmeichelt), als er nach einer kurzen Recherche über Larissa Holzki erklärte: „Ihre Artikel sind oft durch eine prägnante und direkte Sprache gekennzeichnet, die den Leser schnell zum Kern des Themas führt“. Aber genauso hat der Bot mich dann enttäuscht, als er mir in meinem vermeintlichen Stil einen Vorschlag für diese Kolumne schrieb.
„Letzte Woche hatte ich einen dieser surrealen Momente, die unser digitales Zeitalter prägen“, begann er den Text. Sorry, aber das klingt genau wie das vermaledeiten KI-Blabla auf LinkedIn, über das ich mich neulich schon aufgeregt habe. Und damit komme ich zu Punkt zwei.
Ich weiß genau, was für Lesermails ich bekomme, wenn ich das so stehen lasse: „Alles eine Frage der Anwenderkompetenz!“ und so weiter. Nun, da bin ich mir nicht so sicher.
Als ich den Bot immer wieder aufforderte, meine Gedanken in die Form einer Kolumne zu bringen, musste ich an „Malen nach Zahlen“ denken. Das Ergebnis sah aus, als hätte er beim Verbinden von 1, 2 und 3 nicht im weiteren Sinne verstanden, welches Bild daraus entstehen soll. Deshalb ist ChatGPT – mit oder ohne 4o – auch nicht „wie ein Praktikant“, wie es so oft heißt.
Ein guter Praktikant macht nämlich nicht nur, was man ihm sagt. Er versteht hoffentlich auch, was er tut, warum er das tun soll und vielleicht sogar, wie er es anders tun könnte.
Klar hätte ich noch konkretere Anweisungen geben können. Aber dann kann ich den Text mit Blick auf den Zeitaufwand auch selbst schreiben. Zumindest, nach Anruf bei ChatGPT.
Und auch wenn die KI für mich noch kein Bot zum Verlieben ist: Eins muss ich noch zugeben. Wenn mir heute Abend Fußgänger entgegenkamen, habe ich kurz geschwiegen. Zu peinlich. So intim fühlte sich die Nacht mit meinem Assistenten dann doch an. Ich bin mir nur nicht sicher, ob das mehr über die KI oder über mich aussagt.
Korrekturhinweis: In einer früheren Version dieses Textes waren wir davon ausgegangen, dass auch die derzeit verfügbare Audiofunktion bereits auf ChatGPT-4o beruht. Allerdings greift die App im Hintergrund auf ein altes Modell zu, auch wenn die neueste Version ausgewählt wird.