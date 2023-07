Düsseldorf ChatGPT ist wie ein Praktikant mit übergroßem Selbstbewusstsein: Das Programm erledigt Aufgaben im Nu und präsentiert die Ergebnisse in einem Ton, als hätte es zu dem Thema eine Doktorarbeit geschrieben. Wenn Fachleute die Arbeit genau überprüfen, entdecken sie jedoch oft Ungenauigkeiten und Fehler. Das schränkt die Einsatzmöglichkeiten ein.

Trotz dieser Schwächen bietet die neueste Generation Künstlicher Intelligenz (KI), auf der ChatGPT beruht, großes Potenzial für die Wirtschaft. Große Sprachmodelle können E-Mails formulieren, Geschäftsberichte zusammenfassen, Kundenbeschwerden beantworten – und vieles mehr.

Doch wie bei einem Praktikanten gilt: Wenn es wirklich wichtig ist, muss hinterher immer noch ein Mensch mit Erfahrung das Ergebnis kontrollieren.

Erst wenn es gelingt, KIs wie ChatGPT das Fabulieren auszutreiben, lässt sich die produktive Kraft dieser Programme wirklich nutzen. Es geht sozusagen darum, aus dem übertrieben selbstbewussten Praktikanten einen mit realistischer Selbsteinschätzung zu machen, der sich meldet, wenn er nicht mehr weiterweiß.

Einige Beispiele zeigen, wie das gelingen kann. Die Anwendungsgebiete reichen vom Controlling in einem Konzern bis zu Aktenvermerken in der öffentlichen Verwaltung.



1. BASF Coatings: Künstliche Intelligenz ChatGPT fürs Controlling

Die Aufgabe: Das Controlling von BASF Coatings erstellt jeden Monat Berichte über die Entwicklung des Geschäfts. Neben Daten wie Preisen, Verkaufsmengen und Wechselkursen in den verschiedenen Regionen stehen Erläuterungen fürs Management, etwa Besonderheiten bei der Marktentwicklung wie makroökonomische Krisen.

„Das ist ein Schmerzpunkt im Controlling“, berichtet Tobias Kawohl, der bei BASF Coatings weltweit für die Entwicklung digitaler Controlling-Lösungen verantwortlich ist. „Damit sind die Kollegen einige Stunden beschäftigt.“ Da es Reports dieser Art im gesamten BASF-Konzern gebe, seien durch eine Automatisierung beachtliche Effizienzgewinne möglich.

Die Herausforderungen: Bei BASF Coatings, das Lacke und andere Beschichtungen herstellt, hat es bereits mehrere Versuche gegeben, die Kommentierung der Berichte zu automatisieren. Bislang jedoch ohne Erfolg. Die Software habe entweder schlechte Ergebnisse geliefert oder sei nur aufwendig in die IT zu integrieren gewesen, berichtet Controller Kawohl.

Die Entwickler haben BASF Coatings geschaffen. (Foto: Westphalia Data Night) Tobias Kawohl (l.) und Marvin Pohl

Als OpenAI am Jahresanfang die Schnittstelle zu ChatGPT zur Verfügung stellte, startete er mit Data Scientist Marvin Pohl einen neuen Versuch – auch, um intern die Möglichkeiten der neuen Technologie zu demonstrieren. Das Ziel der beiden: Das Modell sollte seine Sprachfähigkeiten einbringen, ohne dabei zu fabulieren.

Der Lösungsansatz: Damit ChatGPT keinen Unsinn berichtet, hat das Entwicklerteam zwei Maßnahmen ergriffen. Zum einen lenkt das Team das Sprachmodell – in diesem Fall GPT 3.5 – in die richtige Richtung. Ein Programm erstellt mithilfe einiger Regeln aus den Geschäftszahlen einen Satzanfang, etwa: „Der Umsatz in Ostasien ist um fünf Prozent gesunken…“ Diesen gilt es, zu ergänzen.

Zum anderen nutzen die BASF-Entwickler einige Analystenreports als Datenbasis. „Man kann dem System seitenweise Quellen als Kontext mitgeben“, sagt Pohl. Das Modell soll also nicht aus seinem eigenen Wissensfundus schöpfen, der auf Quellen aus dem Internet beruht, sondern auf Einschätzungen von Profis.



Die Erfolgsmessung: Aus Sicht der Entwickler erfüllt das System seinen Zweck – es liefert im Handumdrehen Kontext zu den Zahlen. Das Ergebnis kann beispielsweise lauten: „Der Umsatz in Ostasien ist um fünf Prozent gesunken aufgrund von Lieferengpässen im Halbleitersegment sowie der anhaltenden Lockdown-Maßnahmen in China.“

Für das Entwicklerteam geht es bei diesem Leuchtturmprojekt aber nicht allein um die konkrete Anwendung. Das Ziel sei gewesen, andere Einheiten wie das Marketing zu inspirieren, sagt Kawohl – auch sie sollen bald generative künstliche Intelligenz nutzen können.



Die Lehren: „Wir haben dieses Projekt zu zweit innerhalb von drei Monaten nebenher entwickelt“, berichtet Pohl. Die komplexe Arbeit erledige die Technologie von OpenAI. „Man kann mit kleinen Teams anspruchsvolle Software entwickeln“, bilanziert Kawohl – das sei ein Unterschied zu früheren Generationen der Künstlichen Intelligenz.

Nun soll ein Team geschaffen werden, das einerseits das Know-how hat, weitere Projekte mit generativer KI durchzuführen, andererseits den Markt im Blick behält. Das ist gar nicht so einfach. „Die Situation ist im Moment sehr unübersichtlich, man weiß noch nicht genau, welche Lösungen von den Softwareherstellern kommen“, sagt Pohl.



2. Künstliche Intelligenz bei Behörden: Ausgabe der KI muss kontrolliert werden

Die Aufgabe: Zu viele Aufgaben, zu wenig Leute: Die meisten Behörden sind überlastet. In Baden-Württemberg lässt die Landesregierung das Innovationslabor Innolab_bw erforschen, wie Technologie für Entlastung sorgen kann.

Fünf Mitarbeiter identifizieren Trends und entwickeln Prototypen. So haben sie in den vergangenen Monaten mit dem Heidelberger Start-up Aleph Alpha erprobt, wie generative Künstliche Intelligenz die Bediensteten bei der Arbeit entlasten kann. Es bestehe das Potenzial, „die Servicequalität der Verwaltung zu revolutionieren“, meint Florian Stegmann, Chef der Staatskanzlei.

Die KI des Landes Badem-Württemberg soll im Behördenalltag Abläufe erleichtern. Verwaltungsassistent F13

Das neue System heißt F13 und soll wie eine Funktionstaste am PC schnelle Hilfe bieten – „Die Abkürzung auf deinem Schreibtisch“, lautet der interne Werbeslogan. Der Assistent fasst Texte zusammen, erleichtert die Suche in den Datenbeständen des Landes und erstellt aus Kabinettsvorlagen Vermerke. Ein „Vermerkomat“, der aus Vermerken, Notizen und Studien einen Fließtext erstellen können soll, ist in Arbeit.



Die Herausforderungen: Große Sprachmodelle haben eine Eigenschaft, die in Behörden ungern gesehen wird: Sie fabrizieren Falschaussagen, sogenannte Halluzinationen. „Sprachmodelle wissen nicht, ob ihre Aussagen richtig sind oder nicht“, sagt Projektmanager Johannes Ast. Gerade, wenn es um Zahlen und Zeiten gehe, sei die Technologie fehleranfällig. Sprich: Eine Antwort mag plausibel klingen, folgt aber keiner mathematischen Logik.

>> Lesen Sie auch: Diese KI-Tools erleichtern den Alltag

Bei der Einführung des Sprachassistenten stießen die Entwickler auf ein weiteres Problem: Die meisten Dokumente der Landesverwaltung liegen nicht in maschinenlesbarer Form vor, sondern in Formaten wie PDF. Beim Einlesen werden oft Absätze abgeschnitten – und mit ihnen wichtiger Kontext. „Die Hauptursache für Halluzinationen sind solche Einlesefehler, die gerade bei komplexen Eingabedokumenten vorkommen können“, sagt Ast.



Der Lösungsansatz: F13 ist bewusst als Assistent konzipiert. Die Zusammenfassungen und Formulierungen sind als Vorschläge zu verstehen, die die Bediensteten immer überprüfen müssen. Der Mensch bleibe in der „Letztverantwortung“, sagt Staatskanzleichef Stegmann. Anwender können mit einem Klick die Originalquellen der Texte einsehen, eine zentrale Funktion der Sprachmodelle von Aleph Alpha.

Damit den Nutzern ihre Verantwortung bewusst ist, hat das Entwicklungsteam an verschiedenen Stellen Infoboxen eingebaut. Zudem gibt es Schulungen fürs Personal. Um Transparenz und Vertrauen zu schaffen, denke man zudem über eine Kennzeichnung nach, sagt Stegmann: Texte, an denen der Assistent mitgewirkt hat, sollen erkennbar sein.

Um die Funktionsweise zu überprüfen, hat das Team zudem an vielen Stellen einen Feedback-Button eingebaut, über den die Nutzer konkret rückmelden können, ob die KI verständlich, komplett und korrekt arbeitet.

Die Lehren: Das Projekt wurde gerade erst gestartet, die Beurteilung ist daher schwierig. Das Interesse an der neuen Technologie ist in der Landesverwaltung jedenfalls groß, mehr als 400 Bedienstete haben an einem Workshop teilgenommen, derzeit werden täglich rund 100 Zusammenfassungen angefordert. Die Evaluierung läuft bis in den Herbst.

Was schon für die künftige Nutzung von KI klar ist: Das Erwartungsmanagement ist wichtig. „Wir erhalten zum Beispiel Anfragen, ob man mit dem System gezielte Fragen zum Landeshaushalt stellen kann“, berichtet Hannah Reitter, Referentin im InnoLab_bw – gerade dafür sei F13 angesichts der Probleme mit Zahlen jedoch nicht geeignet. „Wir müssen ein Bewusstsein dafür schaffen, wofür genau diese Textassistenz gut ist“, lautet daher ihr Fazit.

Erstpublikation: 01.07.2023, 14:02 Uhr.