Benachrichtigung aktivieren Dürfen wir Sie in Ihrem Browser über die wichtigsten Nachrichten des Handelsblatts informieren? Sie erhalten 2-5 Meldungen pro Tag.
Fast geschafft Erlauben Sie handelsblatt.com Ihnen Benachrichtigungen zu schicken. Dies können Sie in der Meldung Ihres Browsers bestätigen.
Benachrichtigungen erfolgreich aktiviert Wir halten Sie ab sofort über die wichtigsten Nachrichten des Handelsblatts auf dem Laufenden. Sie erhalten 2-5 Meldungen pro Tag.
Jetzt Aktivieren
Nein, danke

Kolumne „Kreative Zerstörung“ Realität auf Abruf: Synthetische Daten sind die Zukunft der KI

Unternehmen können mit synthetischen Daten bei KI-Modellen Zeit und Geld sparen. Warum sollte man sich noch die Mühe machen, realen Daten nachzujagen?
17.06.2021 - 08:37 Uhr Kommentieren
Miriam Meckel ist deutsche Publizistin und Unternehmerin. Sie ist Mitgründerin und CEO der ada Learning GmbH. Außerdem lehrt sie als Professorin für Kommunikationsmanagement an der Universität St. Gallen. Quelle: Klawe Rzeczy
Die Autorin

Miriam Meckel ist deutsche Publizistin und Unternehmerin. Sie ist Mitgründerin und CEO der ada Learning GmbH. Außerdem lehrt sie als Professorin für Kommunikationsmanagement an der Universität St. Gallen.

(Foto: Klawe Rzeczy )

„Wie wirklich ist die Wirklichkeit?“, hat der österreichisch-amerikanische Psychologe Paul Watzlawick in seinem gleichnamigen Buch 1976 gefragt. Seine Antwort damals: So wirklich, wie wir sie durch unsere Kommunikation gestalten. Weil Menschen auf der Grundlage subjektiver Wahrnehmung miteinander Wirklichkeiten schaffen, gibt es davon viele, die sich durchaus widersprechen können.

Das stimmt auch heute noch, und doch müsste Watzlawick sein Buch wohl streckenweise ergänzen und umschreiben. Ein wichtiger Teil unserer Wirklichkeit beruht heute auf Daten. Und die entstehen zum Teil nicht mehr aus dem, was tatsächlich passiert und existiert, sondern aus Algorithmen. Es sind zunehmend synthetische Daten, die Unternehmen helfen, maschinelles Lernen konsequent anzuwenden.

So wie ein Double für den Schauspieler bei einem gefährlichen Stunt im Hollywood-Film einspringt, ersetzen synthetische Daten die echten Daten für Berechnungen und Simulationen beim maschinellen Lernen.

Amazon Web Services trainiert damit den Sprachassistenten Alexa. Facebook nutzt synthetische Daten, um die KI-Anwendungen zu testen, die sogenannte Fake News, Hasskommentare oder Belästigungen im sozialen Netzwerk entdecken sollen.

Sie werden auch beim Softwaretesting eingesetzt, um Bilderkennungsalgorithmen für selbstfahrende Autos zu trainieren, über Profile künstlicher Menschen deren Bewegungsverläufe und Einkaufsverhalten in Warenhäusern zu analysieren. Synthetische Daten sollen auch Anwendungsmuster bei der Geldwäsche entdecken oder als Zwillingsdatensätze Studien im Gesundheitswesen ermöglichen, bei denen die besonders hohen Datenschutzanforderungen die Arbeit mit realen Daten schwierig machen.

KI-Modelle mit synthetischen Daten erzielen vergleichbare Ergebnisse

Synthetische Daten erlauben es, Informationen auch in Anwendungsfeldern zu berechnen, in denen Gefahr für die individuelle Privatsphäre der Individuen droht. Klar, man kann auch reale Daten anonymisieren, aber das hat seinen Preis. Zum einen ist die in den Daten enthaltene Information dann weniger reichhaltig.

Zum anderen zeigen viele Beispiele, dass die Privatsphäre der Datenspender auch nach der Anonymisierung nicht immer hinreichend geschützt ist. Synthetische Daten kosten die Unternehmen weniger Zeit und Geld, um ihre KI-Systeme zu trainieren. Vor allem aber sind sie nahezu unbegrenzt herstellbar.

Mithilfe synthetischer Daten lassen sich Verzerrungen in Datensätzen ausgleichen. Auch das funktioniert nicht als digitale Wunderwaffe: Fehlerhafte Parameter, Über- oder Unteranpassung der Datensatzmuster können Verzerrungen reduzieren oder eben auch verstärken. Dennoch: Eine Studie am MIT hat schon 2017 gezeigt, dass KI-Modelle, die mit synthetischen Daten trainiert wurden, vergleichbare Ergebnisse erzielen wie solche, die mit realen Daten arbeiten. In 70 Prozent der Anwendungen waren die Ergebnisse gleichwertig. Andere Studien zeigen, dass die Datenqualität höher ist, wenn man große synthetische Datensätze durch kleinere reale Datensätze anreichert.

Der Mensch ist kreatives Element und Störfaktor zugleich

Die Zukunft der KI steht damit für eine Realität auf Abruf – gleich im doppelten Sinne. Maschinelles Lernen wird sich zunehmend mithilfe von Daten verbessern, die vergleichbare Eigenschaften haben wie reale Daten, aber eben doch künstlich sind. Unternehmen werden sie nach Bedarf abrufen können, wann immer sie solche Daten benötigen.

Das wird allerdings auch unser Verhältnis zur Realität weiter verändern. Wenn synthetische Daten immer besser eingesetzt werden können, warum soll man sich dann noch die Mühe machen, realen Daten nachzujagen? Maschinelles Lernen wird eingesetzt, um maschinelles Lernen mit Daten möglich zu machen. So entsteht ein Kreislauf der computerisierten Fiktion, der uns helfen soll, die faktische Welt zu verstehen und zu verbessern.

Wie wirklich ist die Wirklichkeit? So wirklich, wie es dem maschinellen Lernen gelingen kann, die verwendeten künstlichen Daten an das anzupassen, was wir Menschen unter Wirklichkeit verstehen. Das war immer volatil. Und so wird es auch in Zeiten synthetischer Daten sein. Der Mensch bleibt das schwierigste Datum einer jeden Realität: Er ist zugleich kreatives Element und Störfaktor in allem, was wir als wirklich betrachten.

In dieser Kolumne schreibt Miriam Meckel 14-täglich über Ideen, Innovationen und Interpretationen, die Fortschritt und ein besseres Leben möglich machen. Denn was die Raupe Ende der Welt nennt, nennt der Rest der Welt Schmetterling.

Mehr: Gefühlserkennung – Gute Miene zum bösen Spiel

Startseite
Mehr zu: Kolumne „Kreative Zerstörung“ - Realität auf Abruf: Synthetische Daten sind die Zukunft der KI
0 Kommentare zu "Kolumne „Kreative Zerstörung“: Realität auf Abruf: Synthetische Daten sind die Zukunft der KI"

Das Kommentieren dieses Artikels wurde deaktiviert.

Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%