Künstliche Intelligenz: Bewertung über zwei Milliarden Dollar – Synthesia verändert das Video-Schauen
Düsseldorf. Victor Riparbelli will verändern, wie Menschen Videos gucken. Heute, sagt er, hätten Videos „einen Anfang und ein Ende“. Jeder sehe die gleiche Version. Aber die Zukunft des Videos stellt sich der Unternehmer eher wie einen Social Media Feed vor. Zuschauer und Zuschauerinnen sollen dann Videos sehen, die auf sie zugeschnitten und personalisiert sind. Und sie sollen interaktiv sein.
Bei Investoren kommt die Vision gut an. 180 Millionen Dollar hat Riparbelli mit seinem Start-up Synthesia gerade bei Wagniskapitalgebern um den US-Kapitalgeber NEA eingesammelt. Es ist die vierte große Finanzierungsrunde für das Start-up, zu dessen Gründern auch der Münchener KI-Professor Matthias Nießner zählt.
Den Wert der fast acht Jahre alten Firma beziffern die Investoren jetzt schon auf 2,1 Milliarden Dollar. Damit zählt Synthesia zu den wertvollsten Start-ups im Bereich Künstliche Intelligenz (KI) in Europa. Grund dafür sind auch sogenannte KI-Avatare, die schon jetzt zeigen, wie die Vision des Unternehmers Realität werden könnte.
Wie synthetische Zwillinge von echten Menschen
Die Avatare von Synthesia kann man sich wie synthetische Zwillinge von echten Menschen vorstellen. Das Start-up hat Schauspielerinnen und Schauspieler gefilmt und digitale Klone von ihnen erstellt. Möglich wird das durch die KI-Modelle der Firma, die aus Videosequenzen das Aussehen, die Mimik und Gestik von Menschen lernen können.
Synthesia-Kunden können aber auch eigene Avatare erstellen. Unsere Autorin hat es versucht und brauchte dafür nur fünf Minuten Videomaterial. Und je nachdem, von welchem Land aus die Videos ihres synthetischen Zwillings nun aufgerufen werden, soll der Avatar zum Beispiel auch Englisch, Rumänisch oder Chinesisch sprechen.
Der Selbstversuch zeigt auch, wie leicht es ist, mit einer Software wie Synthesia Deepfakes zu erzeugen – also Menschen in KI-generierten Videos Dinge sagen zu lassen, die diese nie gesagt haben. So wurde Synthesias Software in der Vergangenheit auch schon missbraucht, um mit den bereitgestellten Schauspieler-Avataren in Burkina Faso Propaganda zu verbreiten. Die Firma hat Sicherheitsmaßnahmen eingeführt, wie die Überprüfung politischer Inhalte. Zudem muss jeder, der einen KI-Avatar von sich erstellen will, zuvor in einem Video sein Einverständnis erklären.
Synthesia macht nach eigenen Angaben fast die Hälfte seines Umsatzes in Europa, den Rest in den USA. Dabei schließen Unternehmen Software-Abos ab. Das Technologiemagazin „The Information“ berichtet mit Verweis auf einen Insider, dass sich die jährlich wiederkehrenden Umsätze auf 70 Millionen Dollar belaufen. Die Bewertung der 400-Mitarbeiter-Firma beliefe sich damit auf das 30-Fache des voraussichtlichen Umsatzes. Riparbelli will sich zu den Geschäftszahlen nicht äußern.
Nach Unternehmensangaben hat Synthesia bereits mehr als 60.000 Kunden. Dazu zählen in Deutschland Siemens, SAP, die Bosch-Tochter BSH-Haushaltsgeräte, DHL sowie Kuehne & Nagel. Sie setzen KI-Avatare von Synthesia ein, um etwa Schulungsvideos zu erstellen oder Produkte zu präsentieren. Knapp die Hälfte ihres Umsatzes erzielt die Firma in Europa, den Rest in den USA.
Erklärvideos führen zu weniger Anrufen im Kundenservice
In den meisten Fällen setzen Kunden KI-Avatare nicht ein, um klassisch erstellte Videos zu ersetzen. Vielmehr bieten sie Mitarbeiterinnen oder Kunden Videos an, für die Aufwand und Kosten bisher zu groß waren. Einen überraschenden Anwendungsfall entdeckte Riparbelli durch Zufall in Los Angeles. In einem mexikanischen Restaurant habe er ein Bild von einem Synthesia-KI-Avatar und einen QR-Code entdeckt. Der Avatar habe ihm dann erklärt, wie das Menü funktioniert und wo die Zutaten herkommen.
Typisch sind Anwendungen im Kundensupport bei Anbietern von Telekommunikation. „Wenn Kunden ein Problem haben und Sie zeigen ihnen ein Video, das erklärt, wie sie es lösen, ist das viel effektiver, als wenn Sie ihnen einen langen Artikel zeigen“, sagt Riparbelli. In der Zusammenarbeit mit den Telekomfirmen habe sich gezeigt, dass Erklärvideos die Zahl der Anrufe reduzieren.
Das Beispiel zeigt auch, dass fortgeschrittene KI-Systeme wie die KI-Avatare von Synthesia Menschen im Berufsalltag zunehmend Arbeit abnehmen – aber auch streitig machen könnten.
Nils Seele, Investor beim Karlsruher Wagniskapitalgeber LEA Partners, sieht die Synthesia-Avatare als Teil des großen Trends um KI-Agenten. Gemeint sind meist kleine KI-Systeme, die für sehr spezifische Aufgaben in bestimmten Industrien eingesetzt werden. Sie sollen künftig auch in der Lage sein, selbstständig Aktionen auszulösen und durchzuführen. KI-Avatare seien dabei die visuelle Komponente. Neben Synthesia treten in dem Bereich etwa das in Ungarn gegründete Start-up Colossyan und die kalifornische Firma Heygen an.
Zwar seien die derzeit marktverfügbaren Produkte alle noch nicht perfekt, sagt Seele. Aber das seien Berufsanfänger auch nicht. Aus einer Kosten-Nutzen-Perspektive rechneten sich die Systeme daher heute schon.
Und geht es nach Victor Riparbelli, soll sich die Qualität schnell steigern. Mit dem Geld aus der neuen Finanzierungsrunde will er die Expansion in Europa und Asien vorantreiben, aber auch in die Produktentwicklung investieren.
Der Praktikant und die Chefin sehen unterschiedliche Videos
Die Avatare sollen lebensechter und realistischer werden. Zudem sollen sie lernen, mit Objekten zu interagieren und zum Beispiel Gegenstände hochzuheben oder mit anderen Avataren zu sprechen. Außerdem sollen Nutzer sie mit Texteingaben in ganz neue Umgebungen versetzen – zum Beispiel in den „Dschungel oder den Supermarkt“.
Der zweite große Entwicklungsbereich ist die Videoplattform mit der Personalisierung von Videos. So sollen sich die Inhalte in Videos abhängig davon verändern können, auf welcher Hierarchieebene ein Mitarbeiter tätig ist und welcher Tätigkeit er nachgeht. Einfach ausgedrückt: Der Praktikant bekommt ein anderes Video zu sehen als seine Chefin.
Zudem soll es möglich werden, den Avataren in Schulungsvideos Fragen zu stellen und Antworten zu bekommen. Riparbelli sagt: „Das, was wir heute als Video bezeichnen, wird sich in etwas ganz anderes verwandeln.“