Benachrichtigung aktivieren Dürfen wir Sie in Ihrem Browser über die wichtigsten Nachrichten des Handelsblatts informieren? Sie erhalten 2-5 Meldungen pro Tag.
Fast geschafft Erlauben Sie handelsblatt.com Ihnen Benachrichtigungen zu schicken. Dies können Sie in der Meldung Ihres Browsers bestätigen.
Benachrichtigungen erfolgreich aktiviert Wir halten Sie ab sofort über die wichtigsten Nachrichten des Handelsblatts auf dem Laufenden. Sie erhalten 2-5 Meldungen pro Tag.
Jetzt Aktivieren
Nein, danke
Digitale Revolution

Digitale Revolution Das Ende der Sprachgrenzen – wenn der Algorithmus alles übersetzt

Algorithmen setzen an, unsere Kommunikation umzukrempeln. Google, Facebook und zwei deutsche Hidden Champions geben einen Ausblick auf die Zukunftstechnik.
29.01.2020 - 04:05 Uhr 1 Kommentar
KI soll es möglich machen, dass jeder nur noch in seiner Muttersprache schreiben und lesen muss. Quelle: DigitalVision/Getty Images
Maschinelle Übersetzung

KI soll es möglich machen, dass jeder nur noch in seiner Muttersprache schreiben und lesen muss.

(Foto: DigitalVision/Getty Images)

Düsseldorf Verträge auf Englisch auszuhandeln und abzuschließen ist ein Risiko. Daraus macht Andreas Heinold keinen Hehl. Der Manager kümmert sich beim IT-Konzern Fujitsu unter anderem um Mietvertragsverhandlungen in Osteuropa. Sein Englisch sei recht gut, sagt er. Trotzdem lädt er englische Verträge bei DeepL hoch und lässt sie sich auf Deutsch übersetzen: ein Klick für die Sicherheit, dass er alle Klauseln zu Haftungsausschluss und Gewährleistung richtig verstanden hat.

Übersetzen wird so einfach wie ausdrucken, und möglich macht das ein Kölner Start-up: DeepL entwickelt Künstliche Intelligenz (KI), die Menschen wie Heinold Wörterbücher ersetzen und Zeit ersparen. „Ich finde das fantastisch“, sagt Heinold. Und das ist erst der Anfang.

Weitere Artikel aus dem Handelsblatt-Spezial „Digitale Revolution“:
Diese Technologie könnte Passwörter überflüssig machen
Die Zukunft der Kreativität: Wie Technologie unseren Einfallsreichtum verändert
Diese chinesische Firma hat mit Drohnen den Massenmarkt erobert

Übersetzungsalgorithmen könnten die Wirtschaftswelt grundlegend verändern. Hat das Internet die Infrastruktur für globale Kommunikation geschaffen, wird die Zukunftstechnologie ihr perfektes Verkehrsmittel werden. KI soll es möglich machen, dass jeder nur noch in seiner Muttersprache schreiben und lesen muss – ob im privaten Mailpostfach, der Firmencloud oder im Internet. Für deutsche Firmen, deren Sprache weltweit viel seltener gesprochen wird als die aufstrebender Industrienationen, ist das besonders relevant. Die Auswirkungen auf den weltweiten Wettbewerb sind kaum abzuschätzen.

Mehrere Unternehmen treiben die Entwicklung bereits massiv voran, darunter die US-Techriesen: Google will das Internet durchsuchbar machen, Facebook will Menschen zusammenbringen. Auch neue Unternehmen wittern einen Milliardenmarkt. Dazu gehören zwei deutsche Start-ups, die ins Firmengeschäft drängen. Erste Anwendungsfälle wie bei Fujitsu gibt es bereits. Doch bis die sprachgrenzenlose Welt Realität wird, sind noch einige Hürden zu nehmen.

Grafik

Es geht um viel mehr als um das Geschäft der Übersetzer und Dolmetscher. „Ich glaube, wir haben noch gar nicht verstanden, was für eine neue tolle Welt entstehen kann, wenn die Sprachbarrieren fallen“, sagt der KI-Professor Kristian Kersting von der TU Darmstadt.

Technologie könne Dokumente übersetzen, die von Menschen niemals übersetzt worden wären. Es geht um jedes digitale Buch, um jedes Video im Netz, um jeden Post in den sozialen Netzwerken. Es geht aber auch um Produktbeschreibungen, um Verträge und Beipackzettel für Kundengruppen, die unerreichbar schienen. Über drei Monate sprach das Handelsblatt mit Vordenkern der Branche, um ein möglichst genaues Bild der Zukunftstechnik zu entwerfen.

Die Interessen der Tech-Konzerne sind ein Treiber der Entwicklung. Facebook müsse in jeder Sprache auf seiner Plattform Hasstiraden und Mobbing ausfindig machen können, um solche Inhalte zu unterbinden, erklärte Facebooks KI-Chef Manohar Paluri auf der unternehmenseigenen Entwicklerkonferenz F8 im vergangenen Jahr.

Googles Translate-Chef Macduff Hughes bezeichnete die maschinelle Übersetzung bei einem Treffen mit Journalisten in Zürich gar als „kritisch“ für die Mission des Unternehmens, Informationen für jeden auffindbar und zugänglich zu machen. Er verantwortet die Entwicklung eines Megaübersetzungssystems, das alle mehr als 6000 Sprachen der Welt beherrscht.

Die fortlaufende Verbesserung von Übersetzungsalgorithmen lässt sich im Internet live beobachten– ebenso wie die Probleme dabei. So können sich Facebooknutzer bereits automatisch Posts in ihrer Sprache anzeigen lassen. Und wer in die Onlineübersetzer von DeepL oder Google englische Zeitungsberichte kopiert, erhält oft gute deutsche Texte. Immer wieder sind jedoch auch Sätze darin, die keinen Sinn ergeben.

Datenschutzversprechen als Kaufanreiz

Noch vor drei Jahren haben sich die Mitarbeiter bei Fujitsu gegen den Einsatz von DeepL entschieden. Die Technologie erschien ihnen zu schlecht. Doch inzwischen ist das anders: Viel Aufmerksamkeit hat DeepL bekommen, nachdem seine Übersetzungen in Blindtests besser bewertet wurden als die von Google und anderen Konzernen. Und gerade hat sogar die Schweizer Bundeskanzlei für 36.000 Euro 2000 Jahreslizenzen bei den Kölnern erworben. In den Behörden des mehrsprachigen Landes soll die Software die Kommunikation der Mitarbeiter vereinfachen.

DeepL ist vielen durch seinen kostenfreien Onlineübersetzer und das Onlinewörterbuch Linguee bekannt. Geld verdient es mit Geschäftskunden, von denen es laut CEO Jaroslaw Kutylowski „Zigtausende“ hat, darunter Übersetzer, Journalisten und Juristen. Anders als in der freien Version speichert DeepL ihre Eingaben nicht. Dieses Datenschutzversprechen ist der Kaufanreiz: Denn wie jede KI werden Übersetzungsalgorithmen mit Datensätzen trainiert, und Firmen sorgen sich bei der Nutzung von Google und Co. um ihre Interna.

Umso erstaunlicher scheint es auf den ersten Blick, dass eine 60-Mitarbeiter-Firma besser sein kann als die größten Datenbesitzer der Welt. Was also ist Kutylowskis Geheimnis?

Noch bis vor ein paar Jahren nutzten Maschinenübersetzer im Internet auffindbare Übersetzungen einfach so, als wäre das Netz ein riesiges Wörterbuch. „Das System hat erst für jedes Wort, dann für jede Kombination aus zwei bis sechs Wörtern überprüft: Habe ich diese exakte Sequenz schon gesehen, und weiß ich, wie sie zu übersetzen ist?“, erklärt Googles Übersetzungschef Macduff Hughes. Die gefundenen Übersetzungen habe es dann in einer Weise zusammenzubauen versucht, die in der Zielsprache Sinn ergebe. „Das hat allerdings fast nie komplett natürlich geklungen“, sagt der Google-Manager.

Heute gehen Google wie auch DeepL die Übersetzung deshalb anders an und arbeiten mit neuronalen Netzen. Die heißen laut dem DeepL-Geschäftsführer so, weil sie auf einer gewissen Abstraktionsebene den Abläufen im Gehirn ähnelten. Beide arbeiten mit der Verschaltung von Zellen.

Die richtige Formulierung wird letztlich errechnet: „Bei heutigen neuronalen Netzen sind alle Übersetzungen mathematische Operationen.“ Teil der Entwicklungsleistung sei es, ein solches Netzwerk mit einer bestimmten Architektur zu belegen und ihm eine Reihe übersetzte Sätze zu zeigen, sagt Kutylowski. „Dadurch lernt das Netzwerk Parameter und Variablen besser, also quasi die Verschaltungen zwischen den Neuronen noch mal detaillierter.“ Aus der Menge der Daten lerne das Netzwerk, Übersetzungen zu reproduzieren und zu abstrahieren und neue Übersetzungen selbstständig zu tätigen.

Wenn DeepL nun punktuell besser übersetzt als Google, hat das weniger mit der Datenmenge als mit der Art der Daten zu tun. Während Google Translate laut Macduff Hughes lerne, „was auch immer wir an Übersetzungen und Sprachstilen im Netz finden“, wählt DeepL seine Trainingsdaten sehr wahrscheinlich spezifischer für die Kundenbedürfnisse aus. Dabei profitiert es von seinem Datenschatz aus dem schon vor zehn Jahren gestarteten Onlinewörterbuch.

Zu einer stetigen Verbesserung maschineller Übersetzung führen auch automatisierte Korrekturschleifen. Dabei wird der neu produzierte Text aus der Zielsprache immer wieder in die Ausgangssprache rückübersetzt. Man kann sich das wie einen Verständnischeck vorstellen, bei dem sich zwei Systeme gegenseitig absichern: Kann man das so sagen, oder ist es dann falsch?

Statistische Regeln in den Systemen führen zudem dazu, dass die Ausdrucksweise der Maschinen der von Muttersprachlern immer ähnlicher wird. Hughes erklärt, dass Googles Algorithmen Begriffe und Ausdrücke in Übersetzungen genauso häufig nutzen wie originalsprachliche Texte. Dadurch klängen die maschinellen Übersetzungen oft natürlicher als die von Menschen. Die werden – pro Wort bezahlt – schnell die einfachste Übersetzung wählen.

Fakt ist: Ausgehend von einem ziemlichen Kauderwelsch vor ein paar Jahren haben sich die Ergebnisse maschineller Übersetzung zu relevanten Hilfsmitteln entwickelt. Für die Alltagskommunikation reicht die Qualität bereits, für manche Business-Anwendungen auch. „Ganz viele inkrementelle Fortschritte summieren sich zu einem großen auf“, sagt Computerlinguist Hinrich Schütze, der an der Münchener Ludwig-Maximilians-Universität das Centrum für Informations- und Sprachverarbeitung leitet.

Wie weit sich die Software noch perfektionieren lässt und in welcher Geschwindigkeit, ist allerdings ungewiss. Einer der größten Knackpunkte laut Schütze: „Die maschinellen Übersetzer beherrschen kein richtiges Sprachverstehen.“ Sie verstünden den Kontext nicht über den Satz hinaus.

Hidden Champion Lengoo

Die Brücke will Lengoo schlagen. Das Berliner Start-up ist noch ein Hidden Champion, mischt mit einer Hybridlösung aus Künstlicher und menschlicher Intelligenz aber den Markt auf. CEO Christopher Kränzler verspricht: Lengoo sei dreimal so schnell wie klassische Übersetzungsbüros, aber nur halb so teuer. Das lohne sich: „Ein international agierender Konzern gibt schnell mittlere zweistellige Millionenbeträge im Jahr für Übersetzungen aus“, sagt Kränzler.

Ähnlich wie Google und DeepL arbeitet das Start-up mit einem generischen Übersetzungsmodell. Dieses wird jedoch für jeden Firmenkunden adaptiert. „Wir stimmen das Modell auf Basis von früheren Übersetzungen unserer Kunden genau auf das jeweilige Unternehmen und seinen Anwendungsfall ab“, sagt Kränzler. So entstehen für jedes Unternehmen neue Modelle: „Es geht nicht nur darum, dem Modell die Maschinenbauterminologie beizubringen, sondern auch, wie sich das jeweilige Unternehmen in dem jeweiligen Kontext ausdrückt.“

Schließlich merzt bei jeder Lengoo-Übersetzung noch ein Fachübersetzer Fehler aus und verbessert damit nicht nur das betreffende Dokument, sondern auch das Übersetzungsmodell. So tragen die 2000 freien Übersetzer für verschiedene Sprachpaare und Fachgebiete auch dazu bei, dass Lengoo immer mehr automatisieren kann. „Mit fortlaufender Zusammenarbeit können unser Fachübersetzer zwischen 2000 und 2500 Worte pro Stunde für ein Unternehmen korrigieren, ohne technische Hilfsmittel geht man von 350 übersetzten Worten aus“, sagt Kränzler – ein Automatisierungsgrad von etwa 85 Prozent.

Der KI-Experte Andre Retterath beim Wagniskapitalgeber Earlybird hat auf Lengoo wie auf DeepL bereits ein Auge geworfen. „Allein der Enterprise-Markt für maschinelle Übersetzungen ist nach meinen Schätzungen weltweit sechs bis sieben Milliarden Euro groß“, sagt er. Rechne man den langfristigen Bedarf kleinerer Unternehmen hinzu, könne sich die Summe noch mal verdoppeln. Die Übersetzungsbranche sei zudem noch sehr manuell und eigne sich daher grundsätzlich für eine Disruption, sagt Retterath.

Dennoch hat Earlybird bisher in keines der beiden Start-ups investiert. Es gebe noch viele offene Fragen: „DeepL scheint aus Investorensicht das attraktivere Modell zu haben, weil es von Anfang an hohe Margen verspricht“, sagt Retterath. Die Software könne von Kunden unterschiedlicher Branchen und Größen selbstständig genutzt werden. „Allerdings hören wir auch von vielen Unternehmen, dass ihnen die Qualität bisher nicht ausreicht“, sagt Retterath.

Konträr fällt seine Analyse bei Lengoo aus: „Das Qualitätsniveau mit der menschlichen Kontrollinstanz entspricht den Anforderungen der Kunden“, sagt Retterath. Die Kombination aus Mensch und Technologie sei eine sehr gute Markteinführungsstrategie, wirke sich aber negativ auf die Margen aus.

Für Lengoo spreche in dem Vergleich, dass sich das Modell mit jedem erfüllten Auftrag verbessere, die Übersetzer weniger eingreifen müssten und sich die Margen langfristig denen von DeepL angleichen könnten. Trotzdem bleiben Zweifel bei Retterath, vor allem mit Blick auf die Wettbewerber: Das sind erstens die Tech-Riesen, die weiter ins B2B-Geschäft vordringen könnten. Amazon Web Services übersetzt für seine Kunden bereits mit „normalerweise geringfügigen“ Übersetzungsfehlern in 54 Sprachen.

Google setzt auf Masse

IBM überträgt Geschäftsdokumente samt Formatierung in andere Sprachen. Google ermöglicht seinen Cloud-Kunden, die generische Übersetzung mit ihren eigenen Daten zu verbessern. Selbst wenn sich das Lengoo-Modell durchsetzt und den Tech-Konzernen zu personalintensiv ist, blieben zweitens andere Start-ups ein Risiko, etwa das US-Start-up Lilt, das genauso arbeite wie Lengoo: „Die Hypothese ist, dass wir es mit einem Markt zu tun haben, in dem ein Unternehmen das ganze oder zumindest den Großteil des Geschäfts gewinnen wird.“

Andere Investoren haben sich auf die Übersetzungswette schon eingelassen. Lengoo hat im vergangenen Jahr sechs Millionen Euro Wagniskapital eingesammelt. Bei drei Millionen Euro Umsatz 2019 arbeitet das Unternehmen momentan wieder unter der Profitabilitätsgrenze, um in den Vertrieb zu investieren und sich international besser aufzustellen. Bei DeepL ist unter anderem der Wagniskapitalgeber Benchmark mit einem Investment in unbekannter Höhe eingestiegen. Das Start-up ist laut Kutylowski profitabel, veröffentlicht aber auch keine Umsatzzahlen.

Google schert sich derweil nicht um Perfektion, sondern vor allem um die Masse. Macduff Hughes und seine Mitarbeiter wagen sich an Sprachkombinationen heran, für die es nicht einmal Paralleldaten gibt. „Wir gehen von dem Grundgedanken aus, dass es viel einfacher ist, eine elfte Sprache zu lernen als die ersten zehn“, sagt Hughes. „Wir hoffen, dass wir Modelle trainieren können, die das Erlernen einer Sprache so generalisieren, dass sie nur kleine Datenmengen brauchen.“

Computerlinguist Schütze erklärt das so: „Wenn es wenige direkte Übersetzungen von Serbisch auf Französisch, aber viele serbische und französische Texte gibt, lassen sich Repräsentationen für Worte bilden, für die sich technisch Entsprechungen in der anderen Sprache finden lassen.“ Die Systeme erkennen praktisch Muster in den Texten und erkennen, welche Worte in den beiden Sprachen gleich eingesetzt werden. „Das funktioniert sehr gut für verwandte Sprachen wie Englisch, Französisch und Deutsch, schlechter für Chinesisch und Englisch“, sagt Schütze.

Ob über den einen oder den anderen Ansatz: Das Ziel der Übersetzungsanbieter dürfte die Integration etwa in Webbrowser und E-Mail-Programme sein, mithilfe derer jeder Nutzer in seiner eigenen Sprache Nachrichten schreiben und empfangen kann. Wem das zuerst zufriedenstellend gelingt, hängt auch von den Nutzern ab. Könnten sie sich dauerhaft an Übersetzungen mit kleinen Fehlern gewöhnen?

Experten wie Schütze und Kersting halten einen kulturellen Wandel für möglich, der zu mehr Akzeptanz für fehlerhafte, aber verständliche Übersetzungen auch im Geschäftsverkehr führt. Anzeichen dafür sieht auch Andre Retterath: „Wenn man Produktbeschreibungen im Onlinehandel übersetzt, braucht man kein hundertprozentiges Sprachniveau“, sagt er. Tests hätten gezeigt, dass die Konvertierungsrate nicht signifikant leide, solange die Übersetzungen hinreichend verständlich sind. Der Erfolg von KI hängt im Fall der Sprachbarriere besonders stark vom Menschen ab.

Mehr: Intel will Rechner mit einem völlig neuen Ansatz um ein Vielfaches leistungsfähiger machen. Das Konzept „Neuromorphic Computing“ entwickelt sich rasant.

Startseite
Mehr zu: Digitale Revolution - Das Ende der Sprachgrenzen – wenn der Algorithmus alles übersetzt
1 Kommentar zu "Digitale Revolution: Das Ende der Sprachgrenzen – wenn der Algorithmus alles übersetzt"

Das Kommentieren dieses Artikels wurde deaktiviert.

  • Liebe Frau Holzki,
    vielen Dank für diesen interessanten Artikel. Ich leite selbst ein Sprachdienstleistungsunternehmen in Kiel und kann sagen, dass die Ergebnisse Ihrer Recherche sich mit meinen Eindrücken aus der Praxis decken. Ich würde aber gerne auf zwei Aspekte eingehen:
    1. Ihre Aussage: "Dadurch klängen die maschinellen Übersetzungen oft natürlicher als die von Menschen. Die werden – pro Wort bezahlt – schnell die einfachste Übersetzung wählen", kann ich nicht bestätigen. Das unterscheidet ja gerade den professionellen Übersetzer von jemandem, der "mal schnell" etwas übersetzt. Man ist dafür ausgebildet, aus dem Ausgangstext einen flüssig lesbaren Zieltext zu erstellen, was oft ein hohes Maß an Kreativität erfordert.
    2. Ihre Einschätzung: "Das Berliner Start-up […] mischt mit einer Hybridlösung aus Künstlicher und menschlicher Intelligenz aber den Markt auf" wundert mich. Für das, was das von Ihnen genannte Unternehmen anbietet, gibt es schon lange einen Produktnamen, nämlich MTPE, also Machine Translation Post Editing. Die Methode wird bereits von allen führenden Übersetzungsdienstleistern und sogar von kleineren Unternehmen, wie unserem - bei uns auf Kundenwunsch -, eingesetzt. In der Regel wird in Deutschland dafür heute DeepL für die Machine Translation verwendet und mit Translation Memory-Systemen, die kundenspezifisch konfiguriert werden, verknüpft. Um den datenschutzrechtlichen Bedenken der Kunden Rechnung zu tragen, haben einige Unternehmen, wie z.B. der Platzhirsch Kern, eigene serverbasierte Lösungen der Maschinellen Übersetzung entwickelt. Aber bei der DeepL Pro-Version ist es nach Angaben des Unternehmens schon heute nicht mehr möglich, Rückschlüsse auf den Ausgangstext zu ziehen, auch wenn in diesem Bereich aktuell - zumindest bei mir - noch Restzweifel bleiben...

Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%