Benachrichtigung aktivieren Dürfen wir Sie in Ihrem Browser über die wichtigsten Nachrichten des Handelsblatts informieren? Sie erhalten 2-5 Meldungen pro Tag.
Fast geschafft Erlauben Sie handelsblatt.com Ihnen Benachrichtigungen zu schicken. Dies können Sie in der Meldung Ihres Browsers bestätigen.
Benachrichtigungen erfolgreich aktiviert Wir halten Sie ab sofort über die wichtigsten Nachrichten des Handelsblatts auf dem Laufenden. Sie erhalten 2-5 Meldungen pro Tag.
Jetzt Aktivieren
Nein, danke
Digitale Revolution

Digitale Revolution Warum Marken in Zukunft eine Stimme brauchen

Das Einkaufen verlagert sich immer mehr auf die Stimme: V-Commerce heißt der neue Kaufkanal – und Unternehmen und Marken arbeiten an entsprechenden Voice-Strategien.
Kommentieren
Apple HomePod, Amazon Echo und Google Home (v.l.). Quelle: JENS MORTENSEN - The New York Times - Redux - laif [M]
Smarte Lautsprecher

Apple HomePod, Amazon Echo und Google Home (v.l.).

DüsseldorfGoogle gab vor einem Jahr einen ersten spektakulären Einblick in die neue Welt der Sprachsteuerung. Bei der Entwicklerkonferenz I/O im Shore‧line Amphitheatre in Mountain View stellte CEO Sundar Pichai den telefonierenden Assistenten Google Duplex vor.

Es folgte ein Telefonat zwischen dem Google-Computer und einer Friseurin, es ging um die Vereinbarung eines Haarschneidetermins. Alles lief reibungslos, die Friseurin bekam gar nicht mit, dass ihr Gesprächspartner kein Mensch war, sondern ein Bot. Vor allem dessen Zwischentöne wie „aha“ und „hm“ zeigten, wie menschlich sich inzwischen Computerstimmen anhören.

Willkommen in der neuen sprachgesteuerten Welt. Sprachassistenten wie Siri von Apple oder Bixby von Samsung, aber auch vernetzte Lautsprecher wie Amazon Echo und Google Home machen den Computerbildschirm in Teilen überflüssig. Das amerikanische Marktforschungsunternehmen Comscore geht davon aus, dass bereits 2020 die Hälfte aller weltweiten Suchanfragen über die Sprache abgewickelt wird.

Aber nicht nur die Suche, auch das Einkaufen verlagert sich immer mehr auf die Stimme: V-Commerce heißt der neue Kaufkanal – und immer mehr Unternehmen und Marken arbeiten an entsprechenden Voice-Strategien. Denn es gilt: Wer jetzt nicht dabei ist, hat schon verloren.

„In recht naher Zukunft werden wir uns in tiefen und klugen Dialogen mit Maschinen wiederfinden, die so gar nichts mit den heute teils noch lächerlichen Antworten von Alexa und Siri zu tun haben“, meint Christian Daul, CEO der auf Sprache spezialisierten Kommunikationsagentur Reinsclassen in Hamburg.

Voice könnte einen wahren Paradigmenwechsel im Marketing herbeiführen. „Ich gehe davon aus, dass in den nächsten Jahren hier stark von allen Seiten investiert wird und noch bis zu zehn Jahre vergehen, bis wirklich alle Aspekte in Technik und Marketing auf hohem Niveau sind“, sagt Daul.

„Wir müssen reden!“ lautet das neue Credo der Unternehmen. Medienmarken wie die „Tagesschau“, „Gala“ und der Bayerische Rundfunk haben beispielsweise bereits Amazon-Skill-Angebote. Skills nennen sich die kleinen Programme für Amazon Echo.

Audio-Identität gesucht

Auch der Autovermieter Sixt und das Nivea-Wetter sind Beispiele, wie Marken Verknüpfungen zwischen ihren Angeboten und den Bedürfnissen der Hörer herstellen können. „Es muss nicht immer das berühmte Kochrezept-Beispiel sein, bei dem man Teig an den Händen hat und daher nur hören kann“, meint Berater Daul. „Nahezu alle großen Marken machen sich Gedanken und haben Taskforces, aber vieles ist noch unsichtbar, denn das Thema ist in Teilen noch schwer zu greifen.“

In der Studie „The Age of Voice“ hat die Mediaagentur OMD die Akzeptanz der Nutzer für Sprachsteuerung untersucht. Sprachassistenten dienen demnach als Einstiegstechnologie. Bei intensiver Nutzung sei der Schritt hin zum smarten Lautsprecher klein, heißt es.

Grafik

Sechs Prozent der befragten Deutschen hätten bereits Produkte über Voice gekauft, weitere 35 Prozent könnten es sich vorstellen. Nutzer von smarten Lautsprechern und Sprachassistenten seien also offen für V-Commerce. Als Türöffner dienten Unterhaltung, niedrigpreisige Produkte sowie zeitsparende Dienstleistungen.

Marken brauchen künftig eine Audio-Identität. So wie schon vor vielen Jahren die Deutsche Telekom mit ihrer markanten Tonfolge, der Autohersteller Audi mit seinem Herzschlag oder die Baumarktkette Hornbach mit „Yippie Ja Ja Yippie Yippie Yeah“. Nur dass es dieses Mal nicht nur um kurze Sequenzen geht, sondern um eine ganze Soundwelt.

Kate Burgarth, Managing Director der Mediaagentur OMD Hamburg, hat die Studie erstellt und weiß: „Viele Unternehmen sind längst noch nicht so weit.“ Marken, die auf Amazon mit ihren Angeboten visuell präsent sind, böten keinen entsprechenden Audio-Content. „Das wird momentan noch unterschätzt.“ Nach Einschätzung der Mediaexpertin wird es in Deutschland noch ein bis zwei Jahre dauern, bis sich die akustischen Angebote entsprechend gebildet haben.

Erste Vorreiter entstehen derzeit, zum Beispiel Rewe Digital. „Hey Google, frag Rewe nach einem Lasagnerezept“ kann beispielsweise der Einstiegauftrag lauten. Das Programm „Caro“ assistiert als smarte Kochhilfe. Ist einmal das richtige Rezept gefunden, fragt Caro zum Beispiel, ob die Liste der Zutaten benötigt wird oder ob es mit dem Kochen losgehen soll.

Auch der Versicherer Ergo arbeitet bereits an den ersten Skills für Amazon Echo. Dabei geht es vor allem um drei Bereiche: den innerbetrieblichen Einsatz für Vertriebspartner, den Kundenservice sowie um den Verkaufsbereich, und zwar für eine Reiseversicherung. Diese Versicherung können sich Nutzer via Sprache erklären lassen und direkt abschließen.

„Es entsteht eine völlig neue Kundenschnittstelle“, sagt Gregor Wiest, Head of Innovation bei Ergo. Nach der mobilen kommt nun die akustische Revolution. „Wir gehen sehr nachhaltig mit dem Thema Voice um.“ Da seien zum Beispiel Fragen wie „Wie muss sich Ergo als Sprache anhören?“ zu klären. „Es ist wichtig, dass Ergo auf dialogbasierten Systemen ein einheitliches und gutes Nutzererlebnis hinterlässt“, meint Wiest.

Der Versicherer hat bereits eine eigene Voice-Unit mit einigen Mitarbeitern aufgebaut, die von Nicolas Konnerth geführt wird. Derzeit nutzt das Unternehmen die Stimme von Alexa, eine eigene Ergo-Stimme gibt es nicht. Das sei ausgesprochen aufwendig, meint Konnerth, schließlich müsse ein eigener Sprecher Tausende von Gesprächsschnipseln aufsagen, um damit einen möglichst passgenauen Dialog zu ermöglichen. Und sein Team muss entscheiden: Welche Tonalität passt zur Marke, wie humorvoll, wie flott darf die Sprache sein?

„Es gibt nur ganz wenige Unternehmen, die an ein hörbares Signal geknüpft sind“

Digitale Dialoge zu führen ist für Unternehmen knifflig, weil sie auf alles eine Antwort haben sollten. „Wenn Social Media schon Stress war, dann ist Voice noch mal anstrengender“, sagt Werber Daul. Voice werfe große Fragen auf und binde zusätzliche Ressourcen und erfordere auch firmenkulturelle Schritte in Richtung Offenheit, Transparenz und Haltung. „Daher spielen – wie bei einem menschlichen Dialogpartner – Werte eine große Rolle“, sagt Daul. „Wofür steht man? Wer spricht hier zu mir? Mit welcher Sprache? Corporate Language als Basis hat deshalb so eine wichtige Rolle.“

Jedes Wort, jeder Ton, jede Stimmlage wird künftig sehr viel wichtiger sein. „Dazu müssen Unternehmen und Marken erst einmal zuhören und vom Sender zum Empfänger werden, um dann wieder besser und effektiver senden zu können“, sagt Daul.

Das alles dient einem Ziel: Der smarte Lautsprecher muss die Marke als eines der ersten Suchergebnisse nennen, wenn der Nutzer ein bestimmtes Produkt oder eine Dienstleistung sucht. Das ist gänzlich anders als in der Textsuche, bei der Google seitenweise Suchergebnisse aufzeigt. In der Akustikwelt wird sich der Konsument allenfalls drei bis fünf Marken ansagen lassen. Der Kampf um die vorderen Plätze ist dementsprechend hart. Für Ergo-Manager Wiest sind es derzeit vor allem die Plattformen von Amazon und Google, die es zu bearbeiten gilt.

Hinzu kommt: Die Sprachsuche ist noch gar nicht entwickelt. Google Home beispielsweise sucht nur bei Google, während Alexa, Siri und Cortana auf Bing zugreifen. „Dann ist es wichtig, Keywords so zu verknüpfen, wie normale Menschen sie auch nutzen würden“, sagt Daul von Reinsclassen.

Sprache ist emotionaler

Eine Wissenschaft für sich. „Man muss den Kern des Nutzeranliegens getroffen haben“, erklärt Voice-Spezialist Konnerth. Und: „Die Voice-Skills müssen eine Relevanz bei den Plattformen erzeugen.“ Über entsprechende Tags bei der Veröffentlichung könnte dann die Auffindbarkeit auf den jeweiligen Plattformen verbessert werden, ähnlich den Schlagworten im SEO-Marketing.

Für den Werber Daul ist es deshalb umso wichtiger, dass Unternehmen zügig bestimmte Begriffe für ihre Marken besetzen. „Nach über 100 Jahren visuell dominiertem Marketing fällt es schwer, sich überhaupt Use-Cases vorzustellen und sich in eine rein akustische Marketingwelt hineinzudenken“, sagt er.

„Die Stimme zu nutzen, um etwas weiterzuerzählen, ist die älteste Kommunikationsform der Welt“, sagt OMD-Managerin Burgarth. „Eigentlich müsste es etwas Intrinsisches sein, aber wir haben es ein wenig verlernt.“ Sprache ist schneller, unüberlegter, aber auch emotionaler als geschriebene Worte. Insofern müssten die Inhalte in akustischen Skills anders sein als in visuellen Apps, meint die Mediamanagerin.

Gleichzeitig sei die Erwartung der Nutzer groß, dass die Bedienungsfreundlichkeit der sprachgesteuerten Skills genauso hoch ist wie die der Apps. „Das ist aber genau das, was die Menschen momentan am meisten frustriert – die passenden Skills sind deutlich schwerer zu finden und zu aktivieren“, meint Expertin Burgarth.

Eine ganz neue Branche mit Spezialisten für Voice bildet sich gerade heraus. Die Unternehmen heißen We Sound, Future of Voice, Nuuk und 169 Labs. Kleine Start-ups, die schnell wachsen. Future of Voice etwa, vor drei Jahren gegründet, hat derzeit 15 Mitarbeiter. Das Unternehmen arbeitet für Firmen wie die Ergo, den Bauer Verlag und die AOK. „Manche Kunden wissen sehr genau, was sie wollen, andere brauchen erst einmal einen Überblick“, erzählt Mitgründer Malte Kosub.

Für den Voice-Spezialisten ist klar: Der digitale Assistent muss in erster Linie einen Mehrwert für den Kunden bringen. Das kann eine Zeitersparnis sein, eine unterhaltsame Spielerei oder auch eine sinnvolle Ergänzung zu anderen Geräten wie dem TV-Gerät oder dem Handy. Für Kosub ist klar: Sobald die Bezahlfunktionen in die Skills integriert werden, die Nutzer also barrierefrei Produkte suchen und kaufen können, wird bei den Voice-Anwendungen ein großer Schub kommen.

Doch das bedarf auch einer großen Portion Vertrauen. Und dieses wurde zuletzt immer wieder durch Abhörskandale zerstört. Kürzlich kam heraus, dass Amazon-Mitarbeiter die Gesprächsaufzeichnungen von Alexa-Kunden angehört hatten. Ergo-Manager Konnerth sieht das Wachstum dennoch ungebrochen. „Diejenigen, die für diese Technologie bereit sind, haben eine andere Sensibilität“, ist er überzeugt.

Egal, ob es um Künstliche Intelligenz oder um Blockchain geht – die Geschwindigkeit, mit der neue Schlagwörter aus der digitalen Welt auf uns einprasseln, ist enorm. Doch was davon hat Substanz, was ist nur Hype? In unserer neuen Multimedia-Rubrik „Digitale Revolution“ beleuchten Handelsblatt-Redakteure, wie Digitalisierung unsere Unternehmen, unsere Gesellschaft und unseren Alltag verändert. Jede Woche nehmen sich die Redakteure eines Schwerpunktthemas an. Die unterschiedlichen Aspekte werden in mehreren Beiträgen multimedial aufbereitet. Dabei kommen interaktive Grafiken, Videos oder Bildergalerien zum Einsatz.

Startseite

Mehr zu: Digitale Revolution - Warum Marken in Zukunft eine Stimme brauchen

0 Kommentare zu "Digitale Revolution: Warum Marken in Zukunft eine Stimme brauchen"

Das Kommentieren dieses Artikels wurde deaktiviert.

Serviceangebote