Voice-Services in der Verlagswelt

Voice-Service stehen bei vielen deutschen Publishern auf der Agenda, seit Amazons Echo auch hierzulande erhältlich ist. Echo bietet über den Sprachassistenten Alexa vielfältige Sprachanwendungen wie das Abspielen von Musik, das Erstellen von Einkaufslisten, der Ruf nach einem Taxi oder das Steuern der Rollläden und der Heizung, sofern diese an das Internet angeschlossen sind. Über Alexa können aber auch Publisher ihre Verlagsinhalte audiovisuell verbreiten, und das sogar ziemlich elegant. Aufgrund der vielfältigen Anwendungen, sollen daher laut dem Marktforschungsinstitut Gartner bereits 30% aller Device-Interaktionen bis zum Jahr 2020 Voice-basiert sein.

Many teens already use voice search daily and new audio-centric technologies, such as Apple’s AirPods, Google Home and Amazon’s Echo, are turning “voice first” interactions into ubiquitous experiences. By eliminating the need to use your hands and eyes for browsing, vocal interactions extend the web experience to multiple activities such as driving, cooking, waking, socializing, exercising, operating machinery, etc. By the end of 2017, watch for room-based screenless devices to be in more than 10 million homes.

Alexa ist zwar nicht der erste Sprachassistent bzw. Voice-Service dieser Art, Siri von Apple gibt es bereits seit es das iPhone 4s gibt, und auch Google bietet über seine Box Google Home (ab kommenden Jahr auch in Deutschland erhältlich) die Steuerung allerlei Anwendungen über einen Sprachassistenten an. Doch mit Alexa scheint Amazon in Deutschland am Durchbruch der Sprachassistenten zu arbeiten und dies weckt daher auch die Phantasien deutscher Verlagshäuser, nicht zuletzt, weil Amazon auf dem diesjährigen
Digital Innovators Summit Anwendungsbeispiele aus dem Publishingbereich zeigte, unter anderem von Spiegel Online. Max Amordeluso, EU Head of Alexa Skills Kit (ASK), sagte in seinem Vortrag: „If you do it right, it is very close to magic“. Und irgendwie werde ich das Gefühl nicht los, dass er damit recht haben könnte. (Der Vortrag von Max Amordeluso ist auf
YouTube nachzuhören.)

In der Verlagswelt sind sprachgesteuerte Search-Services wie das Suchen aktueller Nachrichten, daher ein wichtiges Thema. In einem Beitrag auf
OnetoOne äußerte sich kürzlich Arne Wolter, Chief Digital Officer von Gruner + Jahr, zu Voice-Services. Er sagte: „Neben den Chatbots, liegt die Zukunft vor allem bei den Sprachassistenten und Amazons Alexa wird nur einer von vielen sein. In Zukunft wird es nicht mehr ausreichen bei Google unter den Top Ten zu sein, denn wenn Sie nicht die Nummer Eins bei Voice Search sind, sind Sie raus.“

Unter den Anwendungen die in Deutschland bereits erhältlich sind, den sogenannten „Skills“, findet man bereits viele bekannte Verlage, deren Nachrichten per Voice-Service vorgelesen werden. Voraktiviert sind die wichtigsten Nachrichten der Tagesschau oder von ZDFheute Xpress, Bild oder Nachrichten von der Sportschau, aber auch Branchenmagazine wie das Werbefachmagazin Horizont bietet seine wichtigsten Nachrichten des Tages über Alexa an. Für Echo finden sich derzeit in der Suche schon über 100 Anwendungen für Nachrichten, alleine für den deutschen Markt, und es macht Spaß, diese nach und nach zu testen und in den Alltag zu integrieren. International hat kürzlich die
Hearst Corp. für Aufmerksamkeit gesorgt, als es „O to Go“ für Alexa vorstellte. Unter diesem Skill liest Oprah Winfrey kurze Textstellen aus ihrem Buch vor, es würde mich daher nicht wundern, wenn auch bald in Deutschland Buchverlage auf den Trend aufspringen und diese Form der Wiedergabe nutzen.

Doch es braucht noch viel Entwicklungsarbeit bzw. ein Umdenken und Mitmachen der User. Denn Alexa hört bislang nur auf die Sprachkommandos, die vorgegeben sind, bzw. in den „Skills“ zu den einzelnen Anwendungen zu finden sind. Diese Kommandos just-in-time parat zu haben, wenn man sie denn mal braucht, gleicht beinahe dem Erlenen einer neuer Fremdsprache. Zudem müssen die Skills immer wieder nach aktuellen Anwendungen durchsucht werden und sie sind vergleichbar mit der Suche nach geeigneten Apps im App-Store. Doch je mehr Skills verfügbar sind, desto wahrscheinlicher wird es sein, dass sie niemals den Weg zum Konsumenten finden. Es sei denn, dass in naher Zukunft auf die Frage: „Alexa, installiere die neuesten Skills, die für mich wichtig sein könnten“, Alexa selbstständig mit einer Auswahl geeigneter Anwendungen auf die Bedürfnisse eines jeden einzelnen Nutzers reagieren kann.

Vielleicht klappt das auch schneller, als man denkt, denn Alexa lernt mit. Das System hört in eingeschaltetem Modus über sieben hochempfindliche Mikrofone zu. Alexa streamt die Sprach-Anweisungen in die Cloud und dort werden diese in einen digitalen Text umgewandelt. Mit Hilfe eines Algorithmus werden anschließend die Befehle geordnet und die passenden Antworten über „Text to Speech“ herausgegeben. Natürlich kommt es noch sehr häufig vor, dass Alexa keine Antwort auf eine Frage oder ein Kommando weiß, zum Beispiel wenn das Kommando nicht richtig ausgesprochen wird oder eine Frage gestellt wird, die genau zu den Dingen zählen, die sie nicht kennt. Aber es wird nur eine Frage der Zeit sein, bis Alexa auch Dialekt verstehen kann oder Fragen beantwortet, die so noch nicht in ihren Anwendungen vorprogrammiert sind.

Für Verlage bedeuten Voice-Services in erster Linie, das Nachrichtenangebot per Sprache verfügbar zu machen, und alleine diese Möglichkeit weckte eine heimliche Begeisterung bei den anwesenden Publishern auf dem Digital Innovation Summit in Berlin. Es wurde schnell klar, dass Voice-Services für Verlage derzeit zwar noch eine Spielerei sind, aber zukünftig auch ein Weg sein werden, um Zielgruppen zu erreichen.