6 Kerntechnologien für Voice User Interfaces
Natural Language Generation, Speech Synthesis, Emotionserkennung …
Damit Voice User Interfaces von den Nutzern angenommen werden, muss die dahintersteckende künstliche Intelligenz folgende Fähigkeiten mitbringen, meint John Grøtting, Group Design Director bei der Service-Design-Beratung Fjord in Berlin.
1 Natural Language Generation
Um natürlich klingende Sätze bilden zu können, muss das Voice User Interface Wörter aus einer Datenbank ziehen und diese grammatikalisch und kontextuell sinnvoll verknüpfen. Für sich wiederholende Formulierungen sollte die KI in der Lage sein, Variationen herzustellen.
2 Speech Synthesis
Das VUI sollte eine echt wirkende Stimme verwenden. Früher hat man Stimmen aufgenommen, sie in einzelne Lautbestandteile zerlegt und wieder zusammengesetzt, mit dem Ergebnis, dass die Stimme künstlich, abgehackt und unbeteiligt klingt. Die WaveNet-Technologie von Google DeepMind erzeugt Stimme und Intonierung synthetisch über einen Algorithmus. Zu diesem Zweck wird diese Technik seit einiger Zeit mit Googles aktueller Sprachausgabe trainiert und soll bald zum Einsatz kommen.
3 Natural Language Understanding
Sprache ist ein komplexes Gebilde, weil sie viele Aussagen impliziert, die die KI nicht erkennt. So besagt der Satz »Ich esse kein Fleisch mehr« neben der primären Bedeutung auch, dass ich es irgendwann getan habe. Außerdem verlangt der Nutzer, dass die KI eine Aussage versteht, auch wenn der Satzbau grammatikalisch nicht ganz korrekt ist.
4 Big Data Networks
Um eine Frage zu beantworten, graben IBM Watson und andere KI-Systeme nicht nur in einer Datenbank, sondern in Datenbanken rund um den Globus.
5 Voice ID
Authentifizierung über das persönliche Stimmmuster sind bereits möglich. Als erster Hersteller arbeitet Amazon gerade an einer Lösung für seinen Home Speaker Echo.
6 Emotionserkennung
Ein VUI ist dann perfekt, wenn es die emotionale Gefühlslage des Nutzers erkennt und darauf reagiert, was aber bisher noch keiner KI gelingt.
Mehr zum Thema »Voice User Interfaces« lesen Sie in PAGE 12.2017:
[2565]
Merken
Merken
Das könnte dich auch interessieren