Amazon arbeitet daran, Alexa dazu zu bringen, Ihre Emotionen zu erkennen

Es kann unglaublich frustrierend sein, wenn ein virtueller Assistent wiederholt missversteht, was Sie sagen. Bald könnten einige von ihnen jedoch zumindest die Verärgerung in Ihrer Stimme hören und sich entschuldigen.





Amazon arbeitet an bedeutenden Updates für Alexa, den virtuellen Helfer, der im sprachgesteuerten Haushaltsgerät des Unternehmens namens Amazon Echo lebt. Dazu gehören bessere Sprachkenntnisse und vielleicht die Fähigkeit, den emotionalen Tenor Ihrer Stimme zu erkennen.

Eine mit dem Echo-Projekt vertraute Quelle sagt, dass die Forscher von Amazon nach Möglichkeiten suchen, der Konkurrenz einen Schritt voraus zu sein, vor allem durch ein besseres Verständnis der Absicht eines Benutzers. Forscher erforschen neue Verarbeitungstechniken für natürliche Sprache, aber auch Möglichkeiten, die Emotion in der Stimme einer Person zu spüren. Wie menschliche Affekte erkannt und dann von [Alexas] Stimme reflektiert werden, wird ein Schlüsselbereich von [Amazons] Forschung und Entwicklung sein, sagt die Quelle.

Amazon brachte das Echo im November 2014 mit relativ wenig Tamtam auf den Markt. Das Gerät hat sich als Überraschungshit erwiesen, und die Konkurrenz hat es offensichtlich bemerkt.



Das Gerät scheint das Versprechen von Sprache als natürlichere und reibungslosere Art der Interaktion mit Technologie zu realisieren.

Wichtige Verbesserungen könnten Amazon dabei helfen, einen Vorsprung zu bewahren, während Google und Apple ihre eigenen sprachgesteuerten Heimgeräte hochfahren. Google hat kürzlich einen neuen virtuellen Assistenten und ein Echo-ähnliches Heimgerät namens Google Home angekündigt (siehe Google Endlich startet Siri Killer in Pivot Away from Conventional Search ). Und Apple ist gemunkelt daran zu arbeiten, Siri für App-Entwickler zu öffnen, und auch eine eigene Antwort auf das Echo zu entwickeln.

Obwohl andere sprachgesteuerte Software-Assistenten wie Apples Siri und Microsofts Cortana älter als Alexa sind, sind dies nur optionale Schnittstellen. Tatsächlich deuten Studien darauf hin, dass Siri hauptsächlich nur für wenige Aufgaben verwendet wird, hauptsächlich zum Anrufen von Personen, zum Senden von Textnachrichten und zum Einstellen von Alarmen. Der Echo ist der erste Computer, dessen Hauptschnittstelle Ihre Stimme ist. Die einzigen physischen Bedienelemente sind ein Ein-Aus-Schalter, eine Taste zum Stummschalten des Mikrofons und ein Knopf für die Lautstärke; kann aber auch per App gesteuert werden.



Allgemeine Verbesserungen des natürlichen Sprachverständnisses von Alexa dürften dem Gerät helfen, mehrdeutige Anfragen genauer zu interpretieren, indem Wahrscheinlichkeitstechniken angewendet werden, so die Quelle. Zum Beispiel könnte angenommen werden, dass eine Person, die sich in Seattle befindet, sich eher auf die Seahawks bezieht, wenn sie fragt: Wie geht es den Hawks?

Amazon verwendet bereits Daten über die Interessen eines Benutzers, um das Spracherkennungssystem vorzubereiten. Alexa erkennt beispielsweise eher Anfragen, Jazzkünstler von Benutzern zu hören, die zuvor Jazz zu ihrer digitalen Musikbibliothek hinzugefügt haben.

Weitere Verbesserungen werden dazu führen, dass Alexa besser in der Lage sein wird, ein Gespräch zu führen – sich daran zu erinnern, was eine Person zuvor gesagt hat, und dieses Wissen auf nachfolgende Interaktionen anzuwenden. Das ist einer der aktiven Bereiche, sagt die mit Amazons Forschung vertraute Quelle. Es ist äußerst wichtig, dass das Gespräch magisch ist.



Forscher haben lange vorhergesagt, dass emotionale Hinweise Maschinenschnittstellen viel intelligenter machen könnten, aber bisher wurde eine solche Technologie in keine Verbrauchertechnologie integriert.

Rosalind Picard , ein Professor am Media Lab des MIT, sagt, dass das Hinzufügen von Emotionserkennung zu persönlicher Elektronik sie verbessern könnte: Ja, definitiv, das ist genau richtig. In einem Buch von 1997 Affektives Rechnen , erwähnte Picard zuerst die Idee, die Stimme eines virtuellen Helfers als Reaktion auf den emotionalen Zustand eines Benutzers zu ändern. Das merkt sie Nachforschungen haben ergeben wie die Abstimmung der Stimme eines Computers auf die einer Person die Kommunikation effizienter und effektiver machen kann. Es gibt viele Möglichkeiten, wie es helfen könnte, sagt sie.

Die Software, die benötigt wird, um den emotionalen Zustand in der Stimme einer Person zu erkennen, existiert bereits. Seit einiger Zeit verwenden Telefonsupportunternehmen diese Technologie, um zu erkennen, wenn ein Kunde beim Umgang mit einem automatisierten System irritiert wird. In den letzten Jahren haben neue maschinelle Lerntechniken den Stand der Technik verbessert und es ermöglicht, mehr emotionale Zustände mit größerer Genauigkeit zu erkennen, obwohl der Ansatz bei weitem nicht perfekt ist.

Trotzdem ist die Relevanz von Emotionen offenbar einigen großen Technologieunternehmen aufgefallen. Im Januar kaufte Apple Emotient, ein Unternehmen, das sich auf die Erkennung von Emotionen spezialisiert hat, hauptsächlich durch Gesichtsausdrücke.

Rob May, CEO von Größe , ein Unternehmen, das Software-Agenten für Unternehmen entwickelt, sagt, dass eine bessere Sprachanalyse und Erkennung emotionaler Zustände virtuelle Assistenten verbessern könnten, aber es wäre noch besser, wenn Benutzer sie schulen könnten, um neue Aufgaben selbst zu erledigen. Wenn ich in Apples Schuhen stecken würde, würde ich einen Weg finden, den Leuten die Möglichkeit zu geben, Siri zu trainieren, sagt er.

verbergen