Soziale Intelligenz

ICH: Soll ich ins Bett gehen, Siri?





Siri: Ich denke, du solltest drüber schlafen.

Neue Technologien: 2012

Diese Geschichte war Teil unserer Ausgabe vom Mai 2012

  • Siehe den Rest der Ausgabe
  • Abonnieren

Es ist schwer, eine solche schlaue Antwort nicht zu bewundern. Siri – der intelligente persönliche Assistent, der in Apples iPhone 4S integriert ist – zeigt oft diese Art von Einstellung, insbesondere wenn eine Frage gestellt wird, die sich über seine künstliche Intelligenz lustig macht. Aber die Antwort ist nicht der Witz einiger bissiger Programmierer. Es ist ein entscheidender Teil, warum Siri so gut funktioniert.



Die Popularität von Siri zeigt, dass ein digitaler Assistent mehr als nur Intelligenz braucht, um erfolgreich zu sein; es braucht auch Fingerspitzengefühl, Charme und überraschenderweise Witz. Fehler verursachen bei jeder Computerschnittstelle Frustration und Ärger. Das Risiko wird dramatisch verstärkt, wenn man sich als persönlicher Konversationsassistent ausgibt, eine Tatsache, die in der Vergangenheit einige sozial verkümmerte virtuelle Assistenten zunichte gemacht hat. Für Siri kann es also genauso wichtig sein, sympathisch und gelegentlich verrückt zu sein, wie mit Meisterleistungen der maschinellen Intelligenz zu glänzen.

Bewertete Dinge

  • Siri (Beta-Version, läuft auf iPhone 4)

  • ANFANG

    http://start.csail.mit.edu

  • Der Mann, der seinen Laptop angelogen hat: Was uns Maschinen über menschliche Beziehungen beibringen

    Clifford Nass
    Aktuell, 2010



Siri hat seinen Ursprung in einem 2003 begonnenen und von der Defense Advanced Research Projects Agency (DARPA) des US-Militärs finanzierten Forschungsprojekt. Die Bemühungen wurden von SRI International geleitet, die 2007 ein Unternehmen ausgliederten, das im Februar 2010 die Originalversion von Siri als iPhone-App veröffentlichte (die Technologie wurde unter Technologieüberprüfung 's 10 Emerging Technologies im Jahr 2009). Dieser frühere Siri konnte weniger Dinge tun als der, der später in das iPhone 4S eingebaut wurde. Es konnte auf eine Handvoll Online-Dienste zugreifen, um Restaurantreservierungen vorzunehmen, Kinokarten zu kaufen und Taxis zu buchen, aber es war fehleranfällig und kam bei den Benutzern nie gut an. Apple kaufte das Startup hinter Siri nur zwei Monate nach dem Debüt der App für eine nicht genannte Summe.

Der eineinhalb Jahre später erschienene Siri funktioniert erstaunlich gut. Es hört auf gesprochene Befehle (in Englisch, Französisch, Deutsch und Japanisch) und antwortet entweder mit einer entsprechenden Aktion oder einer Antwort, die mit einer ruhigen, angemessen roboterhaften weiblichen Stimme gesprochen wird. Bitten Sie Siri, Sie um 8:00 Uhr zu wecken, und der Wecker des Telefons wird entsprechend eingestellt. Sagen Sie Siri, dass sie einem Freund eine SMS senden soll, und er nimmt pflichtbewusst ein Diktat auf, bevor er Ihr Schreiben abfeuert. Sag Wo finde ich einen Burrito, Siri? und Siri wird eine Liste mit gut bewerteten mexikanischen Restaurants in der Nähe anbieten, die durch Abfragen des Standortsensors des Telefons und Durchführen einer Web- und Kartensuche gefunden werden. Dank der Online-Antwort-Engine Wolfram Alpha, die Zugriff auf viele Datenbanken hat, hat Siri auch unzählige Zahlen und Fakten zur Hand. Frage Was ist der Radius von Jupiter? und Siri wird Ihnen beiläufig mitteilen, dass es 42.982 Meilen sind.

Die charismatische Qualität von Siri fehlt in anderen natürlichsprachlichen Schnittstellen völlig. Mehrere Unternehmen verkaufen virtuelle Kundendienstmitarbeiter, die in der Lage sind, online mit Kunden in getipptem Text zu chatten. Ein Beispiel ist Eva, erstellt von der spanischen Firma Indysis. Eva kann bequem chatten, es sei denn, das Gespräch beginnt, von den Bereichen abzuweichen, über die sie trainiert wurde. Wenn dies der Fall ist, wird Eva eher grob versuchen, Sie auf diese Themen zurückzudrängen.



Siri hat auch einige engere Konkurrenten in Form von Apps für iPhones und Android-Geräte. Evi, gemacht von Wahrem Wissen; Dragon Go von der Spracherkennungsfirma Nuance; und Iris des indischen Softwareunternehmens Dexetra sind allesamt Variationen des Themas eines sprachgesteuerten persönlichen Assistenten und können Siris Fähigkeit, einfache Aufgaben zu verstehen und auszuführen oder Informationen abzurufen, oft mithalten. Aber sie sind viel weniger sozial versiert. Als ich Iris fragte, ob es der Meinung wäre, ich solle schlafen gehen, war seine flache, humorlose Antwort.

So beeindruckend Siri auch ist, die beteiligte KI ist jedoch nicht allzu ausgereift. Boris Katz, leitender Forscher am Computer Science and Artificial Intelligence Lab des MIT, der seit Jahrzehnten Maschinen baut, die menschliche Sprache analysieren, vermutet, dass Siri sich nicht viel Mühe gibt, um zu analysieren, was eine Person fragt. Anstatt herauszufinden, wie die Wörter in einem Satz zusammenwirken, um eine Bedeutung zu vermitteln, erkennt Siri oft nur einige wenige Schlüsselwörter und ordnet sie einer begrenzten Anzahl vorprogrammierter Antworten zu. Sie haben ihm ein paar Dinge beigebracht, und das System erwartet diese Dinge, sagt er. Sie sind sehr schlau, was die Leute normalerweise fragen.

Im Gegensatz dazu hat die konventionelle Forschung über künstliche Intelligenz versucht, komplexere Bedeutungen in Gesprächen zu analysieren. 1985 begann Katz mit dem Aufbau eines Systems namens START, um Fragen durch die Verarbeitung von Satzstrukturen zu beantworten. Dieses System beantwortet getippte Fragen, indem es analysiert, wie die Wörter angeordnet sind, um die Bedeutung des Gefragten zu interpretieren. Auf diese Weise kann START komplexe oder mehrdeutige Fragen beantworten.



Im Jahr 2006 – ein Jahr bevor SRI sein Startup ausgliederte – demonstrierten Katz und Kollegen einen auf START basierenden Software-Assistenten, auf den durch Eingabe von Abfragen in ein Mobiltelefon zugegriffen werden konnte. Das Konzept ist Siri bemerkenswert ähnlich, aber dieser Teil des START-Projekts kam nie weiter. Es blieb weniger wichtig als Katz' Verfolgung seines eigentlichen Ziels – eine Maschine zu schaffen, die der menschlichen Fähigkeit, Sprache besser zu verwenden, besser gerecht wird.

Um zu verstehen, wie schwierig es ist, die Kommunikation richtig zu gestalten, brauchen Sie nicht weiter zu suchen als den berüchtigten intelligenten Assistenten Clippy, der 1997 von Microsoft eingeführt wurde.

START ist nur ein winziger Ableger der Forschung zur künstlichen Intelligenz, die etwa 50 Jahre zuvor begann, die Funktionsweise des menschlichen Geistes zu verstehen und etwas Analoges in Maschinen zu schaffen. Diese Bemühungen haben viele wirklich bemerkenswerte Technologien hervorgebracht, die in der Lage sind, Rechenaufgaben zu erledigen, die für den Menschen unglaublich kompliziert sind. Aber die Forschung über künstliche Intelligenz hat es versäumt, viele Aspekte des menschlichen Intellekts, einschließlich Sprache und Kommunikation, neu zu erschaffen. Wie Katz erklärt, kann ein einfaches Gespräch zwischen zwei Menschen die ganze Tiefe der Lebenserfahrungen eines Menschen erschließen, und dies bleibt in einer Maschine unmöglich nachzuahmen. Auch wenn KI-Systeme beim Zugriff auf, bei der Verarbeitung und Präsentation von Informationen besser geworden sind, hat sich die menschliche Kommunikation ihnen weiterhin entzogen.

Obwohl Siri weniger in der Lage ist, mit der Komplexität der Sprache umzugehen als START, zeigt es, dass eine Maschine gerade genug Tricks ausführen kann, um den Benutzern das Gefühl zu geben, dass sie ungefähr so ​​etwas wie ein echtes Gespräch führen. Um zu verstehen, wie schwierig es ist, selbst einfache textbasierte Kommunikation richtig zu machen, brauchen Sie nicht weiter zu suchen als den berüchtigten intelligenten Assistenten, der 1997 von Microsoft eingeführt wurde. Diese nervige virtuelle Büroklammer namens Clippy tauchte immer dann auf, wenn ein Benutzer eine Dokument, das Hilfe bei einer Nachricht wie der wütenden Zeile bietet Es sieht so aus, als würden Sie einen Brief schreiben. Möchten Sie Hilfe? Microsoft erwartete, dass Benutzer Clippy lieben würden. Bill Gates dachte, dass Fans Clippy-T-Shirts, -Tassen und -Websites entwerfen würden. Das Unternehmen war also fassungslos und verwirrt, als die Benutzer Clippy hassten und T-Shirts, Tassen und Websites erstellten, die darauf ausgerichtet waren, es herabzusetzen. Die Reaktion war so schlecht, dass Microsoft Clippy 2007 tötete.

Zuvor beauftragte Microsoft den Stanford-Professor Clifford Nass, einen Experten für Mensch-Computer-Interaktion, um herauszufinden, warum das Programm so viel Unannehmlichkeiten verursacht hatte. Nass, der Autor von Der Mann, der seinen Laptop angelogen hat: Was uns Maschinen über menschliche Beziehungen lehren hat Jahre damit verbracht, ähnliche Phänomene zu untersuchen, und seine Arbeit legt eine ziemlich einfache Ursache nahe: Menschen wenden instinktiv die Regeln menschlicher sozialer Interaktionen auf den Umgang mit Computern, Mobiltelefonen, Robotern, Navigationssystemen im Auto und ähnlichen Maschinen an. Nass erkannte, dass Clippy so ziemlich jede Norm akzeptablen Sozialverhaltens brach. Es machte immer wieder die gleichen Fehler und belästigte ständig Nutzer, die in Ruhe gelassen werden wollten. Clippys Problem war, dass er sagte: 'Ich werde alles tun' und dann enttäuschte, sagt Nass. So wie ein Mensch, der immer wieder die gleiche Antwort wiederholt, uns beleidigt fühlt, sagt Nass, so auch eine Computerschnittstelle – selbst wenn wir genau wissen, dass wir es mit einer Maschine zu tun haben.

Clippy zeigte, dass der Versuch einer menschenähnlicheren Kommunikation spektakulär nach hinten losgehen kann, wenn die Feinheiten des Sozialverhaltens nicht verstanden und respektiert werden. Nass sagt, Apple habe alles getan, um Siri sympathisch zu machen. Siri drängt sich dem Benutzer überhaupt nicht auf. Die Anwendung läuft auf dem iPhone im Hintergrund und springt erst dann auf, wenn der Nutzer den Home-Button gedrückt hält oder das Telefon ans Ohr hält und zu sprechen beginnt. Es vermeidet auch, denselben Fehler zweimal zu machen und verschiedene Antworten auszuprobieren, wenn der Benutzer eine Frage wiederholt. Sogar der Ton von Siris Stimme wurde sorgfältig ausgewählt, um harmlos zu sein, glaubt Nass.

Apple hat auch die Aufgaben, die Siri ausführen kann, und die Antworten, die es geben kann, eingeschränkt, höchstwahrscheinlich, um Enttäuschungen zu vermeiden. Wenn Sie Siri beispielsweise bitten, etwas auf Twitter zu posten, wird sie verlegen zugeben, dass sie nicht weiß, wie. Da die Alternative jedoch darin bestehen könnte, versehentlich verstümmelte Tweets zu senden, ist diese Strategie verständlich.

Die Genauigkeit der Spracherkennung von Siri hilft auch, Enttäuschungen zu vermeiden. Das System hört manchmal Wörter falsch, oft mit amüsanten Ergebnissen. Tut mir leid, Will, ich verstehe nicht „Ich brauche Pyjamas“ war eine merkwürdige Antwort auf eine Frage, die nichts mit Pyjamas zu tun hatte. Aber meistens funktioniert das Sprachsystem bemerkenswert gut. Es hat kein Problem mit meinem englischen Akzent oder mit vielen komplexen Wörtern und Sätzen, und diese allgemeine Genauigkeit macht den einen oder anderen Fehler viel akzeptabler.

Eine der größten Herausforderungen für Apple bestand darin, dass eine Person kurz nach der Begegnung mit Siri möglicherweise einen starken Drang verspürt, diesen virtuellen Besserwisser zum Stolpern zu bringen: ihn nach dem Sinn des Lebens zu fragen, ob er an Gott glaubt oder ob er R2D2 kennt. Apple hat sich entschieden, mit diesem Phänomen auf eine erfinderische Weise umzugehen: indem er dafür sorgt, dass Siri den Witz versteht und mitspielt. So hat es eine clevere Antwort auf fast jeden Curveball, der auf ihn geworfen wird, und variiert sogar seine Reaktionen, ein Trick, der ihn manchmal unheimlich menschlich erscheinen lässt.

Dieses Geplänkel hilft auch, den Schlag zu mildern, wenn Siri etwas falsch versteht oder von einer überraschend einfachen Frage ratlos wird. Als ich einmal fragte, wer den Super Bowl gewonnen hat, wurde stolz ein koreanischer Won für mich in Dollar umgewandelt. Ich wusste, dass dies nur ein algorithmischer Fehler in einer entfernten Bank von Computerservern war, aber ich verspürte auch den Drang, es so zu interpretieren, dass Siri verrückt sei.

Nass sagt, wie Siri mit Humor umgeht, ist inspiriert. Untersuchungen haben ergeben, dass Humor Menschen schlauer und sympathischer erscheinen lässt. Intermittierender, unschuldiger Humor hat sich sowohl für Menschen als auch für Computer als effektiv erwiesen, sagt Nass. Es ist sehr positiv, selbst für die langweiligste, stete Computerschnittstelle.

Aber Katz, der seit Jahrzehnten bestrebt ist, Maschinen die Fähigkeit zu verleihen, Sprache zu verwenden, hofft, dass irgendwann etwas viel Anspruchsvolleres als Siri auftaucht: eine Maschine, die echte Gespräche mit Menschen führen kann. Solche Maschinen könnten grundlegende Einblicke in die Natur der menschlichen Intelligenz liefern, sagt er, und sie könnten eine natürlichere Möglichkeit bieten, Maschinen beizubringen, intelligenter zu sein.

Das könnte weiterhin der Traum von KI-Forschern sein. Für den Rest von uns ist die Einführung eines virtuellen Assistenten, der tatsächlich nützlich ist, jedoch ein ebenso grundlegender Durchbruch. In Katz 'Büro am MIT habe ich ihm einige der amüsanten Antworten gezeigt, die Siri bekommt, wenn sie provoziert wird. Er kicherte und bemerkte die Klugheit der Ingenieure, die Siri entworfen hatten, aber er sprach auch als KI-Forscher mit Bedeutungen und Wörtern, mit denen Siri zweifellos zu kämpfen hätte. Es ist nichts falsch daran, Spielereien zu haben, sagte er, aber es wäre schön, wenn es wirklich gründlich analysieren könnte, was Sie gesagt haben. Die Gespräche mit dem Benutzer werden so viel reichhaltiger.

Katz hat Recht, dass ein revolutionärer intelligenter persönlicher Assistent – ​​einer, der viele kompliziertere Aufgaben ausführen kann – eine fortschrittlichere KI benötigen wird. Aber auch darin steckt eine wichtige Innovation hinter Siri. Nachdem er die App eine Weile länger getestet hatte, gestand Katz, dass er Unternehmer bewundert, die wissen, wie man Fortschritte in der Informatik in etwas verwandelt, das der Normalbürger jeden Tag nutzen kann. Ich wünschte, ich wüsste, wie die Leute das machen, gibt er zu.

Für die Antwort muss er vielleicht einfach weiter mit Siri sprechen.

Will Knight ist Technologieüberprüfung 's Online-Redakteur.

verbergen