Google an Entwickler: So können Sie aufhören, dumme Chatbots zu erstellen

Im Allgemeinen sind Computer nutzlos, um ein Gespräch zu führen. Sie nehmen die Dinge einfach etwas zu wörtlich. Aber Google bringt Computern bei, die Launen menschlicher Sprache und Texte zu verstehen.

Ab heute öffnet Google diese Algorithmen für externe Softwareentwickler. Die veröffentlichten Tools werden Programmierern helfen, sprachbasierte Apps und Dienste zu erstellen, die weniger anfällig für lästige Missverständnisse sind als viele der heutigen Chatbots. Und sie sollten dazu beitragen, Entwickler für die leistungsstarken Techniken des maschinellen Lernens zu begeistern, an denen Google feilt.

Googles eigene Beherrschung der Grammatik und Syntax hilft dem Unternehmen, genauere Suchergebnisse zu liefern, und dies wird immer wichtiger, da immer mehr seiner Geräte und Dienste auf die Sprachsteuerung angewiesen sind.

Smartphones, die auf Googles Software basieren, können natürlich bereits sprachgesteuert werden, und es wird allgemein angenommen, dass das Unternehmen Heimgeräte entwickelt, ähnlich wie Amazons Echo, die stärker auf Sprachinteraktion angewiesen sind. Die Veröffentlichung eines Tools, das das Sprachverständnis zugänglicher macht, ist also strategisch sehr sinnvoll.

Die meisten unserer Benutzer interagieren mit uns über Sprache, sagt Fernando Pereira, der die Bemühungen des Unternehmens im Bereich des natürlichen Sprachverständnisses und des maschinellen Lernens leitet. Sie stellen Fragen, getippt oder gesprochen. Damit wir dem Benutzer gute Dienste leisten können, müssen wir unsere Systeme dazu bringen, die Wünsche der Benutzer zu verstehen.

Eines der heute veröffentlichten Tools namens SyntaxNet kann lernen, die Bedeutung von Wörtern und Sätzen in Anbetracht ihres Kontexts und ihrer allgemeinen Verwendung zu verstehen. Dies funktioniert mit dem zuvor von Google veröffentlichten Deep-Learning-Framework namens TensorFlow. Und es ist die bisher komplexeste und anspruchsvollste Komponente, die mit TensorFlow erstellt wurde.

Google hat auch einen vortrainierten Parser für Englisch mit dem Namen Parsey McParseface veröffentlicht (ein Sprecher sagt, dass das Unternehmen Probleme hatte, einen Namen zu finden, als jemand diesen eingängigen Spitznamen vorschlug). In den Parser eingespeister Text wird automatisch in syntaktische Komponenten wie Substantive, Verben, Subjekte und Objekte zerlegt. Dies erleichtert es einem Computer, mehrdeutige Abfragen oder Befehle korrekt zu analysieren.

Google verlässt sich normalerweise auf Daten und maschinelles Lernen – und tatsächlich versuchen einige andere Ansätze, wie der von Facebook, Computern das Parsen von Sprache beizubringen, indem sie ihnen große Mengen weitgehend unbeschrifteter Daten zuführen (siehe Lehrmaschinen, uns zu verstehen). Aber Googles Sprachverständnisprojekt, beschrieben in ein Papier online, basiert stattdessen auf menschlichem Fachwissen. Seit mehr als acht Jahren arbeiten professionelle Linguisten an der Kommentierung von Texten für das Unternehmen. Und in jüngster Zeit wurden Fortschritte erzielt, indem diese Anmerkungen in ein großes neuronales Deep-Learning-Netzwerk eingespeist wurden.

Sprache zu verstehen ist für Computer unglaublich schwierig, weil Sprache oft mehrdeutig ist. Eine so einfache Suchabfrage wie Finde mich Katzen mit Hüten kann als Anfrage entweder nach Katzen mit Hüten oder nach Katzen mit Hüten interpretiert werden. Während Menschen Allgemeinwissen verwenden, um solche Sätze zu disambiguieren, nutzt Googles Technologie maschinelles Lernen. Sein mit syntaktischem Text trainiertes Deep-Learning-System trifft ein Urteil über die wahrscheinlich richtige Struktur einer Aussage. Im Fall von Katzen mit Hüten wird davon ausgegangen, dass der Suchende an modischen Katzen interessiert ist.

Dave Orr, der Produktmanager bei Google, der für die Suche nach kommerziellen Anwendungen für die Forschung des Unternehmens zum Sprachverständnis verantwortlich ist, demonstrierte mir die Technologie. Er speiste mehrere Artikel aus MIT Technology Review in eine interne Version des Sprachparsers. Es machte ein paar triviale Fehler – zum Beispiel das Wort will am Anfang eines Satzes mit meinem Vornamen zu verwechseln –, aber im Allgemeinen schien es, Sätze mit beeindruckender Genauigkeit zu kommentieren und syntaktische Strukturen zu identifizieren, die die Bedeutung der Überschrift oder des Leads korrekt erfassten. Es ist der beste Parser, den jemals jemand entwickelt hat, sagt Orr. Wir denken, es ist nah am menschlichen Niveau.

Intern kombiniert Google sein natürliches Sprachsystem mit einer Datenbank semantischer Informationen namens Knowledge Graph. Dadurch kann es bestimmte Objekte, Personen, Orte und andere Konzepte erkennen und entsprechend reagieren. Das System ist auch oft in der Lage, neue Wörter richtig zu klassifizieren, indem es sie mit anderen Wörtern vergleicht, die in einem ähnlichen Kontext vorkommen. Bisher funktioniert die Technologie für 15 Sprachen. Einige Sprachen sind sprachlich schwieriger zu analysieren, was das Training schwieriger macht, sagt Orr.

Die Technik ist jedoch noch lange nicht in der Lage, Englisch perfekt zu verstehen. Unsere Systeme funktionieren am besten mit gut strukturiertem, gut bearbeitetem Text, sagt Pereira. Die Unregelmäßigkeit von Social-Media- und Suchanfragen ist schwieriger. Da haben wir Fortschritte gemacht, aber es gibt noch viel Luft nach oben.

Es gibt auch noch viele Zweideutigkeiten, die ein menschliches Maß an gesundem Menschenverstand erfordern – Dinge, die wir aus Erfahrung und durch Anweisungen unserer Altersgenossen und unserer Eltern lernen, sagt Pereira. Diese Art von sehr reichhaltiger Fähigkeit, Probleme zu lösen, ist der Punkt, an dem unsere Systeme vollständig verloren gehen.

Noah Goodman, Professor an der Stanford University, der Sprachverständnis erforscht, sagt, dass ein verbessertes syntaktisches Verständnis nur der Anfang dessen ist, was Computer brauchen, um Sprache zu beherrschen. Syntax ist sicherlich ein wichtiger Teil der Sprache, sagt er. Aber es ist ein großer Schritt von dieser zur Semantik und von der seichten Semantik zur abgeleiteten Bedeutung.

verbergen

211service.com

Google an Entwickler: So können Sie aufhören, dumme Chatbots zu erstellen

Der Beste

Wellenlängen-Multiplexing

Stammzellen ohne Embryonen

Warum künstliche Intelligenz einen Atomkrieg auslösen könnte

Eine Zeitleiste der MIT-Computing-Meilensteine

Edward A. Friedman '57

Kategorien

Populäre Artikel