211service.com
Bei der Skype-Übersetzung ist etwas verloren gegangen
Manchmal scheint es, als ob das höchste Lob, das eine innovative neue Technologie verdienen kann, ein leichtgläubiger Vergleich ist Star Trek . Die Oculus Rift ist wie die Holodeck ; 3-D-Drucker sind wie Materie-Replikatoren ; Qualcomm sponsert sogar einen X-Prize-Wettbewerb, um ein funktionierendes zu bauen Trikorder .
Und nun Skype-Übersetzer , eine Sprach- und Textübersetzungs-App in Echtzeit, die Benutzern von Windows 8.1 derzeit als öffentliche Betaversion zur Verfügung steht, wird häufig mit der verglichen Universalübersetzer dass die Captains Kirk und Picard mühelos mit außerirdischen Gesprächspartnern kommunizierten. Skype Translator ist weniger leistungsfähig, als es die klassische Sci-Fi-Analogie vermuten lässt, aber seine Einschränkungen sind ebenso faszinierend wie seine beeindruckenden technischen Errungenschaften.
Skype Translator führt eine sofortige Übersetzung von Text-Chats in über 40 Sprachen durch, aber seine Festzeltfunktion ist eine gesprochene Echtzeit-Übersetzung zwischen englisch- und spanischsprachigen Personen. (Microsoft, dem Skype gehört, wollte sich nicht dazu äußern, welche anderen Sprachen es plant, in die Software zu integrieren, oder wann wir sie erwarten könnten.)
nicht wie Star Trek Der fiktive Übersetzer von , Skype Translator, wurde entwickelt, um einen menschlichen Dolmetscher zu emulieren, der als Vermittler zwischen den beiden Hauptsprechern fungiert. Dieser virtuelle Dolmetscher ist anpassbar: Ich konnte eine männliche oder weibliche Stimme auswählen und sogar ihre Toleranz für die Übersetzung von Obszönitäten einstellen (ich habe diese Funktion nicht getestet). Dann hörte es sich, ähnlich wie es ein menschlicher Übersetzer tun würde, meine Rede an, wartete auf eine Pause und sprach meine Worte auf Spanisch mit dem Microsoft-Berater am anderen Ende der Leitung. Die gesprochene Übersetzung war für uns beide hörbar. Und es war oft überraschend genau.
Theoretisch könnte die Skype-Übersetzung transformativ sein. Es ist wie eine Version der diskreten Live-Übersetzung, die führende Politiker der Welt genießen, wenn sie die Vereinten Nationen besuchen. In der Praxis kann es jedoch eher so sein, als hätte man Apples Siri (oder Microsofts Cortana ) unterbricht ständig Ihr Gespräch und redet über Sie hinweg.
Selbst eine solch grobe automatisierte Übersetzung ist ziemlich bemerkenswert. Es ist bekanntermaßen schwierig für Maschinen, Wörter und Sätze schnell und genau zu erkennen, und Skype Translator erreicht mit einer als Deep Learning bekannten Technik ein hohes Maß an Genauigkeit. Software, die auf den Servern von Microsoft ausgeführt wird, wurde darauf trainiert, Wörter zu erkennen, indem Methoden der Informationsverarbeitung verwendet wurden, die grob der Funktionsweise eines biologischen Gehirns nachempfunden sind (siehe 10 Breakthrough Technologies 2013: Deep Learning ).
Deep Learning ermöglicht es den Computern von Microsoft, einen Sprachstrom zuverlässig in Textblöcke umzuwandeln, die dann mit Standardübersetzungsmethoden analysiert werden können. Je mehr Menschen die Software verwenden, desto effektiver sollte dieses System bei der Erkennung von Eigenheiten von Akzent und Kadenz werden, wodurch Skype Translator – und Skype selbst – möglicherweise nützlicher werden.
Die Software von Microsoft versucht, Unwägbarkeiten (wie Ähm, Ah und Wiederholungen) auf Wort- und Satzebene herauszufiltern. Einige dieser Sprachstörungen kamen während meines Gesprächs durch, aber die Übersetzung erfolgte dennoch mit beeindruckender Geschwindigkeit und Genauigkeit.
Die Grenzen der Übersetzungssoftware von Skype sind ebenfalls aufschlussreich, da sie zeigen, wie schwierig es selbst für die intelligenteste Maschine ist, die Feinheiten einer effektiven menschlichen Konversation nachzuahmen. Zu bestimmen, welche Bedeutung eines Wortes in verschiedenen Kontexten angemessen ist, kann ärgerlich sein. Wenn eine Software zwischen amerikanischem und britischem Englisch übersetzt und das Wort „Fußball“ erkennt, muss sie auch wissen, wann es in „Fußball“ geändert werden muss und wann es bei „Fußball“ oder „Gridron“ bleiben soll, sagt er Christoph Manning , Professor für Linguistik und Informatik an der Natural Language Processing Group der Stanford University.
Skype Translator ist auch taub für den Rhythmus normaler gesprochener Gespräche, sodass Sie nicht ganz sicher sein können, wann seine körperlose Roboterstimme einbrechen und mit der übersetzten Version beginnen wird. Das ist etwas, was auch wir Menschen manchmal herausfordernd finden. Selbst bei menschlichen Übersetzern müssen Sie lernen, wann Sie eine Pause einlegen müssen, damit der Dolmetscher das, was Sie gerade gesagt haben, aufnehmen und wiederholen kann, sagt Vikram Dendi, Strategy Director bei Microsoft Research.
Mit etwas Übung könnte ich wahrscheinlich den Rhythmus von Skype Translator auf die gleiche Weise lernen, was das Audioerlebnis weniger ablenkend machen könnte. Die Einführung eines Bildschirm-Avatars für den Bot könnte auch dazu beitragen, die Metapher einer dritten Person im Gespräch zu verstärken, was es den beiden menschlichen Sprechern möglicherweise erleichtert, ihre Konversation so zu modulieren, dass Platz für die Software geschaffen wird, die in ihrem Namen spricht.
Aber Skype Translator hat eigentlich schon eine ziemlich elegante Lösung eingebaut: auf dem Bildschirm übersetzter Text der gesprochenen Konversation, generiert in Echtzeit. Diese Benutzeroberfläche ist weniger offensichtlich futuristisch als die gesprochene Übersetzung, aber sie fühlt sich natürlicher an. Und offensichtliche Fehler lassen sich leicht korrigieren, da beide Parteien in das Chatfenster tippen können, in dem die Übersetzungen erscheinen.
Dendi gibt zu, dass Skype und Microsoft noch nicht wissen, wie eine ideale Benutzererfahrung für die Software aussieht. Wenn wir diese Dinge im Fernsehen in Aktion sehen [wie auf Star Trek ], es scheint so selbstverständlich: Man spricht einfach und es kommt übersetzt heraus, sagt er. Aber wenn Sie anfangen, sich mit der eigentlichen Implementierung zu befassen und sie in die Hände der Leute zu legen, gibt es so viele kleine Details, die die Erfahrung beeinflussen oder zerstören können.
Andere Bemühungen zur Nutzung von Deep Learning könnten hilfreich sein. Laut Manning von Stanford wenden Forscher von Google und der Universität von Montreal solche Methoden mit überwältigendem Erfolg auf die Sprachübersetzung selbst an (im Gegensatz zur reinen Spracherkennung). Weitere Fortschritte könnten eines Tages die maschinelle Übersetzung in Echtzeit nahezu perfekt machen. Oder der Fortschritt könnte gegen eine Wand stoßen. Die Jury steht noch aus, sagt Manning. Ich denke, es ist immer noch unklar, wo die Grenzen von Deep Learning sind, um kognitive Verarbeitungsprobleme auf höherer Ebene zu lösen.
Skype Translator hat das Problem sicherlich noch nicht gelöst. Aber es ist ein guter Anfang, um einige Sprachbarrieren vorerst abzubauen.