211service.com
Startup hat Sprachlerner, die das Web übersetzen
Luis von Ahn ist vom Internet frustriert. Genauer gesagt, mit der Menge an Inhalten, die nur auf Englisch verfügbar sind – also das meiste davon. Das Web auf Spanisch sei einfach beschissener, sagt er mit spanischem Akzent.
So von Ahn , ein in Guatemala aufgewachsener außerordentlicher Professor für Informatik an der Carnegie Mellon University, tut etwas dagegen.
Ende letzten Jahres gründete er gemeinsam mit seinem Mitbegründer Severin Hacker, der zuvor sein Student an der CMU war, Duolingo , ein Startup, das Sprachenlernen mit Crowdsourcing-Übersetzung kombiniert. Wenn Benutzer die Kenntnisse einer neuen Sprache erwerben, helfen sie dabei, Dokumente im Web für andere zu übersetzen. Letztendlich hofft er, dass Duolingos Bemühungen das Web in alle wichtigen Sprachen übersetzen werden.
Nachdem die Website monatelang in einer privaten Beta-Testphase verbracht hatte, wurde sie Ende dieses Monats für alle geöffnet und bietet kostenlosen Online-Englischunterricht für Spanischsprecher und Unterricht in Spanisch, Deutsch und Französisch für Englischsprachige. Weitere Sprachen wie Mandarin und Portugiesisch sollen noch in diesem Jahr hinzukommen.
Das Gebiet ist für von Ahn nicht ganz neu. Im Jahr 2000 half er bei der Entwicklung von Captcha – dem Test, den Websites verwenden, um Menschen von Spam-speienden Robotern zu unterscheiden, indem sie sie auffordern, verschwommene oder verzerrte Buchstaben- und Zahlenfolgen wieder einzugeben. Danach entwickelte von Ahn reCaptcha, ein System, das Captcha-Tests nutzt, um den Text alter gedruckter Bücher zu digitalisieren.
Von Ahn begann vor einigen Jahren mit der Planung, das Web zu übersetzen, und er hielt es für am sinnvollsten, wenn Menschen die Aufgabe erledigen, da bestehende maschinelle Übersetzungstechnologien wie Google Translate alles andere als perfekt sind. Aber er brauchte eine Möglichkeit, die Leute zum Mitmachen zu motivieren. Den Benutzern eine neue Sprache beizubringen, indem man sie dazu bringt, Sätze aus dieser Sprache ins Englische zu übersetzen, könnte sie beschäftigen, dachte er.
Die Einrichtung scheint zu funktionieren. Duolingo ging diese Woche aus seiner privaten Beta mit über 125.000 aktiven Nutzern hervor, die bisher 75 Millionen Sätze aus Wikipedia und anderen Online-Quellen übersetzt haben. Bald wird es den Leuten ermöglichen, ihre eigenen Dokumente zur Übersetzung hochzuladen, sagt von Ahn. Wir übersetzen bereits täglich Millionen von Sätzen, was eine ziemlich gute Skala ist, sagt er.
Duolingo kann Anfängern helfen, fortgeschrittene Sprachkenntnisse zu erwerben, sagt von Ahn – ein Niveau, das einige erreicht haben, indem sie etwa 100 Stunden auf der Website verbracht haben. Am meisten lerne der Nutzer aber in den ersten fünf Stunden, und das reiche meist aus, um sich in einem Land zurechtzufinden, in dem die Sprache gesprochen wird.
Wenn die Site eine Million aktiver Nutzer gewinnen kann, denkt von Ahn, könnte Duolingo bei der Übersetzung von Online-Texten eine gute Figur machen. Das Ziel könnte jedoch schwer zu erreichen sein, da etwa die Hälfte der Leute, die die Site nutzen, am Ende aufhören. Von Ahn vergleicht es mit dem Eintritt ins Fitnessstudio: Jeder will es machen, aber viele geben auf, wenn sie merken, wie schwer es ist.
Wenn Sie sich anmelden, um Ihre Sprachlernmuskeln zu lockern, ermittelt Duolingo, wie gut Sie Ihre gewählte Sprache bereits beherrschen, und präsentiert dann Sätze zum Übersetzen, die auf Ihr Sprachniveau abgestimmt sind. Es gibt eine Reihe von Aktivitäten, um die Benutzer beim Lernen zu halten, z. B. einer Stimme zuzuhören, die einen Satz spricht und ihn laut nachplappert (ich habe dies im Büro ausprobiert und ertappte mich dabei, wie ich den Computer verlegen auf Französisch anbrüllte). Wenn Duolingo Ihnen ein neues Wort zeigt, können Sie darauf klicken, um die Definition anzuzeigen. Die Site fordert Sie dann auf, es in einem Satz in den richtigen Kontext zu setzen.
Um zu veranschaulichen, wie gut Duolingos Ansatz für die Übersetzung von Online-Texten funktioniert, schickte von Ahn eine spanische Übersetzung eines Teils einer Geschichte im New York Times über Anders Behring Breivik, der zugab, im vergangenen Sommer 77 Menschen bei einem Amoklauf in Norwegen getötet zu haben. Die Duolingo-Version wurde nur durch ein fehlendes Akzentzeichen über einem e getrübt, während eine Google Translate-Version viel schwieriger zu verstehen war.
Chris Callison-Burch , ein außerordentlicher Forschungsprofessor für Informatik an der Johns Hopkins University, dessen Arbeit unter anderem statistische maschinelle Übersetzung und Crowdsourcing-Übersetzungen umfasst, nennt Duolingos Ansatz wirklich spannend. Die von Duolingo produzierten Daten könnten nicht nur beim Lernen und der Bereitstellung von Übersetzungen von Online-Inhalten helfen, sondern auch zur Verbesserung der maschinellen Übersetzung verwendet werden, sagt er.
Von Ahn sagt, dass Duolingo dies plant, und er glaubt, dass die maschinelle Übersetzung irgendwann mit ziemlicher Sicherheit die Leistung menschlicher Übersetzer erreichen wird. Dennoch, wie er betont, sind wir noch nicht am Ziel, und die Leute arbeiten seit Jahrzehnten an dem Problem. Wer weiß, wie lange es dauern wird? er fragt.