Ein KI-Chip, der Computern hilft, Bilder zu verstehen

Ein mächtiger Ansatz für künstliche Intelligenz könnte auf Smartphones kommen.





Forscher der Purdue University arbeiten daran, Designs für einen Chip zu kommerzialisieren, der mobilen Prozessoren dabei helfen soll, die als Deep Learning bekannte KI-Methode zu nutzen. Obwohl die Leistungsfähigkeit des Deep Learning Unternehmen wie Google, Facebook und Baidu dazu inspiriert hat, in die Technologie zu investieren, war es bisher auf große Cluster von Hochleistungscomputern beschränkt. Als Google eine Software entwickelte, die aus YouTube-Videos lernte, Katzen zu erkennen, benötigte das Experiment 16.000 Prozessoren (siehe Autodidakt-Software).

Die Möglichkeit, Deep Learning kompakter und energieeffizienter zu implementieren, könnte zu Smartphones und anderen mobilen Geräten führen, die den Inhalt von Bildern und Videos verstehen können, sagt Eugenio Culurciello , ein Professor bei Purdue, der an dem Projekt arbeitet. Im Dezember, bei der Konferenz für neuronale Informationsverarbeitungssysteme in Nevada demonstrierte die Gruppe, dass ein mit einem herkömmlichen Smartphone-Prozessor verbundener Co-Prozessor beim Ausführen von Deep-Learning-Software helfen könnte. Die Software war in der Lage, Gesichter zu erkennen oder Teile einer Straßenszene zu beschriften. Das Design des Co-Prozessors wurde auf einem FPGA getestet, einem rekonfigurierbaren Chip, der so programmiert werden kann, dass er ein neues Hardware-Design testet, ohne die erheblichen Kosten für die Herstellung eines komplett neuen Chips.

Der Prototyp ist viel weniger leistungsfähig als Systeme wie der Katzendetektor von Google, aber er zeigt, wie neue Formen der Hardware es ermöglichen könnten, die Leistungsfähigkeit von Deep Learning breiter zu nutzen. Das ist nötig, sagt Culurciello. Sie haben wahrscheinlich eine Sammlung von mehreren Tausend Bildern, die Sie sich nie wieder ansehen, und wir haben keine gute Technologie, um all diese Inhalte zu analysieren.



Geräte wie Google Glass könnten auch von der Fähigkeit profitieren, die zahlreichen Bilder und Videos zu verstehen, die sie aufnehmen, sagt er. Die Bilder und Videos einer Person können mithilfe von Text durchsucht werden – zum Beispiel rotes Auto oder sonniger Tag mit Mama. Ebenso könnten neuartige Apps entwickelt werden, die aktiv werden, wenn sie bestimmte Personen, Objekte oder Szenen erkennen.

Deep-Learning-Software funktioniert, indem sie Daten durch ein hierarchisches, mehrschichtiges Netzwerk simulierter Neuronen filtert, die einzeln einfach sind, aber ein komplexes Verhalten zeigen können, wenn sie miteinander verbunden sind (siehe Deep Learning). Computer sind beim Betreiben dieser Netzwerke ineffizient, da sie sich stark von herkömmlicher Software unterscheiden.

Das Co-Prozessor-Design von Purdue ist darauf spezialisiert, vor allem mehrschichtige neuronale Netze zu betreiben und diese für Streaming-Bilder einzusetzen. In Tests erwies sich der Prototyp als etwa 15-mal so effizient wie die Verwendung eines Grafikprozessors für dieselbe Aufgabe, und Culurciello glaubt, dass Verbesserungen am System es 10-mal effizienter machen könnten als jetzt.



Narayan Srinivasa , Direktor des Center for Neural and Emergent Systems bei HRL Laboratories, einem gemeinsamen Forschungslabor von Boeing und General Motors, hält es für sinnvoll, einen Co-Prozessor einzusetzen, um Deep-Learning-Netzwerke effizienter zu implementieren. Das liegt daran, dass sich ein Prozessor und sein Speicher in herkömmlichen Computern in separaten Hardwareteilen befinden. Im Gegensatz dazu sind die Operationen neuronaler Netze im Deep-Learning-Stil und der realen neuronalen Netze von der Verflechtung von Gedächtnis und Verarbeitung inspiriert. Narayans eigene Forschung konzentriert sich darauf, dieses Problem mit einer extremeren Lösung anzugehen – das Design von Chips mit Siliziumneuronen und Synapsen, die denen echter Gehirne nachempfunden sind (siehe Thinking in Silicon ).

Die Lösung der Purdue-Gruppe stellt kein so grundlegendes Umdenken in der Funktionsweise von Computerchips dar. Dies kann die Effizienz ihrer Designs für den Betrieb von neuronalen Deep-Learning-Netzen einschränken, aber auch den Einsatz in der realen Welt erleichtern. Culurciello hat bereits ein Unternehmen namens . gegründet TeraDeep , um seine Designs zu kommerzialisieren.

Die Idee ist, dass wir das IP verkaufen, um dies zu implementieren, damit ein großer Hersteller wie Qualcomm oder Samsung oder Apple diese Funktionalität zu seinem Prozessor hinzufügen kann, um Bilder zu verarbeiten, sagt Culurciello. Yann LeCun , ein Pionier des Deep Learning an der New York University, der kürzlich seinen Anfang nahm führende Facebook-Forschung in diesem Bereich , ist Berater des Unternehmens.



verbergen