Ein Algorithmus, der Starcraft-Bots entwickelt hat, trainiert auch selbstfahrende Autos

Waymo-Fahrzeug

Waymo-Fahrzeug Waymo





Die selbstfahrenden Autos von Waymo haben jetzt etwas mit den Gehirnen gemeinsam, die normale Fahrzeuge steuern: Ihre Intelligenz stammt teilweise aus der Kraft der Evolution.

Ingenieure von Waymo, im Besitz von Alphabet, haben sich mit Forschern von DeepMind, einer anderen KI-Abteilung von Alphabet, zusammengetan, um einen effizienteren Prozess zum Trainieren und Feinabstimmen der selbstfahrenden Algorithmen des Unternehmens zu finden.

Sie verwendeten eine Technik namens Bevölkerungsbasiertes Training (PBT), zuvor entwickelt von DeepMind zum Verfeinern von Videospielalgorithmen. PBT, das sich von der biologischen Evolution inspirieren lässt, beschleunigt die Auswahl von Algorithmen und Parametern für maschinelles Lernen für eine bestimmte Aufgabe, indem der Kandidatencode aus den geeignetsten Exemplaren (denjenigen, die eine bestimmte Aufgabe am effizientesten ausführen) in einer algorithmischen Population gezogen wird.



Die Verfeinerung von KI-Algorithmen auf diese Weise kann auch dazu beitragen, Waymo einen Vorteil zu verschaffen. Die Algorithmen, die selbstfahrende Autos steuern, müssen neu trainiert und neu kalibriert werden, wenn die Fahrzeuge mehr Daten sammeln und an neuen Orten eingesetzt werden. Dutzende von Unternehmen kämpfen darum, die beste Selbstfahrtechnologie auf echten Straßen zu demonstrieren. Waymo erkundet verschiedene andere Wege die Entwicklung seiner maschinellen Lernalgorithmen zu automatisieren und zu beschleunigen.

Effizientere Methoden zum erneuten Trainieren von maschinell lernendem Code sollten es der KI ermöglichen, in verschiedenen Kontexten flexibel und nützlich zu sein.

Eine der größten Herausforderungen für jeden, der maschinelles Lernen in einem industriellen System durchführt, besteht darin, das System neu aufbauen zu können, um neuen Code zu nutzen, sagt Matthieu Devin, Leiter der Infrastruktur für maschinelles Lernen bei Waymo. Wir müssen das Netz ständig neu trainieren und unseren Code neu schreiben. Und wenn Sie umschulen, müssen Sie möglicherweise Ihre Parameter optimieren.



Moderne selbstfahrende Autos werden von einer fast Rube-Goldberg-Kombination aus Algorithmen und Techniken gesteuert. Zahlreiche maschinelle Lernalgorithmen werden verwendet, um Straßenlinien, Schilder, andere Fahrzeuge und Fußgänger in Sensordaten zu erkennen. Diese arbeiten mit herkömmlichem oder handgeschriebenem Code zusammen, um das Fahrzeug zu steuern und auf verschiedene Eventualitäten zu reagieren. Jede neue Iteration eines selbstfahrenden Systems muss rigoros in der Simulation getestet werden.

Die heutigen selbstfahrenden Fahrzeuge sind insbesondere stark auf Deep Learning angewiesen. Aber die Konfiguration eines tiefen neuronalen Netzwerks mit den richtigen Eigenschaften und Parametern (die Werte, die zu Beginn fest codiert sind) ist eine knifflige Kunst. Kandidatennetzwerke und -parameter werden meistens entweder manuell ausgewählt, was zeitaufwändig ist, oder zufällig von einem Computer angepasst, was viel Rechenleistung erfordert.

Bei Waymo trainieren wir tonnenweise verschiedene neuronale Netze, und Forscher verbringen viel Zeit damit, herauszufinden, wie diese neuronalen Netze am besten trainiert werden können, sagt Yu-hsin (Joyce) Chen, Infrastrukturingenieur für maschinelles Lernen bei Waymo. Wir hatten ein Bedürfnis danach und haben die Gelegenheit einfach ergriffen.



Chen sagt, dass ihr Team PBT jetzt verwendet, um die Entwicklung von Deep-Learning-Code zu verbessern, der zur Erkennung von Fahrbahnmarkierungen, Fahrzeugen und Fußgängern verwendet wird, und um die Genauigkeit der gekennzeichneten Daten zu überprüfen, die anderen maschinellen Lernalgorithmen zugeführt werden. Sie sagt, PBT habe die zum Umtrainieren eines neuronalen Netzes erforderliche Computerleistung um etwa die Hälfte reduziert und die Geschwindigkeit des Entwicklungszyklus verdoppelt oder verdreifacht.

Google entwickelt eine Reihe von Techniken, um den Prozess des Trainierens von Modellen für maschinelles Lernen zu automatisieren, und bietet Kunden bereits einige davon im Rahmen eines Projekts namens an Cloud Auto-ML . Ein effizienteres und automatisierteres KI-Training wird sich zweifellos als entscheidend für die Bemühungen erweisen, die Technologie zu kommerzialisieren und von ihr zu profitieren.

Oriol Vinyals, leitender Forschungswissenschaftler bei DeepMind und einer der Erfinder von PBT, sagt, die Idee zur Verwendung von PBT bei Waymo sei bei einem Besuch in Devin entstanden. DeepMind entwickelte die Technik erstmals 2017, um das Training neuronaler Netze zu beschleunigen, und nutzte sie später, um einem Computer dabei zu helfen, StarCraft II zu spielen, ein Kampfvideospiel, das für Maschinen besonders herausfordernd ist (siehe Innovators Under 35, 2016). Die Zusammenarbeit von DeepMind mit Waymo begann, bevor das Unternehmen seine StarCraft-Forschung im Januar 2019 veröffentlichte.



Der evolutionäre Prozess, der bei PBT zum Einsatz kommt, macht es auch einfacher zu verstehen, wie ein Deep-Learning-Algorithmus angepasst und optimiert wurde, mit etwas, das einem Stammbaum ähnelt. Eines der coolen Dinge ist, dass man die Entwicklung von Parametern visualisieren kann, sagt Vinyals. Auf diese Weise können Sie überprüfen, ob das, was passiert, für Sie tatsächlich Sinn macht.

Am 29. Juli aktualisiert, um die Tatsache widerzuspiegeln, dass PBT entwickelt wurde, bevor DeepMind mit der Arbeit an StarCraft II begann.

verbergen