Nvidias Tag-Teaming-KIs stellen sich die Nacht als Tag und Hauskatzen als Tiger vor

Kategorie: Künstliche Intelligenz Gesendet Dez 04

Eine neue Richtung des maschinellen Lernens gibt Computern die Möglichkeit zu Tagträumen, und die Ergebnisse sind faszinierend und potenziell ziemlich nützlich.





Ein von Forschern bei Nvidia in Santa Clara, Kalifornien, entwickeltes System kann sich ein Bild einer sonnigen Straße ansehen und sich in atemberaubenden Details vorstellen, wie es aussehen würde, wenn es regnen würde, nachts oder an einem verschneiten Tag. Es kann sich auch vorstellen, wie eine Hauskatze aussehen würde, wenn sie ein Leopard, ein Löwe oder ein Tiger wäre.

Der Software nutzt einen beliebten neuen Ansatz in der KI, der Computer ohne menschliche Hilfe lernen lässt. Das Team verwendete Generative Adversarial Networks oder GANs, neuronale Netzwerke, die zusammenarbeiten, um die Eigenschaften eines Datensatzes zu lernen (siehe Innovators Under 35: Ian Goodfellow).

In einem GAN versucht ein neuronales Netzwerk, synthetische Daten zu erzeugen, während ein anderes zu sagen versucht, ob ein Beispiel aus dem echten Datensatz stammt oder nicht. Feedback aus dem zweiten Netzwerk hilft, die Leistung des ersten zu verbessern. Der Trick des Nvidia-Teams besteht darin, zwei GANs zu verwenden, die mit unterschiedlichen, aber ähnlichen Daten trainiert wurden, und Ähnlichkeiten oder Überschneidungen zwischen den beiden trainierten Modellen zu verwenden, um neue Bilder zu erfinden.



Im Fall von Straßenbildern wurde beispielsweise ein GAN darauf trainiert, die Eigenschaften von Straßen zu internalisieren, während das andere mit Bildern von nächtlichen, regnerischen oder verschneiten Szenen trainiert wurde. Durch die Verbindung der beiden Netzwerke kann sich ein Computer vorstellen, wie eine Szene unter verschiedenen Bedingungen aussehen würde. Ein ähnlicher Trick wurde mit Hauskatzen und Großkatzen durchgeführt (Sie können sich das ansehen das ganze Video Hier). Die Forscher präsentieren die Arbeit auf der Konferenz für neuronale Informationsverarbeitungssysteme in Long Beach, Kalifornien, diese Woche. Hier ist ein Papier (PDF), das die Arbeit beschreibt.

Bisher habe sich maschinelles Lernen mehr auf die Erkennung konzentriert, sagt er Ming-Yu Liu , der mit Kollegen an dem Projekt gearbeitet hat Thomas Breuel und Jan Kauz . Aber Menschen können ihre Vorstellungskraft nutzen. Wenn ich Ihnen ein Foto im Sommer gebe, können Sie sich vorstellen, wie es mit Schnee bedeckt sein wird.

Liu sagt, dass die Technologie praktische Anwendungen in der Bild- und Videobearbeitung und beim Hinzufügen realistischer Effekte zu Bildern und Videos haben könnte, die in sozialen Netzwerken gepostet werden. Stellen Sie sich vor, Sie könnten beispielsweise ein Live-Video posten, das Sie in einer sehr realistischen künstlichen Umgebung zeigt oder das Ihr Gesicht überzeugend in das einer anderen Person oder eines Tieres verwandelt.



Der Ansatz könnte sich auch als nützlich erweisen, um selbstfahrende Systeme so zu trainieren, dass sie mehr Szenarien erkennen, ohne eine lächerliche Menge an Daten aus der realen Welt sammeln zu müssen. In Kalifornien haben wir nicht viel Schnee, aber wir wollen, dass unser selbstfahrendes Auto im Schnee gut funktioniert, sagt Liu.