Das neuronale Netzwerk eines Startups kann Videos verstehen

In den letzten Jahren haben Forscher von Unternehmen wie Google und Facebook beeindruckende Durchbrüche in der Trainingssoftware erzielt, um zu verstehen, was in Bildern vor sich geht, dank einer Technik, die als Deep Learning bekannt ist. Jetzt hat ein Startup angerufen Clarifai bietet einen Dienst an, der Deep Learning verwendet, um Videos zu verstehen.





Die Videoverarbeitungssoftware von Clarifai kann Objekte und Szenen in Videos identifizieren und bietet eine Zeitleiste, sodass Sie zu der Stelle springen können, an der ein bestimmtes Element erscheint.

Das Unternehmen sagt, dass seine Software Videoclips schnell analysieren kann, um 10.000 verschiedene Objekte oder Szenentypen zu erkennen. In einer Demo letzte Woche bei a Konferenz zum Thema Deep Learning hat Matthew Zeiler, Mitbegründer und CEO von Clarifai, einen Clip hochgeladen, der Aufnahmen einer abwechslungsreichen Alpenlandschaft enthielt. Die Software erstellte eine Zeitleiste mit Diagrammlinien, die zusammenfassen, wann verschiedene Objekte oder Arten von Szenen erkannt wurden. Es zeigte genau, wann Schnee und Berge einzeln und zusammen auftraten. Die Software kann Videos schneller analysieren, als ein Mensch sie ansehen könnte; In der Demonstration wurde der 3,5-Minuten-Clip in nur 10 Sekunden verarbeitet.

Clarifai bietet die Technologie als Service an und erwartet, dass sie für Dinge wie das Anpassen von Anzeigen an Inhalte in Online-Videos oder die Entwicklung neuer Möglichkeiten zum Organisieren von Videosammlungen und Bearbeiten von Filmmaterial verwendet wird.



Deep Learning beinhaltet die Verarbeitung von Daten durch ein Netzwerk einfacher simulierter Neuronen, die anhand von Beispieldaten trainiert wurden. Die Technologie von Clarifai entstand aus der Forschung an der New York University, und 2013 übernahm das Unternehmen die Top fünf Plätze beim führenden jährlichen Wettbewerb für Software, die den Inhalt von Bildern erkennt.

Die meisten Forschungen auf diesem Gebiet haben sich bisher auf Standbilder und nicht auf Videos konzentriert. Clarifai hat im vergangenen Jahr einen Dienst zur Erkennung von Standbildern eingeführt. Ein weiteres Startup, das Deep Learning verwendet, Auf der rechten Seite , startete Ende Dezember einen eigenen Videobearbeitungsdienst.

Jeder kann das neue Videosystem von Clarifai testen. Auf seiner Website können Sie einen Videoclip mit einer Größe von bis zu 10 Megabyte zur Analyse hochladen. Die verschiedenen erkannten Objekte oder Szenentypen können Autos, Bäume oder Menschen umfassen. Die Software kann auch abstraktere beschreibende Konzepte wie Spaß oder Zusammengehörigkeit anwenden.



Zeiler glaubt, dass seine Technologie zu einem neuen Ansatz führen könnte, Werbung neben Videos online zu schalten. Die Software kann erkennen, wo im Video der optimale Platz für eine Anzeige ist, sagte er.

Unternehmen können bereits bezahlen, um ihre Anzeigen neben Videos eines bestimmten Typs oder zu einem bestimmten Thema zu platzieren. Zeiler glaubt, dass die Möglichkeit, Anzeigen automatisch bestimmten Momenten in Videos zuzuordnen, für Werbetreibende noch attraktiver sein sollte. Die Technologie von Clarifai könnte es beispielsweise Starbucks ermöglichen, seine Anzeigen immer dann zu schalten, wenn Kaffee im Filmmaterial konsumiert wird.

Zeiler sagt, er arbeite bereits mit Unternehmen zusammen, die daran interessiert seien, die Videoanalyse-Technologie einzusetzen. Das Unternehmen arbeitet auch daran, dass die Software mehr kann. Zwei in der Entwicklung befindliche Funktionen werden es der Software ermöglichen, automatisch zusammenzufassen, was in einem Video passiert, und zu erkennen, wann eine bestimmte Aktivität stattgefunden hat, sagt Zeiler.



verbergen