Microsoft Demos Augmented Vision

Heute werden Microsoft-Forscher eine Software demonstrieren, die in Echtzeit computergenerierte Informationen über eine digitalisierte Ansicht der realen Welt überlagern kann.



Veränderte Sicht : Auf diesem Laptop läuft Augmented-Reality-Software, die von Microsoft-Ingenieuren entwickelt wurde. Es kann den Standort einer Person mithilfe der integrierten Kamera erkennen. In dieser Demonstration führen virtuelle Blasen zu einem virtuellen Goldschatz.

Das Hinzufügen zusätzlicher visueller Daten zu einer Videoanzeige ist eine Technik, die als Augmented Reality bekannt ist. Michael Cohen , leitender Forscher bei Microsoft Research in Redmond, WA, sagt, dass der Ansatz zukünftigen Smartphones eine weitere Dimension verleihen könnte. Sie könnten auf der Straße sein, das Gerät hochhalten, und es könnte ein Restaurant erkennen und Bewertungen und die Speisekarte liefern, sagt er. Ein Smartphone mit Augmented-Reality-Display könnte auch eine Busroute und eine Schätzung, wann der nächste Bus auf einer bestimmten Straße fällig ist, überlagern. Es wird im Wesentlichen zu Ihrem Informationsportal, sagt Cohen.



Cohen und seine Kollegen demonstrieren die Augmented-Reality-Technologie bei TechFest , eine jährliche Präsentation der Forschungsprojekte von Microsoft, in Redmond. Ihre Software, die auf einem kleinen tragbaren Computer läuft, analysiert Szenen einer Kamera, gleicht sie mit denen aus, die in einer Datenbank gespeichert sind, und überlagert das Display mit zusätzlichen Informationen. Die Forscher stellen fest, dass ein Smartphone mit Augmented Reality dazu beitragen könnte, dass Ingenieure die Rohre oder Stromkabel unterhalb einer Straße sehen können. In der Demonstration auf dem TechFest wird die Software verwendet, um Menschen auf eine Schatzsuche zu einem versteckten Preis eines (virtuellen) Goldschatzes zu führen.



Augmented Reality ist seit mehr als einem Jahrzehnt ein aktives Forschungsgebiet, obwohl es oft ein Head-Mounted-Display und die Computerausrüstung eines Rucksacks erforderte. In den letzten Jahren sind Mobiltelefone und tragbare Computer mit Kameras und anderen Sensoren leistungsfähig genug geworden, um die Rechenlast zu bewältigen, die für den Betrieb eines Augmented-Reality-Systems erforderlich ist. Forscher von Nokia und der Columbia University entwickeln beispielsweise auch Augmented-Reality-Systeme, und ein japanisches Startup namens Tonchidot hofft , aus dem Konzept ein Produkt zu machen .

Die meisten Augmented-Reality-Systeme müssen sich genau orientieren können, um zuverlässig zu funktionieren. Einige ermitteln ihre Position mithilfe von GPS oder durch Triangulation mehrerer Wi-Fi-Signale und bestimmen mit einem Beschleunigungsmesser und einem digitalen Kompass, in welche Richtung sie zeigen. Das Augmented-Reality-Gerät von Microsoft konzentriert sich darauf, Objekte innerhalb einer Szene mithilfe ausgeklügelter Computer-Vision-Algorithmen zu erkennen. Da die Demonstration in der kontrollierten Umgebung des Konferenzsaals stattfindet, verwenden die Forscher keine ortserkennenden Sensoren; Stattdessen verlassen sie sich ausschließlich auf Computer Vision.

Das Erkennen von Elementen einer Szene unabhängig von Winkel oder Beleuchtung ist eine große Herausforderung. Cohen und sein Kollege Simon Winder, ein leitender Forschungsingenieur bei Microsoft, haben Algorithmen entwickelt, die diese Aufgabe Bild für Bild für einen Video-Feed in Echtzeit ausführen. Der Algorithmus gleicht Frames sofort mit zuvor analysierten Bildern ab, die in einer Datenbank gespeichert sind. Bei der Entwicklung des Algorithmus ermittelten die Forscher die besten Parameter oder Eigenschaften, um das System bei der Anpassung an jede Szene zu unterstützen. Cohen erklärt, dass sie maschinelles Lernen verwendet haben, um schnell verschiedene Parameter zu testen und diejenigen zu bestimmen, die die besten Übereinstimmungen liefern.



Für die heutige Demo hat Cohens Team Fotos vom Konferenzsaal gemacht, in dem das TechFest stattfindet. Die Fotos wurden mit der Computer-Vision-Software analysiert, und die wichtigsten Merkmale wurden in einer Datenbank auf einem Laptop-Computer gespeichert, der eine eingebaute Videokamera verwendet, um eine Szene zu erfassen.

In etwa einer Zehntel- oder Fünfzehntelsekunde sei die Software in der Lage, eine Szene zu erkennen und in einer Datenbank nachzuschlagen, sagt Cohen. Für das Schatzsuche-Spiel, das während des TechFest vorgeführt wird, zeigt die Software eine Spur von Blasen an, die in die Richtung weisen, in die der Benutzer gehen sollte, um den Preis zu finden.

Da es sich lediglich um ein Forschungsprojekt handele, betont Cohen, gebe es noch viel Raum für Verbesserungen. Zum einen könnten die Parameter zur Identifizierung physikalischer Merkmale von Objekten verfeinert werden, um den Abgleich noch genauer zu machen, sagt er.



Eine weitere zu berücksichtigende Herausforderung besteht darin, wie diese Art von System in einer weniger kontrollierten Umgebung funktionieren würde, sagt Kari Pulli , ein Forschungsstipendiat bei Nokia. Die häufigste Augmented-Reality-Anwendung sei die Verwendung als Museumsführer, sagt er. Das ist einfach, weil die Umgebung festgelegt ist. Die Herausforderung besteht darin, sicherzustellen, dass solche Systeme in einem unbekannten Kontext wie einer Stadtstraße funktionieren können. Pulli glaubt jedoch, dass dies dank Datenbanken von Microsoft, Google und Navteq möglich sein könnte, die Bilder von Straßenansichten enthalten.

Cohen sagt, er sei optimistisch, dass die von seinem Team entwickelten Computer-Vision-Algorithmen unzählige Anwendungen haben könnten – von Augmented-Reality-Systemen bis hin zu Spielen und Robotik –, aber er rechnet nicht damit, dass sie in absehbarer Zeit in einem bestimmten Microsoft-Produkt verwendet werden.

verbergen