Single-Pixel-Kamera erreicht Meilenstein und ahmt das menschliche Sehen nach

Computergestützte Bildgebung erlebt eine Revolution. Dies ist die Disziplin, Bilder mit Computertechniken anstelle von optischen zu erstellen. Der bekannteste Durchbruch ist die Fähigkeit, hochauflösende Bilder und Filme mit einem einzigen Pixel aufzunehmen. Aber Forscher haben es auch verwendet, um linsenlose Kameras, 3D-Bildgebungssysteme und mehr zu bauen.





Heute gehen sie mit der Technik sogar noch weiter, indem sie damit die Art und Weise nachahmen, wie Menschen die Welt sehen. David Phillips von der University of Glasgow und ein paar Freunde sagen, sie hätten einen Weg gefunden, mit einem einzigen Pixel Bilder zu erstellen, bei denen der zentrale Bereich in hoher Auflösung aufgezeichnet wird, während die Peripherie in niedriger Auflösung aufgezeichnet wird. Das ahmt genau tierische Sehsysteme nach, bei denen die Netzhaut einen zentralen Bereich mit hoher Sehschärfe hat, der als Fovea bezeichnet wird und von einem Bereich mit geringerer Auflösung umgeben ist.

Das Team hat sogar gezeigt, wie man die foveierte Region bewegt, um Objekten innerhalb des Sichtfelds zu folgen. Die Technik hat das Potenzial, die Arbeitsweise vieler bildgebender Systeme in Zukunft zu verändern.

Zuerst etwas Hintergrund. Ein Einzelpixel-Bildgebungssystem zeichnet Licht von einer Szene an einem einzelnen Punkt auf. Dieses Licht muss auf irgendeine Weise zufällig verteilt werden, beispielsweise indem es durch Milchglas geleitet oder von einer zufällig angeordneten Mikrospiegelanordnung reflektiert wird.



Es ist leicht zu glauben, dass durch die Aufzeichnung von auf diese Weise randomisiertem Licht wenig gewonnen werden kann. Der Trick besteht natürlich darin, auf diese Weise viele Einzelpixelbilder aufzunehmen. Obwohl jeder Datenpunkt eine zufällige Lichtprobe zu sein scheint, sind aufeinanderfolgende Datenpunkte korreliert, da sie Reflexionen von derselben Szene sind.

Der Trick hinter der computergestützten Bildgebung besteht also darin, einen Data-Mining-Algorithmus zu verwenden, um die Korrelation zwischen aufeinanderfolgenden Bildern zu finden. Ein bisschen Zahlenknirschen kann dann die Originalszene nachbilden.

Es stellt sich heraus, dass dies relativ einfach ist, vorausgesetzt, dass das Licht von der Szene jedes Mal, wenn das Pixel es aufzeichnet, richtig randomisiert wird. Die Auflösung des endgültigen Bildes hängt dann von der Anzahl der Datenpunkte ab, die zu seiner Erstellung verwendet wurden.



Mit anderen Worten, jeder Datenpunkt kann als Aufzeichnung eines Pixels im endgültigen Bild betrachtet werden. Es ist diese Idee, die es Phillips und Co ermöglicht, die Auflösung über ein Bild hinweg zu variieren.

Diese Jungs verwenden ein digitales Mikrospiegel-Array, um das Licht von einer Szene zufällig zu verteilen, das ihren Einzelpixel-Lichtdetektor erreicht. Sie sind aber auch in der Lage, die Auflösung der Randomisierung in diesem Array zu steuern. So können sie in Teilen der Szene hochauflösende Randomisierung verwenden, um die Auflösung des endgültigen Bildes zu erhöhen. Dies ist das foveierte Bild

Ihr Mikrospiegelarray kann etwa 10.000 zufällige Muster pro Sekunde anzeigen, wodurch sie 32 x 32 Pixel große Bilder mit einer Rate von etwa 10 pro Sekunde erzeugen können.



Zunächst einmal sind die Pixel in jedem 32 x 32-Bild quadratisch und gleich groß. Aber ein foveiertes Bild hat kleinere, dichter gepackte Pixel in der Mitte und größere Pixel an den Rändern.

Phillips und Co erreichen dies, indem sie das Licht der Szene zufällig mit höherer Auflösung in der Mitte des Bildes verteilen.

Und die Ergebnisse sind beeindruckend. Das Team zeigt, dass die resultierenden Bilder in der Mitte eindeutig eine höhere Auflösung haben. Wir haben gezeigt, dass die Datenerfassungskapazität eines computergestützten Einzelpixel-Bildgebungssystems verbessert werden kann, indem das im Tierreich weit verbreitete adaptive Sehvermögen nachgeahmt wird, sagen sie.



Sie zeigen aber auch, wie es möglich ist, die Fovea zu bewegen, um interessante Objekte von einem Bild zum nächsten zu verfolgen. Sie zeigen sogar, wie es möglich ist, zwei Fovea in einem einzigen Bild zu haben, um zwei verschiedene Objekte zu verfolgen, wodurch die Technik die Möglichkeiten der Tierwelt übersteigt. Und sie demonstrieren die Technik sowohl mit sichtbarem als auch mit infrarotem Licht.

Das ist eine interessante Arbeit, die einige wichtige potenzielle Anwendungen hat. Das offensichtlichste ist für Abbildungssysteme, in denen Pixelarrays nicht praktikabel sind. Beispielsweise sind einzelne Pixel für Terahertz-Frequenzen verfügbar, Pixelarrays jedoch nicht.

Aber die Technik ist allgemeiner anwendbar. Bei allen Abbildungssystemen gibt es einen Kompromiss zwischen Auflösung und Bildrate. Diese Technik ermöglicht es, diesen Kompromiss im laufenden Betrieb zu optimieren und die Aufmerksamkeit auf die Teile eines Bildes zu fokussieren, die von größtem Interesse sind.

Durch die Kombination mit anderen maschinellen Bildverarbeitungstechniken könnte dies viel leistungsfähiger gemacht werden. Algorithmen haben begonnen, Menschen bei Aufgaben wie der Gesichts- und Objekterkennung zu übertreffen.

Mensch und Tier haben Maschinen bei Sehaufgaben längst überflügelt. Aber mit Techniken wie dieser wird diese Beherrschung nicht mehr lange anhalten.

Ref: arxiv.org/abs/1607.08236 : Adaptive foveierte Einzelpixelbildgebung mit dynamischem Super-Sampling

verbergen