Bessere Gesichtserkennungssoftware

Für Wissenschaftler und Ingenieure, die sich mit Gesichtserkennungstechnologie befassen, waren die kürzlich veröffentlichten Ergebnisse der Face Recognition Grand Challenge – genauer gesagt des Face Recognition Vendor Test (FRVT) 2006 und der Iris Challenge Evaluation (ICE) 2006 – ein stiller Triumph. Gesponsert von der Nationales Institut für Standards und Technologie (NIST) hat der Vergleich von Gesichtserkennungsalgorithmen gezeigt, dass sich die maschinelle Erkennung menschlicher Personen seit 2002 verzehnfacht und seit 1995 verhundertfacht hat. Tatsächlich arbeiten die besten Gesichtserkennungsalgorithmen heute genauer, als die meisten Menschen bewältigen können. Insgesamt schreitet die Gesichtserkennungstechnologie schnell voran.





Gesicht Fakten: Das obere 3D-Bild zeigt nur die Informationen, die mit der Gesichtsform eines Mannes verbunden sind. Das untere Bild zeigt die Textur sowie die Form.

Jonathon Phillips, Programmmanager für die NIST-Tests und Hauptautor von der Bericht der Agentur , sagt, dass das beabsichtigte Ziel der Face Recognition Grand Challenge immer eine Verbesserung der Erkennungsleistung um eine Größenordnung gegenüber den Ergebnissen aus dem Jahr 2002 war. Phillips glaubt, dass die notwendige Verringerung der Fehlerquote, um dieses Ziel zu erreichen, zu einem großen Teil auf die Entwicklung von hochauflösenden Standbildern und 3D-Gesichtserkennungsalgorithmen. Für den FRVT 2006 und den ICE 2006 wurden Sätze von hochauflösenden Gesichtsbildern, 3D-Gesichtsscans und Irisbildern von denselben Personen gesammelt, sagt Phillips. Beim FRVT 2006 wurde erstmals die Leistung von sechs 3D-Algorithmen an einem Satz von 3D-Gesichtsscans gemessen. Der ICE 2006 hat die Leistung von zehn Algorithmen an einer Reihe von Irisbildern gemessen. Die 3D-Gesichtserkennung hat sich in den letzten Jahren durchgesetzt, da erst seit kurzem 3D-Sensoren zur Gesichtserkennung verfügbar sind. Die 3D-Gesichtserkennung trägt dazu bei, dass sie direkt Informationen über die Formen von Gesichtern erfasst.

Neben anderen Vorteilen identifiziert die 3D-Gesichtserkennung Personen, indem sie charakteristische Merkmale der Oberfläche eines menschlichen Gesichts ausnutzt – zum Beispiel die Rundungen von Augenhöhlen, Nase und Kinn, wo Gewebe und Knochen am deutlichsten sichtbar sind und welche nicht im Laufe der Zeit ändern. Darüber hinaus haben laut Phillips Änderungen der Beleuchtung die Gesichtserkennungsleistung von Standbildern beeinträchtigt. Aber die Form eines Gesichts wird durch Änderungen der Beleuchtung nicht beeinflusst. Daher könnte die 3D-Gesichtserkennung sogar bei nahezu dunklen Bedingungen verwendet werden.



Laut Ralph Gross, Forscher am Carnegie Mellon Robotics Institute in Pittsburgh, kann die 3D-Gesichtserkennung auch Motive aus unterschiedlichen Blickwinkeln bis zu 90 Grad erkennen – also Gesichter im Profil. Die Gesichtserkennung ist bei vollen Frontalgesichtern und 20 Grad Abweichung ziemlich gut geworden, aber sobald Sie in Richtung Profil gehen, gab es Probleme. Gross sagt, dass die Erklärung für die Schwierigkeiten von Gesichtserkennungssoftware mit Profilen möglicherweise nicht komplizierter ist als die Tatsache, dass sich niemand auf das Problem konzentrierte. Die Hauptanwendungen der Gesichtserkennung liegen in Kontexten wie ID-Karten und Gesichtsscannern, bei denen das Ziel die Erkennung der vollständigen Frontalgesichter kooperierender Probanden unter kontrollierter Beleuchtung war.

Hochauflösende Standbilder waren ein weiterer Faktor bei der Verbesserung der Gesichtserkennungstechnologie, zum Teil weil auch hochdetaillierte Hauttexturanalysen möglich wurden. Mit einer solchen Analyse kann jeder Hautfleck – ein sogenannter Hautabdruck – als Bild erfasst und dann in kleinere Blöcke zerlegt werden, die Algorithmen in mathematische, messbare Räume verwandeln, in denen Linien, Poren und die tatsächliche Hautstruktur aufgezeichnet werden. Es kann Unterschiede zwischen eineiigen Zwillingen erkennen, was allein mit einer Gesichtserkennungssoftware noch nicht möglich ist, erklärt Gross. Durch die Kombination von Gesichtserkennung und Oberflächenstrukturanalyse kann die genaue Identifizierung um 20 bis 25 Prozent gesteigert werden.

Was ist mit der Behauptung des FRVT-Berichts, dass einige Gesichtserkennungsalgorithmen die Erkennungsfähigkeiten von Menschen erreichen oder übertreffen? Phillips erklärt: Menschen sind sehr gut darin, Gesichter bekannter Menschen zu erkennen. Sie sind jedoch nicht so gut darin, unbekannte Menschen zu erkennen. Da viele vorgeschlagene Gesichtserkennungssysteme Menschen ergänzen oder ersetzen würden, waren die vergleichenden Tests des FRVT der Gesichtserkennungsfähigkeiten von Menschen und Software – die ersten solchen Tests – wichtig, um die potenzielle Wirksamkeit von Anwendungen zu messen. Phillips sagt, dass bei niedrigen Fehlakzeptanzraten (eine Fehlakzeptanzrate ist das Maß für die Wahrscheinlichkeit, dass ein biometrisches Sicherheitssystem einen Zugangsversuch durch eine nicht autorisierte Person fälschlicherweise akzeptiert) sechs von sieben automatischen Gesichtserkennungsalgorithmen vergleichbar oder besser waren als menschliche Anerkennung. Dies waren Algorithmen von Neven Vision, Viisage, Cognitec, Identix, Samsung Advanced Institute for Technology und der Tsinghua University. Leider, fügt Phillips hinzu, ist es noch nicht möglich, die Besonderheiten dieser Algorithmen zu beurteilen, da die Mehrheit der FRVT-2006-Teilnehmer die Details ihrer Methoden nicht bekannt gegeben hat.



Wie sieht der kommerzielle Gewinn für die Gesichtserkennung aus? Sehr vielversprechend, denn Dutzende von Unternehmen wollen das Potenzial der Gesichtserkennung als Biometrie für Anmelde- und Verifizierungszwecke nutzen. Für den FRVT konkurrierten ehrwürdige Unternehmen wie Toshiba und Samsung neben Unternehmen wie Neven Vision –gerade von Google erworben –und Visum und Identix (die gerade zu L1 Identity Solutions fusioniert haben) sowie zusammen mit Forschern von so unterschiedlichen Universitäten wie Peking, Cambridge und Carnegie Mellon. Welche Anwendungen sieht ein Unternehmen wie Google für die Technologie vor, die durch seine jüngste Übernahme Neven Vision entwickelt wurde? Laut einer PR-Person von Google bieten wir vielversprechende Integrationsmöglichkeiten mit Google-Diensten wie Picasa und Picasa-Webalben, insbesondere im Hinblick auf die Unterstützung der Benutzer bei der Organisation und Suche ihrer eigenen Fotos.

Bei Carnegie Mellon sagt Ralph Gross, dass er und seine Kollegen unter anderem mit lokalen DMVs zusammengearbeitet haben, um Bilder für Führerscheine zu scannen. Ich habe Berichte von staatlicher Ebene erhalten, die besagen, dass sie mit der Gesichtserkennungstechnologie eine ganze Reihe von Personen erwischt haben, die entweder in verschiedenen Bundesstaaten oder im selben Bundesstaat unter einem anderen Namen eine Lizenz beantragt haben, weil ihre vorherige Lizenz ausgesetzt wurde. Es ist ein wachsender Trend. Zu den Staaten, die solche Technologien verwenden, gehören Massachusetts, Illinois, West Virginia, Wisconsin, Colorado, North und Southern Carolina, Oklahoma, North Dakota, Arkansas und Mississippi. Dennoch betont Gross, dass die Anwendung der Gesichtserkennungstechnologie auf Passfotos weit davon entfernt ist, die Möglichkeit zu haben, die Webcam-Netzwerke einer Stadt nach bestimmten Personen zu durchsuchen. Mit Führerscheinfotos haben Sie einen kontrollierten Hintergrund, eine Bedienungsperson sagt Ihnen genau, wie Sie Ihr Gesicht positionieren sollen; die Bilder werden unter vergleichbaren Bedingungen gesammelt. Es ist viel eingeschränkter als das Random-Face-in-the-Crowd-Problem, bei dem Sie eine Kamera an einem Gebäude anbringen.

Trotzdem, sagt Gross, sieht man schon den Wegbau. Bis vor kurzem verließ sich die Videoüberwachungsbranche noch hauptsächlich auf analoge Kameras, sodass Kabel für große Entfernungen verlegt werden mussten, um diese Kameras mit Überwachungsgeräten zu verbinden. Jetzt steige die Industrie auf IP-basierte Kameras um, mit denen man ganz einfach bereits bestehende Ethernet-Netzwerke anzapfen könne, sagt Gross. Sie haben also drahtlose Kameras und Kameras, die POE verwenden [Power over Ethernet-Technologie ermöglicht IP-Telefonen, drahtlosen LAN-Zugangspunkten und anderen Geräten, Strom sowie Daten über vorhandene LAN-Kabel zu empfangen], wo Sie keinen separaten Netzstecker benötigen. Sie können kommerzielle Lösungen kaufen, die im Wesentlichen ein TiVo für diese Kameras sind, mit integrierten Bewegungssensoren, sodass sie nur aufzeichnen, wenn Bewegung stattfindet. Mit digitalem Speicher können Sie die Daten auf unbestimmte Zeit aufbewahren und auf eine Weise verbessern, die mit analogen Bildern nicht möglich ist. All diese Dinge kommen also zusammen.



Im Prinzip wird es daher mit der rasanten Entwicklung der Gesichtserkennungssoftware wahrscheinlich möglich sein, über ein Netzwerk von Webcams nach bestimmten Gesichtern zu suchen. Dementsprechend ist Gross' jüngste Arbeit bei Carnegie Mellon in Zusammenarbeit mit Kollegen der Datenschutzlabor dort wurde die Entwicklung von Algorithmen zu schützen Privatsphäre von Personen während der Videoüberwachung. Die üblichen Methoden, die die menschliche Erkennung der Gesichtszüge einer Person auf Videos vereiteln – zum Beispiel diese pixeligen Felder, die manchmal Gesichter und Körperteile in Reality-TV-Shows bedecken – werden nicht viel Gesichtserkennungssoftware täuschen. Jedes Gesicht in einem Videoclip komplett verdunkeln möchten die Arbeit erledigen, aber dies wäre von begrenztem Nutzen, wenn Strafverfolgungsbehörden Beweisen für verdächtiges Verhalten nachgehen wollten, sobald ein Gerichtsbeschluss vorliegt. Die Funktion der die Privatsphäre schützenden Algorithmen, die Gross mitentwickelt, besteht darin, automatisch die Durchschnittswerte der Gesichter von Personen zu nehmen und daraus neue Gesichtsbilder zu synthetisieren und dann diese neuen Bilder über die Originale zu legen. Es mag wie die entgegengesetzte Technologie erscheinen, sagt Gross, aber eigentlich ist es nur die andere Seite der Gesichtserkennung.

verbergen