211service.com
Machine-Vision-Algorithmus lernt, Menschen nach ihren Gesichtern zu beurteilen
Sozialpsychologen wissen seit langem, dass Menschen vorschnelle Urteile über einander fällen, basierend auf nichts anderem als der Art, wie wir aussehen und insbesondere auf unseren Gesichtern. Wir verwenden diese Urteile, um festzustellen, ob eine neue Bekanntschaft vertrauenswürdig oder klug oder dominant oder gesellig oder humorvoll ist und so weiter.
Diese Entscheidungen können richtig sein oder auch nicht und sind keineswegs objektiv, aber sie sind konsequent. Angesichts des gleichen Gesichts unter den gleichen Bedingungen neigen die Menschen dazu, es auf die gleiche Weise zu beurteilen.
Und das wirft eine interessante Möglichkeit auf. Schnelle Fortschritte in der maschinellen Bildverarbeitung und Gesichtserkennung haben es Computern leicht gemacht, eine breite Palette menschlicher Gesichtsausdrücke zu erkennen und sogar Gesichter nach Attraktivität zu bewerten. Ist es also möglich, dass eine Maschine in ein Gesicht schaut und den gleichen ersten Eindruck bekommt wie der Mensch?
Heute bekommen wir dank der Arbeit von Mel McCurrie von der University of Notre Dame und ein paar Kumpels eine Antwort. Sie haben einen maschinellen Lernalgorithmus trainiert, um zu entscheiden, ob ein Gesicht vertrauenswürdig oder dominant ist, so wie es Menschen tun.
Ihre Methode ist unkompliziert. Der erste Schritt in jedem maschinellen Lernprozess besteht darin, einen Datensatz zu erstellen, aus dem der Algorithmus lernen kann. Das bedeutet eine Reihe von Bildern von Gesichtern, die mit der Art und Weise gekennzeichnet sind, wie Menschen sie beurteilen – ob vertrauenswürdig, dominant, klug und so weiter.
McCurrie und Co. erstellen dies mithilfe einer Website namens TestMyBrain.org, einer Art Citizen Science-Projekt, das verschiedene psychologische Eigenschaften der Besucher misst. Die Website ist mit über 1,6 Millionen Teilnehmern eine der beliebtesten Gehirntest-Websites im Internet.
Das Team bat die Teilnehmer, 6.300 Schwarz-Weiß-Bilder von Gesichtern zu bewerten. Jedes Gesicht wurde von 32 verschiedenen Personen auf Vertrauenswürdigkeit und Dominanz und von 15 Personen auf IQ und Alter bewertet.
Ein interessantes Merkmal dieser Bewertungen ist, dass es keine objektive Antwort gibt – der Test erfasst einfach die Meinung des Bewerters. Natürlich ist es möglich, IQ und Alter zu messen und herauszufinden, wie gut Menschen diese Werte erraten können. Aber das interessiert McCurrie und Co. nicht. Sie wollen nur die Bandbreite der Eindrücke von Menschen messen und dann eine Maschine trainieren, um dieselben Ergebnisse zu reproduzieren.
Nachdem das Team diese Daten gesammelt hatte, verwendete es 6.000 der Bilder, um seinen Bildverarbeitungsalgorithmus zu trainieren. Sie verwenden weitere 200 Bilder, um die Bildverarbeitungsparameter fein abzustimmen. All dies trainiert die Maschine, Gesichter auf die gleiche Weise zu beurteilen wie Menschen.
McCurrie und Co speichern die letzten 100 Bilder, um den maschinellen Bildverarbeitungsalgorithmus zu testen – mit anderen Worten, um zu sehen, ob er zu denselben Schlussfolgerungen kommt wie Menschen.
Die Ergebnisse sorgen für eine interessante Lektüre. Natürlich reproduziert die Maschine das gleiche Verhalten, das sie vom Menschen gelernt hat. Wenn sie mit einem Gesicht präsentiert wird, gibt die Maschine mehr oder weniger die gleichen Werte für Vertrauenswürdigkeit, Dominanz, Alter und IQ aus wie ein Mensch.
McCurrie und Co. können herausfinden, wie die Maschine das macht. Sie können beispielsweise feststellen, welche Teile des Gesichts die Maschine verwendet, um ihre Urteile zu fällen.
Das Team tut dies, indem es verschiedene Teile eines Gesichts abdeckt und die Maschine bittet, ihr Urteil zu fällen. Wenn das Ergebnis deutlich vom üblichen Wert abweicht, gehen sie davon aus, dass dieser Teil des Gesichts wichtig sein muss. Auf diese Weise können sie feststellen, auf welche Teile des Gesichts sich die Maschine bei ihrer Beurteilung am meisten verlässt.
Seltsamerweise stellen sich heraus, dass diese den Teilen des Gesichts ähneln, auf die sich Menschen verlassen. Sozialpsychologen wissen, dass Menschen bei der Beurteilung von Vertrauenswürdigkeit dazu neigen, auf den Mund zu schauen, und dass eine gesenkte Stirn oft mit Dominanz in Verbindung gebracht wird.
Und genau diese Bereiche lernt der Bildverarbeitungsalgorithmus aus den Trainingsdaten zu betrachten. Diese Beobachtungen deuten darauf hin, dass unsere Modelle gelernt haben, an denselben Orten zu suchen wie Menschen, und die Art und Weise nachahmen, wie wir hochrangige Attribute beieinander beurteilen, sagen McCurrie und Co.
Das führt zu einer Reihe interessanter Anwendungen. McCurrie und Co wenden es zunächst auf die Schauspielerei an. Sie nutzen die Maschine, um die Vertrauenswürdigkeit und Dominanz von Edward Snowden und Julian Assange anhand von Bildern ihrer Gesichter zu beurteilen. Anschließend verwenden sie die Maschine, um die Schauspieler, die sie in zwei kürzlichen Zügen spielen, auf dieselbe Weise zu beurteilen – Joseph Gordon-Levitt bzw. Benedict Cumberbatch.
Tatsächlich sagt dies voraus, wie eine Masse die Ähnlichkeit zwischen einem Schauspieler und der Person, die er oder sie darstellt, beurteilen könnte.
Die Ergebnisse sind eindeutig. Es stellt sich heraus, dass die Maschine beide Schauspieler ähnlich bewertet wie die Menschen, die sie darstellen – alle schneiden zum Beispiel bei der Vertrauenswürdigkeit schlecht ab. Unsere Modelle geben bemerkenswert ähnliche Vorhersagen zwischen den Probanden und ihren Schauspielern aus, was die Genauigkeit der Darstellungen in den Filmen bestätigt, sagen McCurrie und Co.
Aber das Team kann noch weiter gehen. Sie wenden den Bildverarbeitungsalgorithmus auf jedes Bild in einem Film an, wodurch sie sehen können, wie sich die Bewertungen im Laufe der Zeit ändern. Dies liefert ein Maß dafür, wie sich die Wahrnehmung der Menschen im Laufe der Zeit ändern könnte. Und das könnte in Forschung, Marketing, politischen Kampagnen usw. verwendet werden.
Die Arbeit schlägt auch zukünftige Wege vor, die es zu verfolgen gilt. Eine Möglichkeit besteht darin, zu testen, wie sich erste Eindrücke zwischen kulturellen oder demografischen Gruppen verändern.
All dies macht es möglich, die Faktoren auseinander zu nehmen, die zu unseren Vorurteilen beitragen, die oft von subtilen sozialen Hinweisen abhängen. Es kann Robotern auch ermöglichen, sie vorherzusagen und zu wiederholen.
Eine faszinierende Folge davon ist, wie diese Art von Forschung menschliches Verhalten beeinflussen könnte. Wenn jemand entdeckt, dass sein Gesicht als nicht vertrauenswürdig wahrgenommen wird, wie könnte diese Person reagieren? Könnte man vielleicht lernen, diese Wahrnehmung zu ändern, vielleicht durch eine Veränderung der Mimik? Interessante Arbeit!
Ref: arxiv.org/abs/1610.08119 : Erste Eindrücke mit Deep Learning vorhersagen