Lügendetektoren waren schon immer verdächtig. KI hat das Problem verschlimmert.

Konzeptionelle Illustration, die eine Person zeigt, deren Gesicht von einer Wolke verdeckt wird, über der sich kleine Soldaten abseilen.

Nikolaus Ortega





Bevor der Polygraph ihn für schuldig erklärte, arbeitete Emmanuel Mervilus für eine Speiseölfirma im Hafen von Newark, New Jersey. Er verdiente 12 Dollar pro Stunde mit Umzugskartons, aber das war nicht genug. Sein Bruder und seine Schwester waren zu jung, um zu arbeiten, und seine Mutter kämpfte einen teuren Kampf gegen den Krebs. Sein Chef im Hafen hatte ihm jedoch gesagt, dass er als Nächster für die Beförderung zum Techniker anstehen würde, was mit einer Gehaltserhöhung auf 25 Dollar pro Stunde einhergehen würde.

Mervilus wartete am 19. Oktober 2006 immer noch auf diese Beförderung, als er und ein Freund bei einem Dunkin 'Donuts im nahe gelegenen Elizabeth, New Jersey, anhielten. Einige Minuten später, als sie die Straße hinuntergingen, kamen zwei Polizisten auf sie zu und beschuldigten sie, einige Minuten zuvor vor einem nahe gelegenen Bahnhof einen Mann mit Messerstichen ausgeraubt zu haben.

Das Opfer hatte Mervilus und seinen Freund aus der Ferne identifiziert. Um seine Unschuld zu beweisen, bot Mervilus an, einen Lügendetektortest zu machen. Die Polizei stimmte zu, aber in den Tagen direkt vor dem Test starb Mervilus‘ Mutter. Er war verstört und ängstlich, als die Polizei ihn an das Gerät fesselte. Er hat den Test nicht bestanden, bat um eine Wiederholung und wurde abgelehnt.



Nachdem Mervilus sein Unschuldsgeständnis aufrechterhalten hatte, ging sein Fall vor Gericht. Der Leutnant, der den Lügendetektor verabreicht hatte, sagte vor Gericht aus, dass das Gerät ein zuverlässiger Wahrheitsindikator sei. Er habe noch nie in seiner Karriere einen Fall gesehen, in dem jemand Anzeichen von Täuschung gezeigt habe und [später] herausgekommen sei, dass er die Wahrheit gesagt habe. Eine Jury verurteilte Mervilus – schwankend, wie ein Berufungsgericht später feststellte, durch fehlgeleitetes Vertrauen in den Polygraphen. Der Richter verurteilte ihn zu 11 Jahren Gefängnis.


Der Glaube, dass Täuschung durch die Analyse des menschlichen Körpers entdeckt werden kann, hat sich im modernen Leben etabliert. Trotz zahlreicher Studien, die die Gültigkeit des Polygraphen in Frage stellen, werden jedes Jahr mehr als 2,5 Millionen Screenings mit dem Gerät durchgeführt, und Polygraphtests sind eine 2-Milliarden-Dollar-Industrie. US-Bundesbehörden, einschließlich des Justizministeriums, des Verteidigungsministeriums und der CIA, verwenden alle das Gerät, wenn sie potenzielle Mitarbeiter überprüfen. Laut Zahlen des Justizministeriums aus dem Jahr 2007 verwendeten mehr als drei Viertel aller städtischen Polizei- und Sheriff-Abteilungen auch Lügendetektoren, um Einstellungen zu überprüfen.

Aber Lügendetektoren sind immer noch zu langsam und umständlich, um sie an Grenzübergängen, auf Flughäfen oder bei großen Menschenansammlungen einzusetzen. Infolgedessen ist im letzten Jahrzehnt eine neue Generation von Lügendetektoren auf Basis künstlicher Intelligenz entstanden. Ihre Befürworter behaupten, sie seien sowohl schneller als auch genauer als Polygraphen.



In Wirklichkeit ist die psychologische Arbeit, die diesen neuen KI-Systemen zugrunde liegt, noch schwächer als die Forschung, die dem Lügendetektor zugrunde liegt. Es gibt kaum Beweise dafür, dass den Ergebnissen, die sie produzieren, vertraut werden kann. Nichtsdestotrotz bringt die Fassade der Moderne, die KI ihnen verleiht, diese Systeme in Umgebungen, in die der Polygraph nicht vordringen konnte: Grenzübergänge, private Vorstellungsgespräche, Kreditprüfungen und Versicherungsbetrugsansprüche. Unternehmen und Regierungen beginnen, sich auf sie zu verlassen, um Entscheidungen über die Vertrauenswürdigkeit von Kunden, Mitarbeitern, Bürgern, Einwanderern und internationalen Besuchern zu treffen. Aber was ist, wenn Lügen einfach zu komplex ist, als dass eine Maschine sie zuverlässig identifizieren könnte, egal wie fortschrittlich ihr Algorithmus ist?


Inquisitoren im alten China baten mutmaßliche Lügner, ihnen Reis in den Mund zu stecken, um zu sehen, ob sie Speichelfluss hatten. Der Die Heldentaten der Römer , eine mittelalterliche Anthologie moralischer Fabeln, erzählt die Geschichte eines Soldaten, der seinen Angestellten den Puls seiner Frau messen ließ, um herauszufinden, ob sie untreu war.

Foto des Buchumschlags des Römischen Reiches

Eine englische Übersetzung der Die Heldentaten der Römer , oder Deeds of the Romans, eine Sammlung von Geschichten, die ursprünglich im späten 13. oder frühen 14. Jahrhundert in lateinischer Sprache veröffentlicht wurden. Wikimedia-Commons



Als die Vereinigten Staaten in den Ersten Weltkrieg eintraten, leistete William Marston, ein Forscher in Harvard, Pionierarbeit bei der Verwendung von Geräten, die den Blutdruck messen, um zu versuchen, Täuschung festzustellen. Ein paar Jahre später entwickelte John Augustus Larson, ein Polizist, der gerade seinen PhD in Physiologie an der University of California, Berkeley, abgeschlossen hatte, inspiriert von Marstons Arbeit, eine Maschine, die er Kardio-Pneumo-Psychogramm nannte und die kontinuierliche Messwerte von a lieferte Blutdruck, Puls und Atemfrequenz des Probanden. Diese Messwerte, behauptete Larson, seien ein noch besserer Indikator für Täuschung als der Blutdruck allein.

Larson benutzte die Maschine zuerst, um einen Diebstahl in einem Frauenwohnheim in Berkeley zu untersuchen, und innerhalb eines Jahres wurde sie verwendet, um einen Mann in San Francisco zu verurteilen, der beschuldigt wurde, einen Priester ermordet zu haben. In den 1930er Jahren verkaufte einer von Larsons Protegés eine tragbare Version an Polizeidienststellen im ganzen Land und fügte einen Sensor hinzu, der Änderungen in der galvanischen Hautreaktion maß – je stärker ein Proband schwitzte, desto leitfähiger war die Haut. In den 1970er Jahren unternahmen Millionen von Arbeitnehmern im Privatsektor auf Geheiß ihrer Arbeitgeber regelmäßige Lügendetektortests.

Die meisten Polygraph-Tests haben heute die gleiche Grundstruktur wie Larsons: Der Untersucher stellt eine Reihe von Fragen, um den normalen physiologischen Zustand eines Probanden zu messen, und beobachtet, wie die Maschine diese Messungen als Wellenformlinien auf eine Seite oder einen Bildschirm überträgt. Der Prüfer sucht dann nach plötzlichen Spitzen oder Abfällen in diesen Werten, wenn die Testperson Fragen zu mutmaßlichen Verbrechen oder Gefühlen beantwortet.



Aber Psychologen und Neurowissenschaftler haben den Polygraphen fast seit dem Moment kritisiert, als Larson seine Erfindung der Öffentlichkeit vorstellte. Während einige Lügner Veränderungen der Herzfrequenz oder des Blutdrucks erfahren können, gibt es kaum Beweise dafür, dass solche Veränderungen ständig mit Täuschung korrelieren. Viele unschuldige Menschen werden nervös, wenn sie befragt werden, und geübte Lügner können oder unterdrücken Veränderungen hervorrufen in ihrem Körper, um den Test zu täuschen. Polygraphen können auch geschlagen werden durch sich auf die Zunge beißen , Treten auf eine Wende, oder über die schlimmste Angst nachzudenken . Die Geräte laufen immer Gefahr, selbst in kontrollierten Laborexperimenten verwirrende Variablen aufzunehmen, und im wirklichen Leben sind sie noch weniger zuverlässig: da Kriminelle, die den Test bestehen, der Polizei fast nie ihre Schuld melden, und da unschuldige Verdächtige oft falsche Geständnisse machen, nachdem sie den Test nicht bestanden haben Tests, es gibt keine Möglichkeit zu sagen, wie gut sie tatsächlich funktioniert haben.

Deutsch: Die amerikanische Erfinderin Leonarde Keeler (1903-1949) testet ihren Lügendetektor an Dr. Kohler, einem ehemaligen Zeugen der Anklage im Prozess gegen Bruno Hauptmann.

Leonarde Keeler, eine Protegé des Lügendetektor-Erfinders John Larson, führte den Test an Bruno Hauptmann durch, der wegen der Entführung von Charles Augustus Lindbergh Jr. festgenommen, verurteilt und hingerichtet wurde. Hauptmann beteuerte seine Unschuld bis zu seinem Tod. Gemeinfrei

Aufgrund dieser Einschränkungen sind Lügendetektortests seit langem vor den meisten amerikanischen Gerichten unzulässig, es sei denn, beide Parteien stimmen ihrer Einbeziehung zu. Das Bundesgesetz verbietet privaten Arbeitgebern seit 1988 die Polygraphie ihrer Angestellten (mit Ausnahme von Personen in sensiblen Berufen, wie bewaffneten Wachen oder Pharmahändlern, und für einige Angestellte, die des Diebstahls oder Betrugs verdächtigt werden). Die American Psychological Association warnt: Die meisten Psychologen sind sich einig, dass es wenig Beweise dafür gibt, dass Polygraphen-Tests Lügen genau erkennen können, und ein Bericht der National Academy of Sciences aus dem Jahr 2003, der frühere Forschungsergebnisse der Regierung widerspiegelt, stellte bekanntermaßen fest, dass das Gerät Lügner mit einer Rate weit über dem Zufall erkennt , obwohl weit unter Perfektion; Der Hauptautor des Berichts sagte damals, dass die nationale Sicherheit zu wichtig sei, um sie einem so stumpfen Instrument zu überlassen.

Aber vielleicht muss das Instrument nicht so stumpf sein. Das ist das Versprechen einer wachsenden Zahl von Unternehmen, die bestrebt sind, Lügenerkennungstechnologie sowohl an Regierungen als auch an die kommerzielle Industrie zu verkaufen. Vielleicht, sagen sie, könnten bestimmte komplexe Verhaltens-Tics Lügen zuverlässiger signalisieren als nur einen erhöhten Puls oder Blutdruck. Und vielleicht könnte ein ausgeklügelter Algorithmus diese Muster erkennen.


Von 1969 bis 1981 jagte ein Serienmörder mit dem Spitznamen Yorkshire Ripper junge Frauen im Norden Englands, tötete mindestens 13 und versuchte, mindestens sieben weitere zu töten. Die Polizei verhörte ihn und ließ ihn neun Mal frei, während sein Amoklauf weiterging. Sein letztes Opfer war Jacqueline Hill, eine 20-jährige Studentin an der Universität von Leeds, die im November 1980 getötet wurde. Einige Monate später erwischte ihn die Polizei schließlich, als er sich darauf vorbereitete, eine Prostituierte im nahe gelegenen Sheffield zu töten.

Als Janet Rothwell im Herbst 1980 an die University of Leeds kam, lebte sie im Wohnheim neben Hill’s. Sie wurde von Hills Mord heimgesucht.

Sie hat ungefähr zur gleichen Zeit wie ich den Bus von der Universitätsbibliothek genommen, sagte Rothwell, und sie wurde ermordet, nachdem sie aus dem Bus gestiegen war. Rothwell erfuhr später, wie lange es dauerte, den Mörder zu fassen. Ich fragte mich, erinnerte sie sich, könnte ein Computer irgendeine Art von Inkongruenz im Verhalten melden, um die Polizei zu alarmieren?

Rothwell besuchte schließlich Ende der 1990er Jahre die Graduate School an der Manchester Metropolitan University (MMU). Sie lernte Zuhair Bandar kennen, einen irakisch-britischen Dozenten, der in der Informatikfakultät arbeitet. Bandar hatte kürzlich einen Heureka-Moment gehabt, als ihn ein Marketingunternehmen gebeten hatte, ein rudimentäres Gerät zu entwickeln, um das Interesse der Verbraucher an Produkten zu messen, die sie auf einem Bildschirm sahen.

Frau, die einen Lügendetektor nimmt

Ein FBI-Foto einer Frau, die einen Polygraphen macht. Bundesamt für Untersuchungen

Sie würden dem Kunden ein Handheld-Gerät geben, sagte Bandar, und wenn sie zustimmen, drücken sie die 1; wenn es ihnen nicht gefällt, drücken sie die 2. Ich dachte, warum brauchen wir tragbare Geräte, wenn sie bereits Gesichtsausdrücke haben? Bandar bat Rothwell, nach ihrem Master an der MMU zu bleiben, um zu promovieren und ihm bei der Entwicklung von Software zu helfen, die Gesichter analysieren kann, um Informationen zu extrahieren. Täuschung, so dachten sie, war nicht weniger nachweisbar als Freude oder Wut. Alle würden eine Form von Inkongruenz erzeugen – Verhaltensmuster, ob verbal oder nonverbal, die ein Computer erkennen könnte.

Rothwell trainierte Anfang der 2000er Jahre ein neuronales Netzwerk, um Gesichtsbewegungen wie Blinzeln und Erröten zu verfolgen, und fütterte den Computer dann mit ein paar Dutzend Clips von Menschen, die ehrlich und unehrlich die gleichen Fragen beantworteten. Um festzustellen, was die Lügner gemeinsam hatten, untersuchte der Computer die Gesichtsbewegungen einer Person, die Beziehungen zwischen diesen Bewegungen und die Beziehungen zwischen diesen Beziehungen und entwickelte eine Theorie, die zu komplex ist, um sie in normaler Sprache zu artikulieren. Einmal auf diese Weise trainiert, könnte das System sein Wissen nutzen, um neue Subjekte als trügerisch oder wahrhaftig zu klassifizieren, indem es Frame-für-Frame-Änderungen in ihren Ausdrücken analysiert.

In einer Studie aus dem Jahr 2006 wurde das System namens Silent Talker dazu gebracht, zu erraten, ob eine Versuchsperson lügt oder die Wahrheit sagt. Während Rothwell daran arbeitete, erreichte es nie eine Genauigkeit von mehr als 80 % – und es hat sich auch in nichts, was die Forschungsgruppe seitdem veröffentlicht hat, wesentlich besser geschlagen. Rothwell sagte mir auch, dass es völlig zusammenbrach, wenn eine Teilnehmerin eine Brille trug, und sie wies darauf hin, dass Sie sich daran erinnern müssen, dass die Lichtverhältnisse dieselben waren und die Interviews auf dem inszenierten Diebstahl basierten. Aber schon in der Anfangsphase, erinnert sich Rothwell, war Bandar sehr daran interessiert, ein kommerzielles Produkt zu haben; Er und ein Kollege präsentierten ihr einmal ein Video einer Frau, die verdächtigt wird, ihren Ehemann zu betrügen, und baten sie, es von Silent Talker analysieren zu lassen, genau wie in der Die Heldentaten der Römer .

Rothwell hatte ihre Vorbehalte. Ich konnte sehen, dass die Software, wenn sie funktionierte, potenziell aufdringlich sein könnte, sagte sie. Ich glaube nicht, dass irgendein System jemals 100 % sein könnte, und wenn [das System] es falsch macht, könnte das Risiko für Beziehungen und Leben katastrophal sein. Sie verließ die Universität 2006; Nach ihrer Ausbildung zur Audiologin fand sie eine Anstellung in einem Krankenhaus auf der Isle of Jersey, wo sie noch heute lebt.

Die MMU veröffentlichte 2003 eine Pressemitteilung, in der die Technologie als neue Erfindung angepriesen wurde, die den Polygraphen obsolet machen würde. Ich war ein bisschen schockiert, sagte Rothwell, weil ich das Gefühl hatte, es sei zu früh.

Die US-Regierung unternahm in den ersten Jahren nach dem 11. September zahlreiche Vorstöße in die Technologie zur Erkennung von Täuschungen, wobei das Heimatschutzministerium (DHS), das Verteidigungsministerium (DoD) und die National Science Foundation Millionen von Dollar für solche Forschungen ausgaben . Diese Agenturen finanzierten die Einrichtung eines Kiosks namens AVATAR an der University of Arizona. AVATAR, das Gesichtsausdrücke, Körpersprache und Stimmen von Personen analysierte, um Probanden einen „Glaubwürdigkeitswert“ zuzuweisen, wurde auf US-Flughäfen getestet. In Israel half das DHS unterdessen bei der Finanzierung eines Startups namens WeCU („Wir sehen uns“), das einen Screening-Kiosk verkaufte, der physiologische Reaktionen bei denen auslösen würde, die etwas verbergen, so a Artikel von 2010 in Fast Company . (Das Unternehmen hat inzwischen geschlossen.)

Bandar begann mit dem Versuch, die Technologie zu kommerzialisieren. Zusammen mit zwei seiner Schüler, Jim O’Shea und Keeley Crockett, gründete er Silent Talker als Unternehmen und begann, Kunden für seine psychologische Profiling-Technologie zu suchen, darunter sowohl Polizeidienststellen als auch private Unternehmen. Silent Talker war einer der ersten KI-Lügendetektoren, die auf den Markt kamen. Nach Angaben des Unternehmens wurde die von Silent Talker abgeleitete Technologie im vergangenen Jahr im Rahmen von iBorderCtrl verwendet, einer von der Europäischen Union finanzierten Forschungsinitiative, die das System an Freiwilligen an den Grenzen in Griechenland, Ungarn und Lettland getestet hat. Laut Bandar befindet sich das Unternehmen derzeit in Gesprächen, um die Technologie an Anwaltskanzleien, Banken und Versicherungsunternehmen zu verkaufen und Tests in Arbeitsplatzinterviews und Betrugsscreenings einzuführen.

Bandar und O’Shea verbrachten Jahre damit, den Kernalgorithmus für die Verwendung in verschiedenen Umgebungen anzupassen. Sie versuchten, es an Polizeidienststellen in den Großstädten Manchester und Liverpool zu vermarkten. Wir sprechen informell mit sehr hochrangigen Leuten, teilte das Unternehmen der britischen Veröffentlichung mit Die Ingenieurin im Jahr 2003 und stellten fest, dass ihr Ziel darin bestand, dies in echten Interviews zu erproben. Ein Whitepaper von 2013 O’Shea auf seiner Website veröffentlicht vorgeschlagen, dass Silent Talker verwendet werden könnte, um unsere Streitkräfte bei Auslandseinsätzen vor Green-on-Blue („Insider“)-Angriffen zu schützen. (Der Begriff grün auf blau wird allgemein verwendet, um sich auf Angriffe afghanischer Soldaten in Uniform gegen ihre ehemaligen Verbündeten zu beziehen.)

Das Team veröffentlichte auch experimentelle Ergebnisse, die zeigten, wie Silent Talker verwendet werden könnte, um sowohl das Verständnis als auch die Erkennung zu erkennen. In einer Studie aus dem Jahr 2012, die erstmals das in der Praxis eingesetzte Silent Talker-System zeigte, arbeitete das Team mit einer Gesundheits-NGO in Tansania zusammen, um die Gesichtsausdrücke von 80 Frauen aufzuzeichnen, die an Online-Kursen zur HIV-Behandlung und zur Verwendung von Kondomen teilnahmen. Die Idee war, festzustellen, ob die Patienten die Behandlung verstanden haben, die sie erhalten würden – wie in der Einführung in die Studie festgestellt wird, bleibt die Bewertung des Verständnisses der Teilnehmer während des Prozesses der Einwilligung nach Aufklärung immer noch ein kritischer Bereich. Als das Team die Vermutungen der KI darüber, ob die Frauen die Vorlesungen verstanden hatten, mit ihren Ergebnissen bei kurzen Prüfungen nach der Vorlesung verglich, stellte es fest, dass es zu 80 % genau war, um vorherzusagen, wer bestehen und wer durchfallen würde.

Der in Manchester trainierte Algorithmus würde, so die Pressemitteilung, für effizientere und sicherere Landgrenzübergänge sorgen und zur Prävention von Kriminalität und Terrorismus beitragen.

Das Tansania-Experiment führte zur Aufnahme von Silent Talker in iBorderCtrl. Im Jahr 2015 schrieb Athos Antoniades, einer der Organisatoren des entstehenden Konsortiums, eine E-Mail an O’Shea und fragte, ob das Team von Silent Talker sich einer Gruppe von Unternehmen und Polizeikräften anschließen wolle, die sich um einen EU-Zuschuss bewerben. In den vergangenen Jahren hatte der wachsende Fahrzeugverkehr in die EU die Agenten in den Grenzländern der Union überfordert, und die EU bot infolgedessen 4,5 Millionen Euro (5 Millionen US-Dollar) für jede Institution an, die effizientere und sicherere Landgrenzübergänge ermöglichen könnte ... und so zur Verhütung von Kriminalität und Terrorismus beitragen. Antoniades dachte, Silent Talker könnte eine entscheidende Rolle spielen.

Als das Projekt schließlich im Oktober 2018 ein öffentliches Pilotprojekt ankündigte, warb die Europäische Kommission schnell für die Erfolgsgeschichte des einzigartigen Ansatzes des Systems zur Betrugserkennung in einer Pressemitteilung , und erklärt, dass die Technologie die Mikrogesten von Reisenden analysiert, um herauszufinden, ob der Befragte lügt. Der in Manchester trainierte Algorithmus würde, so die Pressemitteilung weiter, für effizientere und sicherere Landgrenzübergänge sorgen und zur Prävention von Kriminalität und Terrorismus beitragen.

Der zugrunde liegende Algorithmus des Programms, sagte mir O’Shea, könnte in einer Vielzahl anderer Umgebungen eingesetzt werden – Werbung, Analyse von Versicherungsansprüchen, Bewerbungsscreening und Mitarbeiterbewertung. Sein überwältigender Glaube an seine Weisheit war für mich schwer zu teilen, aber selbst als er und ich telefonierten, überprüfte Silent Talker bereits Freiwillige an EU-Grenzübergängen; Das Unternehmen war erst kürzlich im Januar 2019 als Unternehmen gestartet worden. Also beschloss ich, nach Manchester zu gehen, um mich selbst davon zu überzeugen.


Die Büros von Silent Talker liegen etwa eine Meile von der Manchester Metropolitan University entfernt, an der O’Shea jetzt als Senior Lecturer tätig ist. Er hat die tägliche Weiterentwicklung der Technologie von Bandar übernommen. Das Unternehmen hat seinen Sitz in einem Backstein-Büropark in einem Wohnviertel, die Straße runter von einem Kebab-Restaurant und gegenüber von einem Fußballplatz. Im Inneren ist das Büro von Silent Talker ein einziger Raum mit ein paar Computern, Schreibtischen mit Aktentaschen darauf und erklärenden Postern über die Technologie aus den frühen 2000er Jahren.

Als ich im September das Büro des Unternehmens besuchte, setzte ich mich mit O’Shea und Bandar in einen Konferenzraum am Ende des Flurs. O’Shea war streng, aber leicht zerknittert, bis auf ein paar Haarbüschel und einen Van-Dyke-Bart kahl. Er begann das Gespräch, indem er darauf bestand, dass wir nicht über das iBorderCtrl-Projekt sprechen, und bezeichnete seine Kritiker später als falsch informiert. Er sprach in langen, abschweifenden Tangenten über die Leistungsfähigkeit des KI-Frameworks des Systems und zitierte gelegentlich den Computerpionier Alan Turing oder den Sprachphilosophen John Searle.

Maschinen und Menschen haben beide Intentionalität – Überzeugungen, Wünsche und Absichten über Objekte und Sachverhalte in der Welt, sagte er und verteidigte die Abhängigkeit des Systems von einem Algorithmus. Daher erfordern komplizierte Bewerbungen, dass Sie den Ideen und Absichten beider Seiten Gewicht verleihen.

O’Shea demonstrierte das System, indem er es ein Video analysieren ließ, in dem ein Mann Fragen dazu beantwortete, ob er 50 Dollar aus einer Kiste gestohlen hatte. Das Programm legte ein gelbes Quadrat um das Gesicht des Mannes und zwei kleinere Quadrate um seine Augen. Während er sprach, wechselte eine Nadel in der Ecke des Bildschirms von grün zu rot, wenn er falsche Antworten gab, und zurück zu einem moderaten Orange, wenn er nicht sprach. Am Ende des Interviews erstellte die Software ein Diagramm, in dem die Täuschungswahrscheinlichkeit gegen die Zeit aufgetragen wurde. Theoretisch zeigte sich das, wann er anfing und aufhörte zu lügen.

Während er sprach, wechselte eine Nadel in der Ecke des Bildschirms von grün zu rot, wenn er falsche Antworten gab, und zurück zu einem moderaten Orange, wenn er nicht sprach.

Das System kann laut O’Shea auf einem herkömmlichen Laptop ausgeführt werden, und die Benutzer zahlen etwa 10 US-Dollar pro analysierter Videominute. O'Shea sagte mir, dass die Software das Video vorläufig lokal verarbeitet, verschlüsselte Daten an einen Server sendet, wo sie weiter analysiert werden, und dann die Ergebnisse zurücksendet: Der Benutzer sieht ein Diagramm mit der Täuschungswahrscheinlichkeit, das unten überlagert ist des Videos.

Laut O’Shea überwacht das System rund 40 physische Kanäle am Körper eines Teilnehmers – alles von der Geschwindigkeit, mit der man blinzelt, bis zum Winkel des Kopfes. Es bringt zu jedem neuen Gesicht eine Theorie über Täuschung, die es entwickelt hat, indem es einen Trainingsdatensatz von Lügnern und Wahrsagern betrachtet. Das System misst die Gesichtsbewegungen und Haltungsänderungen eines Probanden viele Male pro Sekunde und sucht nach Bewegungsmustern, die mit denen übereinstimmen, die von den Lügnern in den Trainingsdaten geteilt werden. Diese Muster sind nicht so einfach wie Augenbewegungen zur Decke oder ein nach links geneigter Kopf. Sie sind eher wie Muster von Mustern, facettenreiche Beziehungen zwischen verschiedenen Bewegungen, zu komplex für einen Menschen, um sie zu verfolgen – ein typisches Merkmal von maschinell lernenden Systemen.

Die Aufgabe der KI besteht darin, festzustellen, welche Arten von Bewegungsmustern mit Täuschung in Verbindung gebracht werden können. Psychologen sagen oft, dass man eine Art Modell dafür haben sollte, wie ein System funktioniert, sagte O’Shea, aber wir haben kein funktionierendes Modell und wir brauchen auch keins. Wir lassen es die KI herausfinden. Er sagt jedoch auch, dass die Rechtfertigung für die Kanäle im Gesicht aus der akademischen Literatur zur Psychologie der Täuschung stammt. In einem 2018 Artikel über Silent Talker , sagen seine Entwickler, dass ihre Software davon ausgeht, dass bestimmte mentale Zustände, die mit trügerischem Verhalten verbunden sind, das [nonverbale Verhalten] eines Interviewpartners antreiben, wenn er täuscht. Zu diesen Verhaltensweisen gehören die kognitive Belastung oder die zusätzliche mentale Energie, die angeblich zum Lügen benötigt wird, und das Täuschen von Freude oder das Vergnügen, das ein Individuum angeblich hat, wenn es eine erfolgreiche Lüge erzählt.

Foto von Paul Ekman

Paul Ekman, ein Psychologe, dessen Theorie der „Mikroausdrücke“ sehr umstritten ist, hat unzählige US-Regierungsbehörden beraten. Wikimedia / Momopuppycat

Aber Ewout Meijer, Professor für Psychologie an der Universität Maastricht in den Niederlanden, sagt, dass die Gründe für die Annahme, dass solche Verhaltensweisen universell sind, bestenfalls instabil sind. Die Idee, dass man verräterische Verhaltenslecks im Gesicht finden kann, hat Wurzeln in der Arbeit von Paul Ekman, einem amerikanischen Psychologen, der in den 1980er Jahren eine heute berühmte Theorie der Mikroausdrücke oder unwillkürlichen Gesichtsbewegungen vertrat, die zu klein sind, um sie zu kontrollieren. Ekmans Recherchen machten ihn zum Bestsellerautor und inspirierten das TV-Krimidrama Lüg mich an . Er beriet unzählige US-Regierungsbehörden, darunter DHS und DARPA. Unter Berufung auf die nationale Sicherheit hat er Forschungsdaten geheim gehalten. Dies hat zu einer kontroversen Debatte darüber geführt, ob Mikroausdrücke überhaupt eine Bedeutung haben.

Die KI von Silent Talker verfolgt alle Arten von Gesichtsbewegungen, nicht Ekman-spezifische Mikroausdrücke. Wir haben diese hochrangigen Hinweise in unsere eigenen Mikrogesten zerlegt und KI-Komponenten trainiert, um sie zu sinnvollen Hinweismustern zu rekombinieren, schrieb ein Unternehmenssprecher in einer E-Mail. O’Shea sagt, dies ermögliche es dem System, irreführendes Verhalten zu erkennen, selbst wenn eine Person sich nur umschaut oder sich auf einem Stuhl bewegt.

Vieles hängt davon ab, ob Sie eine technologische oder eine psychologische Frage haben, sagt Meijer und warnt davor, dass O’Shea und sein Team nach Antworten auf psychologische Fragen zur Natur der Täuschung suchen könnten. Ein KI-System kann Menschen bei der Erkennung [Gesichtsausdrücke] übertreffen, aber selbst wenn dies der Fall wäre, sagt Ihnen das immer noch nicht, ob Sie daraus schließen können, ob jemand täuscht … Täuschung ist ein psychologisches Konstrukt. Es besteht nicht nur kein Konsens darüber die Ausdrücke korrelieren mit Täuschung, fügt Meijer hinzu; es gibt nicht einmal einen Konsens darüber ob tun sie. In einer E-Mail teilte das Unternehmen mit, dass solche Kritik für Silent Talker nicht relevant und die verwendeten Statistiken nicht angemessen seien.

Lüge mich an Fernsehplakat

Das Fernsehdrama Lüg mich an basierte teilweise auf Ekmans Mikroexpressionstheorie. Fox-Studios

Darüber hinaus weist Meijer darauf hin, dass der Algorithmus an Grenzübergängen oder in Vorstellungsgesprächen immer noch nutzlos sein wird, wenn er nicht auf einem so vielfältigen Datensatz trainiert wurde, wie er im wirklichen Leben ausgewertet wird. Untersuchungen zeigen, dass Gesichtserkennungsalgorithmen Minderheiten schlechter erkennen, wenn sie auf Gruppen von überwiegend weißen Gesichtern trainiert wurden, was O’Shea selbst zugibt. Ein Sprecher von Silent Talker schrieb in einer E-Mail: Wir haben mehrere Experimente mit kleineren unterschiedlichen Stichprobengrößen durchgeführt. Diese summieren sich auf Hunderte. Einige davon sind akademisch und wurden veröffentlicht [sic], andere sind kommerziell und vertraulich.

Alle veröffentlichten Forschungsergebnisse, die die Genauigkeit von Silent Talker belegen, stammen jedoch aus kleinen und unvollständigen Datensätzen: In der Studie von 2018 enthielt beispielsweise eine Trainingspopulation von 32 Personen doppelt so viele Männer wie Frauen und nur 10 Teilnehmer asiatischer/arabischer Abstammung keine schwarzen oder hispanischen Untertanen. Während die Software derzeit unterschiedliche Einstellungen für die Analyse von Männern und Frauen hat, sagte O’Shea, er sei sich nicht sicher, ob es Einstellungen für den ethnischen Hintergrund oder das Alter brauche.


Nachdem der Pilot von iBorderCtrl im Jahr 2018 angekündigt wurde, verurteilten Aktivisten und Politiker das Programm als eine beispiellose, orwellsche Erweiterung des Überwachungsstaats. Sophie in 't Veld, ein niederländisches Mitglied des Europäischen Parlaments und Vorsitzende der Mitte-Links-Partei Democrats 66, sagte in einem Brief an die Europäische Kommission, dass das Silent Talker-System die Grundrechte vieler grenzüberschreitender Reisender verletzen könnte und dass Organisationen wie Privacy International verurteilten dies als Teil eines breiteren Trends zur Verwendung undurchsichtiger und oft mangelhafter automatisierter Systeme zur Beurteilung, Bewertung und Klassifizierung von Menschen. Die Opposition schien das iBorderCtrl-Konsortium zu überraschen: Hatte die Europäische Kommission zunächst behauptet, iBorderCtrl würde ein System zur Beschleunigung des Grenzübertritts entwickeln, spricht ein Sprecher nun von einem rein theoretischen Forschungsprojekt. Antoniades sagte Ende 2018 einer niederländischen Zeitung, dass das Deception-Detection-System es möglicherweise letztendlich nicht in das Design schafft, aber zum Zeitpunkt dieses Schreibens wirbt Silent Talker immer noch für seine Teilnahme an iBorderCtrl auf seiner Website .

So oft Kritiker wie Wilde es entlarven, der Traum vom perfekten Lügendetektor wird einfach nicht sterben, besonders wenn er mit dem Glanz der KI beschönigt wird.

Silent Talker ist eine neue Version des alten Betrugs, meint Vera Wilde, eine amerikanische Akademikerin und Datenschutzaktivistin, die in Berlin lebt und mitgeholfen hat, eine Kampagne gegen iBorderCtrl zu starten. In gewisser Weise ist es derselbe Betrug, aber mit schlechterer Wissenschaft. In einem Lügendetektortest sucht ein Prüfer nach physiologischen Ereignissen, von denen angenommen wird, dass sie mit Täuschung korrelieren; In einem KI-System lassen Prüfer den Computer die Zusammenhänge selbst herausfinden. Als O’Shea sagt, dass er keine Theorie hat, liegt er falsch, fährt sie fort. Er hat eine Theorie. Es ist nur eine schlechte Theorie.

So oft Kritiker wie Wilde es entlarven, der Traum vom perfekten Lügendetektor wird einfach nicht sterben, besonders wenn er mit dem Glanz der KI beschönigt wird. Nachdem das DHS in den 2000er Jahren Millionen von Dollar für die Finanzierung der Täuschungsforschung an Universitäten ausgegeben hatte, versuchte es, eine eigene Version einer Verhaltensanalysetechnologie zu entwickeln. Dieses System mit dem Namen Future Attribute Screening Technology (FAST) zielte darauf ab, mithilfe von KI nach kriminellen Tendenzen in den Augen- und Körperbewegungen eines Probanden zu suchen. (Bei einer frühen Version mussten die Befragten auf einem Wii Fit-Balanceboard stehen, um Haltungsänderungen zu messen.) Drei Forscher, die vertraulich über geheime Projekte sprachen, sagten, dass das Programm nie auf den Weg gebracht wurde – es gab zu viele Meinungsverschiedenheiten innerhalb der Abteilung darüber, ob Ekmans Mikroausdrücke als Richtlinie für die Verhaltensanalyse verwendet werden sollen. Die Abteilung beendete das Programm im Jahr 2011.

Trotz des Scheiterns von FAST zeigt das DHS immer noch Interesse an Lügenerkennungstechniken. Letztes Jahr vergab es beispielsweise einen Vertrag über 110.000 US-Dollar an ein Personalunternehmen, um seine Mitarbeiter darin zu schulen, Täuschungen aufzudecken und durch Verhaltensanalysen eine Reaktion hervorzurufen. Andere Teile der Regierung setzen sich derweil immer noch für KI-Lösungen ein. Das Army Research Laboratory (ARL) hat derzeit einen Vertrag mit der Rutgers University, um ein KI-Programm zur Erkennung von Lügen im Gesellschaftsspiel Mafia zu entwickeln, als Teil eines größeren Versuchs, so etwas wie ein Google Glass zu entwickeln, das uns vor ein paar Taschendieben warnt dem überfüllten Basar, so Purush Iyer, der für das Projekt zuständige Leiter der ARL-Abteilung. Nemesysco, ein israelisches Unternehmen, das KI-Sprachanalysesoftware verkauft, sagte mir, dass seine Technologie von Polizeidienststellen in New York und Sheriffs im Mittleren Westen verwendet wird, um Verdächtige zu befragen, sowie von Inkasso-Callcentern, um die Emotionen von Schuldnern zu messen Anrufe.

Die unmittelbare und potenziell gefährliche Zukunft der KI-Lügenerkennung liegt nicht bei Regierungen, sondern im privaten Markt. Politiker, die Initiativen wie iBorderCtrl unterstützen, müssen sich letztlich vor den Wählern verantworten, und die meisten KI-Lügendetektoren könnten nach demselben Präzedenzfall, der den Polygraphen regelt, vom Gericht ausgeschlossen werden. Private Unternehmen sehen sich jedoch weniger Beschränkungen gegenüber, wenn sie solche Technologien verwenden, um Stellenbewerber und potenzielle Kunden zu überprüfen. Silent Talker ist eines von mehreren Unternehmen, die behaupten, einen objektiveren Weg anzubieten, um anomales oder irreführendes Verhalten zu erkennen, indem sie Kunden eine Risikoanalysemethode bieten, die über Kreditwürdigkeitsbewertungen und Social-Media-Profile hinausgeht.

Die Software generiert eine hohe Anzahl von Fehlalarmen.

Ein in Montana ansässiges Unternehmen namens Neuro-ID führt KI-Analysen von Mausbewegungen und Tastenanschlägen durch, um Banken und Versicherungsunternehmen bei der Bewertung des Betrugsrisikos zu unterstützen, und weist Kreditantragstellern einen Vertrauenswert von 1 bis 100 zu. In einem Video zeigte mir das Unternehmen, wie ein Kunde tätig wird Ein Online-Kreditantrag benötigt zusätzliche Zeit, um das Feld für das Haushaltseinkommen auszufüllen. Wenn Sie dabei die Maus bewegen, berücksichtigt das System dies in seiner Glaubwürdigkeitsbewertung. Es basiert auf Forschungen der Gründungswissenschaftler des Unternehmens, die behaupten, eine Korrelation zwischen Mausbewegungen und emotionaler Erregung aufzuzeigen: Ein Artikel, der behauptet, dass Täuschung die normalisierte Bewegungsdistanz erhöhen, die Bewegungsgeschwindigkeit verringern, die Reaktionszeit erhöhen und das Ergebnis bewirken kann in mehr Linksklicks. Die unternehmenseigenen Tests zeigen jedoch, dass die Software eine hohe Anzahl von Fehlalarmen generiert: In einer Fallstudie, in der Neuro-ID 20.000 Bewerbungen für eine E-Commerce-Website verarbeitete, waren weniger als die Hälfte der Bewerber mit den niedrigsten Punktzahlen (5 bis 10) stellte sich als betrügerisch heraus, und nur 10 % derjenigen, die Punktzahlen zwischen 20 und 30 erhielten, stellten ein Betrugsrisiko dar. Nach eigenen Angaben des Unternehmens kennzeichnet die Software Bewerber, die sich als unschuldig herausstellen könnten, und lässt das Unternehmen diese Informationen verwenden, um nach Belieben weiterzuverfolgen. Es gibt keine verhaltensbasierte Analyse, die 100 % genau ist, sagte mir ein Sprecher. Wir empfehlen Ihnen, diese in Kombination mit anderen Informationen über Bewerber zu verwenden, um bessere Entscheidungen zu treffen und [betrügerische Kunden] effizienter zu fangen.

Converus, ein in Utah ansässiges Startup, verkauft eine Software namens EyeDetect, die die Erweiterung der Pupillen einer Testperson während eines Interviews misst, um die kognitive Belastung zu erkennen. Wie Silent Talker geht das Tool davon aus, dass Lügen kognitiv anspruchsvoller ist als die Wahrheit zu sagen. Laut a Artikel 2018 in Wired haben Polizeidienststellen in Salt Lake City und Columbus, Georgia, EyeDetect verwendet, um Stellenbewerber zu überprüfen. Converus teilte Wired auch mit, dass McDonald’s, Best Western, Sheraton, IHOP und FedEx seine Software in Panama und Guatemala auf eine Weise verwendeten, die in den USA illegal gewesen wäre.

In einer Stellungnahme gab es mir gegenüber das Unternehmen an zu wenig Studien die zeigen, dass EyeDetect eine Genauigkeit von etwa 85 % bei der Identifizierung von Lügnern und Wahrheitsrednern erreicht, mit Stichproben von bis zu 150 Personen. Firmenpräsident Todd Mickelsen sagt, dass der Algorithmus seiner Firma in Hunderttausenden von Interviews trainiert wurde. Aber Charles Honts, Professor für Psychologie an der Boise State University, der auch im Beirat von Converus sitzt, sagte, diese Ergebnisse bewiesen nicht, dass man sich in Feldinterviews auf EyeDetect verlassen könne. Ich finde das EyeDetect-System sehr interessant, aber andererseits benutze ich es nicht, sagte er mir. Ich denke, die Datenbank ist immer noch relativ klein und stammt hauptsächlich aus einem Labor. Bis es erweitert ist und andere Leute es repliziert haben, würde ich zögern, es im Feld zu verwenden.

Die Forscher der University of Arizona, die das AVATAR-System entwickelt haben, haben auch ein Privatunternehmen, Discern Science, gegründet, um ihre eigene Täuschungserkennungstechnologie zu vermarkten. Discern wurde letztes Jahr eingeführt und verkauft einen zwei Meter hohen Kiosk, der dem ursprünglichen AVATAR ähnelt. laut einem Artikel in der Financial Times hat das Unternehmen eine Joint-Venture-Vereinbarung mit einem Partner aus der Luftfahrtindustrie abgeschlossen, um das Tool an Flughäfen zu verkaufen. Das System Maße Gesichtsbewegungen und Stimmstress, um laut Werbematerialien unsichtbar Informationen vom Gesprächspartner aus Gesprächsdistanz zu sammeln. Wie Silent Talker und Converus behauptet Discern, dass die Technologie rund 85 % der Lügner und Wahrheitsredner zuverlässig erkennen kann, aber auch hier wurden ihre Ergebnisse nie unabhängig repliziert. Mindestens eine der Eingaben, die der Kiosk verwendet, war wiederholt gezeigt sein unseriös . (Honts bemerkte weiter, dass es fast keine Unterstützung für Gesichtsbewegungsanalysen wie die von AVATAR und Silent Talker gibt – es gab so viele Fehler bei der Replikation, sagte er.)

Jeder, der Ihnen sagt, dass er ein Gerät hat, das ein reiner Lügendetektor ist, ist ein Scharlatan.

Auf die Frage nach der wissenschaftlichen Unterstützung für den Kiosk des Unternehmens betonte die Discern-Forscherin Judee Burgoon, dass sie lediglich Bewertungen abgeben, keine verbindlichen Urteile über Wahrheit und Falschheit. Systeme wie AVATAR und Silent Talker, sagte sie, können Täuschung nicht direkt messen, und fügte hinzu, dass jeder, der Ihnen sagt, dass er ein Gerät hat, das ein reiner Lügendetektor ist, ein Scharlatan ist. In Marketingmaterialien präsentiert Discern das Tool jedoch als zuverlässigen Lügendetektor: die Website des Unternehmens Behauptungen dass es helfen kann, versteckte Pläne aufzudecken, und dass seine Algorithmen wissenschaftlich bewiesen sind, dass sie Täuschung schneller und zuverlässiger erkennen als jede Alternative.


Das Berufungsgericht hob die Verurteilung von Emmanuel Mervilus im Jahr 2011 auf, entließ ihn aus dem Gefängnis und ordnete ein Wiederaufnahmeverfahren an; Er hatte mehr als drei Jahre seiner Haftstrafe verbüßt. Beim zweiten Prozess im Jahr 2013 berieten die Geschworenen nur 40 Minuten, bevor sie ihn freisprachen. Ohne den Lügendetektor und den beharrlichen Glauben an seine Genauigkeit hätte er vielleicht nie beim ersten Mal einen Fuß in einen Gerichtssaal gesetzt. Mervilus hat die Polizeibeamten, die ihn ursprünglich verhaftet und verhört hatten, verklagt und behauptet, dass sie sein Recht auf ein ordnungsgemäßes Verfahren verletzt haben, indem sie Lügendetektortests verwendet haben, von denen sie wussten, dass sie fehlerhaft waren, um eine Verurteilung zu erreichen. Der Fall wird am 13. März einer Vergleichskonferenz unterzogen.

Auch wenn der weit verbreitete Einsatz von Silent Talker und ähnlichen Systemen nicht zu mehr Verurteilungen von unschuldigen Menschen wie Mervilus führt, könnte es dennoch dazu beitragen, eine neue Art von sozialem Schibboleth zu schaffen, das die Menschen dazu zwingt, sich einer Glaubwürdigkeitsprüfung zu unterziehen, bevor sie ein Auto mieten oder aussteigen ein Darlehen.

Vor Gericht müsse man materielle Beweise wie Haare und Blut abgeben, sagt Wilde. Aber Sie haben auch ein Recht zu schweigen, ein Recht, nicht gegen sich selbst zu sprechen. Mervilus entschied sich für den Polygraphentest in der Annahme, dass er, wie ein DNA-Test, zeigen würde, dass er unschuldig war. Und obwohl das Gerät falsch lag, war es nicht die Maschine selbst, die ihn ins Gefängnis brachte. Nach Ansicht der Jury seien die Testergebnisse glaubwürdiger als der Sachverhalt.

Die grundlegende Prämisse der KI-Lügenerkennung ist, dass Lügen dazu da sind, mit den richtigen Werkzeugen gesehen zu werden. Psychologen wissen immer noch nicht, wie gültig diese Behauptung ist, aber in der Zwischenzeit kann der Glaube an ihre Gültigkeit ausreichen, um verdiente Bewerber für Jobs und Kredite zu disqualifizieren und unschuldige Menschen daran zu hindern, nationale Grenzen zu überschreiten. Das Versprechen eines Fensters in das Innenleben anderer ist zu verlockend, um darauf zu verzichten, selbst wenn niemand sicher sein kann, wie klar dieses Fenster ist.

Es ist das Versprechen des Gedankenlesens, sagt Wilde. Sie können sehen, dass es gefälscht ist, aber das ist es, was sie verkaufen.

verbergen