Datendiskriminierung bedeutet, dass die Armen ein anderes Internet erleben können

Datenanalysen werden verwendet, um eine subtile Form der Diskriminierung zu implementieren, während anonyme Datensätze abgebaut werden können, um Gesundheitsdaten und andere private Informationen offenzulegen, warnte ein Microsoft-Forscher heute Morgen um MIT-Technologie-Überprüfung 's EmTech-Konferenz.





Kate Crawford

Datenteilung: Kate Crawford spricht heute auf der EmTech-Konferenz am MIT.

Kate Crawford , leitender Forscher bei Microsoft Research, argumentierte, dass diese Probleme mit neuen rechtlichen Ansätzen zur Verwendung personenbezogener Daten angegangen werden könnten.

In einem neuen Papier , schlagen sie und ein Kollege ein Verfahren vor, das den Menschen mehr Rechte einräumen würde, um zu verstehen, wie Datenanalysen bei gegen sie getroffenen Entscheidungen verwendet werden, wie z. B. die Ablehnung einer Krankenversicherung oder eines Arbeitsplatzes. Es ist der Beginn eines Gesprächs darüber, wie dies besser gemacht werden kann, sagte Crawford, der auch Gastprofessor am MIT Center for Civic Media ist, in einem Interview vor der Veranstaltung. Die Leute denken, „Big Data“ vermeidet das Problem der Diskriminierung, weil man es mit großen Datensätzen zu tun hat, aber tatsächlich wird Big Data für immer präzisere Formen der Diskriminierung verwendet – eine Form des Data Redlining.



Während ihres Vortrags heute Morgen fügte Crawford hinzu, dass man bei Big Data nie wissen wird, was diese Diskriminierungen sind, und ich denke, hier beginnt die Besorgnis.

Gesundheitsdaten seien besonders anfällig, sagt der Forscher. Suchbegriffe zu Krankheitssymptomen, Online-Käufe von Medizinprodukten oder sogar die RFID-Tags auf Arzneimittelverpackungen können Websites und Händlern Aufschluss über die Gesundheit einer Person geben.

Als Crawford und Jason Schultz , ein Professor an der New York University Law School, schrieb in ihrem Artikel: Wenn diese Datensätze mit traditionellen Gesundheitsinformationen verglichen werden, wie es Big Data tun soll, ist es möglich, ein detailliertes Bild über die Gesundheit einer Person zu erstellen, einschließlich Informationen, die eine Person möglicherweise niemals einem Gesundheitsdienstleister offengelegt hat.



Und eine kürzlich erschienene Cambridge University lernen , auf die Crawford in ihrem Vortrag anspielte, stellte fest, dass hochsensible persönliche Eigenschaften – einschließlich sexueller Orientierung, Persönlichkeitsmerkmale, Suchtmittelkonsum und sogar Trennung der Eltern – sehr vorhersehbar sind, indem analysiert wird, was Menschen auf Facebook anklicken, um anzuzeigen, dass sie es mögen. Die Studie analysierte die Likes von 58.000 Facebook-Nutzern.

In ähnlicher Weise können Kaufhistorien, Tweets sowie demografische, Standort- und andere Informationen, die über einzelne Webbenutzer gesammelt werden, in Kombination mit Daten aus anderen Quellen zu neuen Profilen führen, die ein Arbeitgeber oder Vermieter verwenden könnte, um jemandem einen Job oder eine Stelle zu verweigern Wohnung.

Als Reaktion auf solche Risiken schlagen die Autoren des Papiers einen Rechtsrahmen vor, den sie Big Data Due Process nennen. Nach diesem Konzept hätte eine Person, die einer bestimmten Bestimmung unterzogen wurde – sei es die Ablehnung einer Krankenversicherung, die Ablehnung eines Arbeits- oder Wohnungsantrags oder eine Festnahme – das Recht, zu erfahren, wie Big Data Analytics verwendet wird.



Dies würde die Art von Offenlegungs- und Kreuzverhörrechten mit sich bringen, die bereits in den Rechtssystemen der Vereinigten Staaten und vieler anderer Nationen verankert sind. Bevor die Rolle von Big Data bei der Entscheidungsfindung, insbesondere in der Regierung, stärker akzeptiert werden kann, muss es auch fair erscheinen und ein akzeptables Maß an Vorhersehbarkeit, Transparenz und Rationalität aufweisen, schreiben die Autoren.

Datenanalysen können auch zu großen Fehlern führen, bemerkt Crawford. Selbst die früher erfolgreiche Verwendung von Google-Suchbegriffen zur Erkennung von Grippeausbrüchen scheiterte im vergangenen Jahr, als die tatsächlichen Fälle weit hinter den Vorhersagen zurückblieben. Die zunehmende Medienberichterstattung über Grippe und das Gerede über die Grippe in den sozialen Medien wurden mit Anzeichen dafür verwechselt, dass sich Menschen über ihre Krankheit beschweren, was zu Überschätzungen führte. Hier können Social-Media-Daten kompliziert werden, sagte Crawford.

Und die Daten, die uns mitteilen, können noch grundlegendere Fehler aufweisen. Nach dem Hurrikan Sandy gab es beispielsweise nur wenige Tweets aus den am stärksten betroffenen Gebieten außerhalb von Manhattan. Wenn wir anfangen, Social-Media-Datensätze zu verwenden, um den Puls einer Nation zu messen oder eine Krise zu verstehen – oder sie tatsächlich zum Einsatz von Ressourcen nutzen –, erhalten wir ein verzerrtes Bild von dem, was passiert, warnte Crawford in ihrem Vortrag.



verbergen