Wie ein Troll-Erkennungsalgorithmus sein antisoziales Handwerk erlernte

Trolle sind die Geißel vieler Internetseiten. Dies sind Personen, die sich absichtlich asozial verhalten, indem sie aufrührerische oder nicht zum Thema gehörende Nachrichten posten. Bestenfalls sind sie ein frustrierendes Ärgernis; im schlimmsten Fall können sie das Leben der Menschen zur Qual machen.





Eine Möglichkeit, Trolle früh in ihrer Online-Karriere zu erkennen und ihre schlimmsten Exzesse zu verhindern, wäre also ein wertvolles Werkzeug.

Heute sagen Justin Cheng von der Stanford University in Kalifornien und ein paar Freunde, dass sie genau ein solches Tool entwickelt haben, indem sie das Verhalten von Trollen auf mehreren bekannten Websites analysiert und einen Algorithmus entwickelt haben, der sie nach nur 10 Beiträgen genau erkennen kann. Sie sagen, dass ihre Technik von großer praktischer Bedeutung für die Leute sein sollte, die Online-Communities unterhalten.

Cheng und Co. untersuchen drei Online-Nachrichtengemeinschaften: die allgemeine Nachrichtenseite CNN.com, die politische Nachrichtenseite Breitbart.com und die Computerspielseite IGN.com.



Auf jeder dieser Seiten haben sie eine Liste von Benutzern, die wegen unsozialen Verhaltens gesperrt wurden, insgesamt über 10.000 von ihnen. Sie haben auch alle Nachrichten, die von diesen Benutzern während ihrer Online-Aktivität gepostet wurden. Solche Personen sind eindeutige Beispiele für asoziale Benutzer und stellen in unseren Analysen die „Grundwahrheit“ dar, sagen Cheng und Co.

Diese Jungs wollten drei verschiedene Fragen über asoziale Benutzer beantworten. Erstens, ob sie während ihres gesamten Gemeinschaftslebens oder nur gegen Ende asozial sind. Zweitens, ob die Reaktion der Community dazu führt, dass sich ihr Verhalten verschlechtert. Und schließlich, ob asoziale Nutzer frühzeitig treffsicher identifiziert werden können.

Durch den Vergleich der Nachrichten, die von Benutzern gepostet wurden, die letztendlich gesperrt wurden, mit Nachrichten, die von Benutzern gepostet wurden, die nie gesperrt wurden, entdecken Cheng und Co einige deutliche Unterschiede. Ein Maß, das sie verwenden, ist die Lesbarkeit von Beiträgen, die anhand einer Metrik namens Automated Readability Index beurteilt wird.



Dies zeigt deutlich, dass User, die später gebannt werden, dazu neigen, anfangs qualitativ schlechtere Posts zu schreiben. Und nicht nur das, die Qualität ihrer Posts nimmt mit der Zeit ab.

Und während Gemeinschaften zunächst nachsichtig erscheinen und daher asoziale Benutzer nur langsam verbieten, werden sie mit der Zeit weniger tolerant. Dies führt zu einer erhöhten Rate, mit der [Posts von asozialen Benutzern] gelöscht werden, sagen sie.

Interessanterweise sagen Cheng und Co, dass die Unterschiede zwischen Nachrichten, die von Personen gepostet werden, die später gesperrt werden, und denen, die es nicht sind, so klar sind, dass es relativ einfach ist, sie mit einem maschinellen Lernalgorithmus zu erkennen. Tatsächlich müssen wir nur fünf bis zehn Benutzerbeiträge beobachten, bevor ein Klassifikator eine zuverlässige Vorhersage treffen kann, rühmen sie sich.



Das könnte sich als nützlich herausstellen. Antisoziales Verhalten ist ein zunehmend schwerwiegendes Problem, das einen erheblichen menschlichen Einsatz erfordert, um erkannt und angegangen zu werden. Dieser Prozess bedeutet oft, dass asoziale Benutzer viel länger als nötig arbeiten dürfen. Unsere Methoden können asoziale Benutzer früh in ihrem Gemeinschaftsleben effektiv identifizieren und einen Teil dieser Belastung verringern, sagen Cheng und Co.

Natürlich ist bei jedem automatisierten Ansatz Vorsicht geboten. Eine potenzielle Gefahr besteht darin, Benutzer, die nicht asozial sind, aber vom Algorithmus als solche identifiziert wurden, unnötig zu sperren. Diese Falsch-Positiv-Rate muss genauer untersucht werden.

Dennoch könnte die Arbeit von Moderatoren auf Seiten, die Nachrichten zulassen, dank des Ansatzes von Cheng und Co. bald deutlich erleichtert werden.



Ref: arxiv.org/abs/1504.00680 : Asoziales Verhalten in Online-Diskussionsgemeinschaften

verbergen