Die Informatik verrät, warum diese Überschrift nicht lustig ist

Rohpixel | Unsplash





Humor scheint ein fester Bestandteil des Menschseins zu sein. Unsere Fähigkeit zu lächeln, zu lachen und zu kichern spielt in sozialen Situationen eine wichtige Rolle; das weckt das Interesse von Soziologen und Anthropologen. Aber man muss einen Witz verstehen, bevor man lachen kann, daher ist Humor auch für Kognitionspsychologen interessant.

Das führt sofort zu einer potenziellen Rolle für künstliche Intelligenz. Computerwissenschaftler fragen sich daher, ob sich Humor berechnen lässt – und wenn ja, wie.

Jeder Versuch, diese Frage zu beantworten, stößt sofort auf ein Problem: das Fehlen geeigneter Datenbanken, die sich für Computerstudien eignen. Zum Beispiel würde eine Datenbank mit ähnlichen Sätzen, die lustig und unlustig sind, es Forschern ermöglichen, den Unterschied zwischen ihnen herauszuarbeiten und herauszufinden, wie man sie ineinander überführt. Aber eine solche Datenbank hat leider gefehlt.



Da wären Robert West von der EPFL in der Schweiz und Eric Horvitz von Microsoft Research in den USA. Diese Typen haben satirische Nachrichtenschlagzeilen verwendet, die im Allgemeinen lustig sind, um eine Datenbank mit ähnlichen Sätzen, die nicht lustig sind, zu Crowdsourcen.

Anhand der Unterschiede zwischen diesen Sätzen können die Forscher sehen, wie der Wechsel von lustig zu unlustig erfolgt und wo der Ursprung des Humors liegen muss. Es würde uns erlauben zu verstehen, warum ein satirischer Text in einer feineren Granularität als bisher möglich ist, indem wir die genauen Wörter identifizieren, die den Unterschied zwischen ernst und lustig machen, sagen sie. Das Ergebnis ist ein einzigartiger Einblick in die Natur des Humors.

Die Forscher erstellten die Datenbank durch den Aufbau eines Online-Spiels namens unfun.me . Die Spieler erhalten eine satirische Schlagzeile aus The Onion und werden dann gebeten, daraus eine ernsthafte Schlagzeile zu machen, indem sie so wenige Wörter wie möglich ändern. Die Idee ist, andere Spieler zu täuschen und zu glauben, dass die Überschrift echt ist.



Zum Beispiel veröffentlichte The Onion im Jahr 2001 die satirische Nachrichtenschlagzeile Gott diagnostizierte eine bipolare Störung. Dies kann ernst genommen werden, indem das Wort Gott gegen den Namen einer realen Person ausgetauscht wird, wie in Bob Dylan, bei dem eine bipolare Störung diagnostiziert wurde. Denkbar wäre ein solcher Titel auf einer seriösen Nachrichtenseite. Das Spiel fordert die Spieler dann auf, die generierten Schlagzeilen nach Witz zu ordnen.

West und Horvitz analysieren die resultierende Datenbank, indem sie untersuchen, welcher Teil einer Überschrift am häufigsten geändert wird, um sie unwitzig zu machen. Sie betrachten auch die Art der Änderung.

Die Ergebnisse sorgen für eine interessante Lektüre. Überschriften bestehen im Allgemeinen aus mehreren Teilen: Nominalphrasen, Verbphrasen, Adjektivphrasen und Präpositionen. Es stellt sich heraus, dass eine Nominalphrase der Teil ist, der am häufigsten geändert wird, um eine lustige Überschrift unlustig zu machen, insbesondere wenn das Wort oder die Wörter am Ende eines Satzes stehen.



Zum Beispiel: Die satirische Schlagzeile Asiatische Wirtschaftsnöte, die die Entlassung von 700.000 Popstars erzwingen, kann leicht ernst genommen werden, indem Popstars durch Arbeiter ersetzt werden.

Das weist die Forscher auf eine wichtige Schlussfolgerung hin. Unsere Analyse zeigt, dass sich der Humor eher am Ende der Schlagzeilen aufhält, sagen sie. Sie nennen diese Phrasen am Ende von Sätzen Micropunchlines.

Aber die Forscher können noch weiter gehen, indem sie die Art der Veränderung untersuchen. Dabei greifen sie auf eine bekannte Humortheorie zurück, die 1985 von Victor Raskin veröffentlicht wurde. Diese legt nahe, dass der Unterschied zwischen einer lustigen und einer unlustigen Überschrift besonderen Regeln folgen muss. Die beiden Schriften müssen einander entlang einer von wenigen Dimensionen gegenübergestellt werden, sagen West und Horvitz. Eines der beiden Skripte muss möglich sein, das andere unmöglich; der eine normal, der andere anormal; oder das eine wirklich, das andere nicht wirklich.



Im obigen Beispiel ist die Entlassung von 700.000 Arbeitnehmern möglich oder tatsächlich, aber die Entlassung von 700.000 Popstars ist unmöglich und nicht tatsächlich. Im vorherigen Beispiel kann Gott – da er perfekt ist – unmöglich eine bipolare Störung haben, während Bob Dylan, ein bloßer Mensch, dies könnte. Unsere Ergebnisse bestätigen damit die Theorie empirisch, sagen die Forscher.

Und sie sagen, dass derselbe Mechanismus auch Einblicke in Unhöflichkeit, Sexismus, Euphemismen usw. geben könnte, indem er die Leute auffordert, Sätze um ein Wort zu ändern.

Eine interessante Frage ist, ob diese Einsichten eine nützliche Möglichkeit bieten, in die entgegengesetzte Richtung zu gehen – einen unlustigen Satz lustig zu machen.

Das ist viel schwieriger. Das Team weist darauf hin, dass selbst bei The Onion 600 Schlagzeilen berücksichtigt werden, bevor es jede Woche nur 16 tatsächlich in den Druck schaffen. Natürlich ist es viel einfacher, Humor zu entfernen, als ihn hinzuzufügen.

Vielleicht könnte sich das durch die Erkenntnisse ändern, die dieses Papier liefert, wenn sie berechnet werden können. Bei dieser Art von rechnerischem Humor könnte es sein, dass das Internet bald mit kichernden Schlagzeilen überschwemmt wird, die vom größten satirischen Comic der Geschichte – der künstlichen Intelligenz – geschaffen wurden.

Wir können es kaum erwarten. Hm.

Ref: arxiv.org/abs/1901.03253 : Reverse-Engineering-Satire oder Papier über Computational Humor, das trotz ernsthafter Fortschritte akzeptiert wurde

verbergen