Tweets sind seit 2009 kürzer geworden, sagen Informatiker

Früher, sagen wir im Jahr 2009, war Twitter ein relativ unbekanntes soziales Netzwerk, das sich wie ein Lauffeuer verbreitete. 2007 posteten Twitter-Nutzer rund 400.000 Tweets pro Quartal, im Juni 2010 waren es täglich 65 Millionen. Heute gibt es 200 Millionen registrierte Nutzer, die täglich rund 400 Millionen Tweets versenden.



Während dieser kurzen Zeit ist Twitter so populär geworden, dass seine technische Argot in die allgemeine Sprache eingedrungen ist. Worte wie Hashtag und @name wären noch vor wenigen Jahren kaum mehr als Kauderwelsch erschienen. Aber auch das Wort tweet ist jetzt ein offiziell anerkanntes Verb im Oxford English Dictionary.

Jetzt gibt es Beweise dafür, dass Twitter möglicherweise einen tieferen Einfluss auf die Art und Weise hat, wie wir kommunizieren. Heute sagen Christian Alis und May Lim von der Universität der Philippinen, dass sie gemessen haben, wie sich die Länge der Tweets zwischen September 2009 und Dezember 2012 verändert hat, und sagen, dass die Tweets in dieser Zeit dramatisch geschrumpft sind. Die Leute kommunizieren mit weniger und kürzeren Wörtern, sagen sie, fast sicher, weil wir alle Jargon effektiver verwenden.



Sie haben auch untersucht, wie die Länge von Tweets in den USA von Bundesstaat zu Bundesstaat geografisch variiert. Und sie haben nachgesehen, wie die Änderungen mit verschiedenen sozioökonomischen Statistiken des US Census Bureau korrelieren. Die Ergebnisse sind überraschend.



Zunächst mehr zum Studium selbst. Alis und Lim sammelten 229 Millionen Tweets, die zwischen dem 18. September 2009 und dem 14. Dezember 2012 veröffentlicht wurden. Anschließend zählten sie die Länge jedes Tweets und stellten diese dem Datum der Veröffentlichung gegenüber.

Die Daten sind interessant. Die Verteilung der Tweet-Längen weist zwei Spitzen auf. Einer liegt nahe der 140-Zeichen-Grenze für Tweets, die Allis und Lam als erzwungene Einschränkung interpretieren. Mit anderen Worten, Hochtöner können Nachrichten nicht länger senden, selbst wenn sie möchten, und sind daher gezwungen, ihre Nachrichten mit dieser Länge zu beenden.

Der zweite Peak variiert im Laufe der Zeit. Zwischen November 2009 und Dezember 2012 sagen Alis und Lim, dass die mediane Äußerungslänge in Wörtern von 8 auf 5 Wörter zurückgegangen ist



Diese Verkürzung ist ein globales Phänomen, das für den gesamten Datensatz gilt, nur für Tweets in englischer Sprache und selbst wenn alle Links aus dem Datensatz entfernt wurden.

(Im Oktober 2011 führte Twitter einen Algorithmus zur Linkverkürzung ein, der alle URLs in Adressen mit 20 Zeichen umwandelt. Dies führt zu einem Anstieg der Wörter mit 20 Zeichen Länge, ändert jedoch nichts am Trend zu kürzeren Tweets.)

Nachdem ich diesen merkwürdigen Verkürzungseffekt gefunden habe. Alis und Lim fragen, was die Ursache sein könnte. Die Verkürzung, so scheint es, kann durch den vermehrten Gebrauch von Jargon erklärt werden, sagen sie.



Das ist bedeutsam, weil es impliziert, dass Twitter-Nutzer in klar definierte Gruppen von denen aufgeteilt werden, die denselben Jargon verstehen.

In einer merkwürdigen Wendung untersuchen Alis und Lim auch die Teilmenge von 800.000 Tweets, die mit einem US-Bundesstaat mit Geotags versehen sind. Sie sagen, dass die Zahl der Tweets aus jedem Bundesstaat stark mit der Bevölkerung dieses Bundesstaates korreliert, wie sie bei der Volkszählung von 2010 verzeichnet wurde.

Wenn man die Länge von Äußerungen auf einer Karte der USA aufträgt, wird ein klarer geographischer Trend offensichtlich. Südöstliche und östliche US-Bundesstaaten haben tendenziell kürzere Äußerungslängen, sagen sie. Warum das so ist, ist nicht klar.



Alis und Lim prüfen weiter auf Korrelationen mit 51 Variablen, die bei der Volkszählung 2010 gemessen und jetzt online veröffentlicht wurden. Dies sind Faktoren wie Personen ab 25 Jahren mit Abitur oder höher von 2007 bis 2011 in Prozent oder Eigentumswohnungen in Prozent der gesamten bewohnten Wohneinheiten von 2007 bis 2011 oder Schwarze Wohnbevölkerung 2011 in Prozent.

Es stellt sich heraus, dass die einzige Variable, die stark mit kürzeren Äußerungen korreliert, der schwarze Bevölkerungsanteil ist. Warum dies so sein sollte, ist nicht klar, aber Alis und Lim weisen darauf hin, dass es Hinweise darauf gibt, dass die schwarze Bevölkerung Twitter deutlich häufiger nutzt als andere Gruppen und dass in dieser Gruppe Jargon möglicherweise häufiger vorkommt.

Natürlich bedeutet Korrelation nicht Kausalität. Eine Möglichkeit, dies genauer zu untersuchen, besteht darin, den Inhalt der Tweets im Detail zu untersuchen. Aber Alis und Lim sagen, dass dies den Rahmen ihrer Studie sprengen würde.

Das Interessante an dieser Arbeit ist, dass Gespräche die bestehenden Normen einer Sprache widerspiegeln. Jeder Beweis für eine Veränderung ist also signifikant. Es kann sein, dass wir alle in unseren Tweets viel mehr Jargon verwenden und dies eine grundlegende Veränderung in unserer Art und Weise darstellt, wie wir kommunizieren. Andererseits lernen wir vielleicht gerade, wie wir Twitter effizienter nutzen können. Auf einer gewissen Ebene sind diese Dinge vielleicht sogar gleichwertig.

Ihre Meinung bitte im Kommentarbereich.

Ref: arxiv.org/abs/1310.2479 : Räumlich-zeitliche Variation von Gesprächsäußerungen auf Twitter

verbergen