So verwenden Sie Twitter für das Mining personenbezogener Daten

Ihr Twitter-Stream (und bald auch Ihr Verlauf der Facebook-Pinnwandbeiträge) ist eine reichhaltige Informationsquelle über Sie oder, wenn man bedenkt, dass die meisten Tweets öffentlich sind, über jeden anderen. Es umfasst alles, von Ihren Sprachmustern und den Themen, von denen Sie besessen sind, bis hin zur Identität Ihrer echten Freunde – zumindest in der Tweet-O-Sphäre. Der Trick besteht darin, es zu entsperren.





Der erste Schritt, um sich in Ihr Unterbewusstsein einzudringen, besteht darin, eine repräsentative Probe Ihrer Tweets herunterzuladen. Glücklicherweise speichert Twitter die letzten 3.200 davon, was wahrscheinlich mehr ist, als Sie jemals ausgegeben haben, es sei denn, Sie sind besonders produktiv.

Eine einfache Möglichkeit, all diese Tweets herunterzuladen, besteht darin, sich für einen Dienst wie anzumelden BackupMy.Net , das alle verfügbaren Tweets (bis zu dieser Grenze von 3.200) erfasst und Ihnen ermöglicht, sie in verschiedenen Formaten herunterzuladen.

Schritt zwei, holen Sie sich ein kostenloses Exemplar von TextWrangler (wenn Sie einen Mac verwenden) oder seine Windows-Äquivalent . Wenn Sie Linux verwenden, können vi oder emacs alles tun, was ich gleich beschreiben werde.



Schritt drei, beginnen Sie mit der Filterung Ihres Tweet-Korpus. Betrachten Sie es als einen Hügel aus nassem Lehm. Sie können ihm alle Fragen stellen, die Sie möchten. Folgendes habe ich gefragt; Wenn Sie andere Ideen haben, hinterlassen Sie sie in den Kommentaren.

i) Löschen Sie jede zweite Zeile, um das Rauschen all dieser Zeit- und Datumsstempel zu beseitigen. TextWrangler verfügt über eine leistungsstarke Funktion 'Prozesszeilen enthaltend...' im Menü 'Text'. In diesem Fall können Sie jede Zeile löschen, die die Zeichenfolge +0000 enthält, von der ich vermute, dass sie die leere Variable ist, in die Geo-Standortdaten normalerweise gehen würden. Wenn Ihre Tweets geografisch lokalisiert sind, suchen Sie einfach nach jedem Jahr, in dem Sie getwittert haben, vorausgesetzt, Sie geben nicht oft Jahre in Ihre Tweets ein.

Dies:



Wird das:

Fügen Sie nun den resultierenden Text in Wortle , dem Wortwolken-Generator, denn Wortwolken sind einfach schöne Möglichkeiten, die Worthäufigkeit zu visualisieren.

In erster Näherung ist es nicht schlecht - einige Ihrer Interessen und Freunde sind zu sehen, wie sie versuchen, Müllwörter zu entdecken, die wir alle auf Twitter verwenden, wie z. B. RT



ii) Entfernen Sie mit einem einfachen Befehl zum Suchen und Ersetzen RT, via und alle anderen Wörter, die Ihnen nichts sagen. Jetzt können Sie sehen, wovon Sie besessen sind. Ich war zufällig besessen von Klimawandel, Nachrichten-Buzzwords (neu, jetzt) ​​und anscheinend Sarkasmus und ironische Distanz signalisierend, indem ich Satzfragmente anscheinend mit dem Wort begann.

iii) Verwenden Sie für ein reineres Destillat Ihrer eigenen Sprachmuster und Neurosen den Befehl Zeilen mit…

iv) Wenn Sie herausfinden möchten, wer Ihre wahren Freunde auf Twitter sind (und in geringerem Maße, worüber Sie mit ihnen sprechen), extrahieren Sie alle Zeilen, die ein @ enthalten.



Wenn Sie wissen möchten, was Sie im Gespräch mit Ihren Freunden sagen, löschen Sie einfach jedes Wort, das mit einem @ beginnt. Oder sortieren Sie das Dokument so, dass Sie nur jedes Gespräch erfassen können, das Sie jemals mit einer bestimmten Person geführt haben, und *das* in eine Wortwolke verwandeln.

v) Wenn Sie wissen möchten, dass Sie sprechen, wenn Sie über sich selbst sprechen, extrahieren Sie einfach jede Zeile mit der (Groß-/Kleinschreibung beachten) Zeichenfolge I

Es gibt unzählige Tools im Web, um Ihren Twitter-Stream zu analysieren, von Frequenzanalyse zu Emotionaler Inhalt , aber soweit ich weiß, ist es die einzige Möglichkeit, ihren tatsächlichen Inhalt mit dieser Genauigkeit zu visualisieren, wenn Sie alle Ihre Tweets herunterladen und selbst analysieren. Ich bin mir sicher, dass es Dutzende von Anfragen gibt, an die ich noch nicht einmal gedacht habe, die mit dieser Methode möglich sind – hinterlassen Sie Ihre Ideen gerne in den Kommentaren.

Folge Mims auf Twitter oder kontaktiere ihn per E-Mail .

verbergen