211service.com
So ordnet Google Tweets ein
Um nützliche Suchergebnisse aus dem sogenannten Echtzeit-Web zu liefern – wie z. B. Sekunden alte Twitter-Tweets, die Staus melden – hat Google seine Page-Ranking-Technologie angepasst und neue algorithmische Tricks und Filter entwickelt, um die Retouren relevant zu halten, so ein führendes Google-Ingenieur.

Amit Singhal, Google Fellow
Google hat letzten Monat eine Echtzeit-Suchtechnologie eingeführt, um Suchenden Zugang zu brandneuen Blog-Posts und Nachrichten zu bieten, die viel schneller als die fünf bis 15 Minuten dauerten, die die Web-Crawler von Google zuvor zum Auffinden neu erstellter Elemente benötigten.
Bing, Cuil und andere Suchmaschinen bieten auch verschiedene Arten von Echtzeitergebnissen. Sowohl Google als auch Bing haben auch große Abkommen mit Twitter geschlossen, um Echtzeitzugriff auf Tweets zu erhalten, diese 140-stelligen Mikroblog-Posts, die von Twitter-Mitgliedern verschickt werden. Aber Google behauptet, die umfassendsten Echtzeitergebnisse zu bieten, indem es Schlagzeilen, Blogs und Feeds von Facebook, MySpace, Twitter und anderen Quellen scannt.
Die Tweets sind eine tragende Säule der Echtzeit-Ergebnisse von Google, aber Google hat zuvor nicht diskutiert, wie es sie einordnet. Eine grundlegende Google-Strategie zur Identifizierung der Tweet-Relevanz ist analog zu der von Googles PageRank-Technologie, die hilft, relevante Webseiten mit der traditionellen Websuche zu finden. Unter PageRank beurteilt Google die Bedeutung von Seiten, die ein bestimmtes Suchbegriff enthalten, teilweise anhand der Linkstruktur der Seiten. Je mehr Seiten auf eine Seite verlinken – und je mehr Seiten auf die Linker verlinken – desto relevanter ist die Originalseite.
Im Fall von Tweets besteht der Schlüssel darin, renommierte Follower zu identifizieren, sagt Amit Singhal, ein Google Fellow, der die Entwicklung der Echtzeitsuche leitete. (Twitterer folgen den Kommentaren anderer Twitterer, die sie ausgewählt haben, und werden selbst verfolgt.)
Sie verdienen Ruf, und dann geben Sie Ruf. Wenn dir viele Leute folgen und du dann jemandem folgst – auch wenn diese [neue Person] nicht viele Follower hat, wird sein Tweet als wertvoll erachtet, weil seine Follower selbst weithin verfolgt werden, sagt Singhal. Es ist definitiv, definitiv mehr als ein Popularitätswettbewerb, fügt er hinzu.
Ein Benutzer, der dem anderen in sozialen Medien folgt, ist analog zu einer Seite, die auf eine andere im Web verlinkt. Beides sei eine Art Empfehlung, sagt Singhal. Wenn qualitativ hochwertige Seiten auf eine andere Seite im Web verlinken, steigt die Qualität der verlinkten Seite. Ebenso steigt in sozialen Medien die Qualität des gefolgten Benutzers, wenn etablierte Benutzer einem anderen Benutzer folgen.
Aber die Social-Ranking-Tricks von Google sind nicht die einzige Methode, mit der der Suchriese aus Tweets Relevanz gewinnt. Google hat auch neue Wege entwickelt, um innerhalb von Sekunden auszuwählen, welche (wenn überhaupt) Tweets für gängige Begriffe wie Obama auftauchen – und um Spam oder Tweets von geringer Qualität zu vermeiden.
Ein Problem bei Tweets ist, dass die Leute sie oft mit sogenannten Hashtags spicken. Dies sind Symbole, die mit einem Rautezeichen (#) beginnen, gefolgt von einem Wort, das ein sehr beliebtes aktuelles Thema repräsentiert, wie zum Beispiel Nexus One oder Earthquake oder was auch immer sonst gerade ein Trendthema sein könnte. Wenn ein Hashtag in einem Tweet enthalten ist, wird der resultierende Tweet angezeigt, wenn andere Twitterer an anderer Stelle auf der Website auf das Themenwort des Hashtags klicken.
Während solche Tags die Sichtbarkeit eines Tweets nützlich maximieren können, können sie auch als Warnzeichen dienen, um die Tweet-Qualität zu verringern und Spam-ähnliche Inhalte anzuziehen, sagt Singhal. Obwohl er nicht ins Detail gehen wollte, sagte er, Google habe dieses Hashtagging-Verhalten auf eine Weise modelliert, die dazu neigt, die Aufdeckung von Tweets von geringer Qualität zu reduzieren. Wir mussten dieses [Hashtagging]-Verhalten modellieren. Das ist die technische Herausforderung, der wir uns mit unseren Modellierungsansätzen gestellt haben, sagt Singhal.
Ein weiteres Problem: Wie kann man, wenn jemand nach Obama sucht, die Tweets der Presse des Weißen Hauses und Tausende anderer durchsuchen, um die aktuellsten und aktuellsten Informationen zu finden. Google scannt Tweets, um das Signal im Rauschen zu finden, sagt er. Ein solches Signal könnte einen neuen Ansturm von Tweets und anderen Blogs beinhalten, in denen die Polizei von Cambridge oder Harry Reid in der Nähe von Erwähnungen von Obama erwähnt werden. Durch die Suche nach solchen Signalen ist Google in der Lage, auch bei sehr gebräuchlichen Suchbegriffen Echtzeit-Treffer mit den aktuellsten Themen zu liefern.
Sowohl Twitter als auch Google wollen in Zukunft die Relevanz von Suchergebnissen in allen Kontexten verbessern, indem sie Geo-Location-Daten hinzufügen, die zu Postings hinzugefügt werden können, die von Smartphones gesendet werden. Im Allgemeinen entwickelt sich die Echtzeitsuche weiter, sagt Dylan Casey, Google-Produktmanager für Echtzeitsuche. Ich spreche regelmäßig mit den Jungs von Twitter, um zu erfahren, wohin das Feature führt. Wir bekommen Feedback von ihnen, wir geben ihnen Feedback und unsere Ingenieure arbeiten zusammen. Es ist wirklich symbiotisch.
Singhal fügte hinzu, dass Twitter kaum die einzige Quelle für Echtzeitinformationen sei. Twitter ist in der Tat ein sehr wichtiger Bestandteil des Echtzeit-Webs. Was wir jedoch beobachten ist, dass es nur eine der Komponenten ist. Nachrichten, Blogs und Webseiten, die in Echtzeit erstellt werden, haben einen hohen Wert, da Nachrichtenorganisationen sehr hart daran arbeiten, die Qualität auf ein bestimmtes Niveau zu bringen, sagt er. Twitter ist in der Tat nützlich, weil es sich um kurze Inhalte handelt. Wir stellen jedoch fest, dass das Echtzeit-Web viel größer ist.