211service.com
Was Facebook weiß
Die Sozialwissenschaftler des Unternehmens suchen nach Erkenntnissen über menschliches Verhalten. Was sie finden, könnte Facebook neue Möglichkeiten bieten, unsere Daten zu nutzen – und unsere Sicht auf die Gesellschaft neu zu gestalten. 13. Juni 2012
nicht definiert
Wenn Facebook ein Land wäre, eine Einbildung, die Gründer Mark Zuckerberg hat in der Öffentlichkeit unterhalten , würde sie mit 900 Millionen Mitgliedern die drittgrößte der Welt sein.
Diese Geschichte war Teil unserer Juli-Ausgabe 2012
- Siehe den Rest der Ausgabe
- Abonnieren
Es würde jedes Regime der Vergangenheit oder Gegenwart bei weitem übertreffen, indem es das Leben seiner Bürger genau erfasst. Private Gespräche, Familienfotos und Aufzeichnungen von Roadtrips, Geburten, Eheschließungen und Todesfällen fließen alle auf die Server des Unternehmens und loggen sich dort ein. Facebook hat den umfangreichsten Datensatz zum menschlichen Sozialverhalten gesammelt, der jemals zusammengetragen wurde. Einige Ihrer persönlichen Daten sind wahrscheinlich ein Teil davon.
Datenschutzbestimmungen
Nur wenige Datenschutzbestimmungen verhindern Facebook
Gesetze haben nicht mit der Fähigkeit des Unternehmens Schritt gehalten, die Daten seiner Benutzer zu ermitteln.
Und doch, auch wenn Facebook sich in das moderne Leben eingebettet hat, hat es nicht viel mit dem gemacht, was es über uns weiß. Jetzt, da das Unternehmen an die Börse gegangen ist, steigt der Druck, neue Gewinnquellen zu erschließen ( siehe Der Facebook-Trugschluss ) wird es wahrscheinlich zwingen, mehr mit seinem Informationsschatz zu tun. Dieser Vorrat an Daten ragt wie ein überdimensionaler Schatten über ein heute bescheidenes Online-Werbegeschäft auf, das datenschutzbewusste Webnutzer (siehe Wenige Datenschutzbestimmungen verhindern Facebook ) und Konkurrenten wie Google beunruhigt. Jeder hat das Gefühl, dass diese beispiellose Ressource etwas Großes hervorbringen wird, aber niemand weiß genau was.
An der Spitze der Bemühungen von Facebook, herauszufinden, was aus all unseren Daten gelernt werden kann, ist Cameron Marlow , ein großer 35-Jähriger, der bis vor kurzem nur wenige Meter von Zuckerberg entfernt saß. Die Gruppe, die Marlow leitet, ist der öffentlichen Aufmerksamkeit entgangen, die die Gründer von Facebook und die schlagzeilenträchtigeren Merkmale ihres Geschäfts verfolgt. Intern bekannt als Data Science Team, ist es eine Art Bell Labs für das Social-Networking-Zeitalter. Die Gruppe besteht aus 12 Forschern – aber es wird erwartet, dass sie sich in diesem Jahr verdoppeln wird. Sie wenden Mathematik, Programmierkenntnisse und Sozialwissenschaften an, um aus unseren Daten Erkenntnisse zu gewinnen, von denen sie hoffen, dass sie die Geschäfts- und Sozialwissenschaften von Facebook insgesamt voranbringen. Während sich andere Analysten des Unternehmens auf Informationen zu bestimmten Online-Aktivitäten konzentrieren, kann Marlows Team praktisch im gesamten Ozean an personenbezogenen Daten schwimmen, die Facebook verwaltet. Von allen Leuten bei Facebook, vielleicht sogar von den Führungskräften des Unternehmens, haben diese Forscher die besten Chancen herauszufinden, was wirklich gelernt werden kann, wenn so viele persönliche Informationen an einem Ort gesammelt werden.
Auch wenn Facebook sich in das moderne Leben eingebettet hat, hat es nicht viel mit dem gemacht, was es über uns weiß. Sein Datenvorrat ragt wie ein überdimensionaler Schatten auf. Jeder hat das Gefühl, dass diese Ressource etwas Großes hervorbringen wird, aber niemand weiß genau was.
Facebook hat all diese Informationen, weil es ausgeklügelte Wege gefunden hat, um Daten zu sammeln, während Menschen Kontakte knüpfen. Benutzer füllen Profile mit ihrem Alter, Geschlecht und ihrer E-Mail-Adresse aus; einige Leute geben auch zusätzliche Details wie ihren Beziehungsstatus und ihre Handynummer an. Bei einer Neugestaltung im letzten Herbst wurden Profilseiten in Form von Zeitleisten eingeführt, die dazu einladen, historische Informationen wie Orte, an denen sie gelebt und gearbeitet haben, hinzuzufügen. Nachrichten und Fotos, die auf der Site geteilt werden, sind oft mit einem genauen Standort versehen, und in den letzten zwei Jahren hat Facebook begonnen, Aktivitäten an anderen Stellen im Internet zu verfolgen, indem es eine süchtig machende Erfindung namens Like-Button verwendet. Es erscheint auf Apps und Websites außerhalb von Facebook und ermöglicht es Nutzern, mit einem Klick anzuzeigen, dass sie sich für eine Marke, ein Produkt oder einen digitalen Inhalt interessieren. Seit letztem Herbst kann Facebook auch über seine Grenzen hinaus automatisch Daten über das Online-Leben der Nutzer sammeln: In bestimmten Apps oder Websites werden die Informationen, wenn Nutzer ein Lied hören oder einen Nachrichtenartikel lesen, an Facebook weitergegeben, auch wenn niemand klickt auf Like. Innerhalb der ersten fünf Monate des Features katalogisierte Facebook mehr als fünf Milliarden Instanzen der Menschen, die Songs online hören. Kombinieren Sie diese Art von Informationen mit einer Karte der sozialen Verbindungen, die Facebook-Nutzer auf der Website herstellen, und Sie haben eine unglaublich reichhaltige Aufzeichnung ihres Lebens und ihrer Interaktionen.
Dies ist das erste Mal, dass die Welt Daten über die menschliche Kommunikation in diesem Umfang und dieser Qualität sieht, sagt Marlow mit einem charakteristisch ernsten Blick, bevor er bei dem Gedanken, was er mit den Daten alles anstellen kann, in ein Lächeln bricht. Zum einen ist Marlow zuversichtlich, dass die Erforschung dieser Ressource das wissenschaftliche Verständnis dafür revolutionieren wird, warum Menschen sich so verhalten, wie sie es tun. Sein Team kann Facebook auch helfen, unser soziales Verhalten zu seinem eigenen Vorteil und dem seiner Werbetreibenden zu beeinflussen. Diese Arbeit kann Facebook sogar helfen, ganz neue Wege zu finden, um Geld zu verdienen.
Ansteckende Informationen
Marlow meidet den College-Programmierer-Stil von Zuckerberg und vielen anderen bei Facebook und trägt eher ein Hemd mit seiner Jeans als einen Hoodie oder ein T-Shirt. Als er mich kurz vor dem Börsengang des Unternehmens im Mai trifft, in einem Konferenzraum, auf dessen Glaswand eine zwei Meter lange Karikatur des Hundes seines Chefs gesprüht ist, wirkt er eher wie ein junger Professor denn wie ein Student. Er wäre vielleicht einer geworden, wenn er nicht zu Beginn seiner Karriere erkannt hätte, dass Web-Unternehmen die saftigsten Daten über menschliche Interaktionen liefern würden.
Im Jahr 2001 promovierte Marlow am Media Lab des MIT und erstellte eine Website namens Blogdex, die automatisch die ansteckendsten Informationen auflistete, die in Weblogs verbreitet wurden. Obwohl es sich nur um ein Forschungsprojekt handelte, wurde es bald so populär, dass die Server von Marlow abstürzten. Gestartet, als Blogs im öffentlichen Bewusstsein explodierten und so zahlreich wurden, dass Web-Benutzer sich mit Informationen überfordert fühlten, war es ein Vorläufer späterer Aggregator-Sites wie Digg und Reddit. Aber Marlow hat es nicht nur entwickelt, um Webbenutzern zu helfen, zu verfolgen, was online beliebt war. Blogdex war als wissenschaftliches Instrument gedacht, um die sich im Web bildenden sozialen Netzwerke aufzudecken und zu untersuchen, wie sie Ideen verbreiten. Marlow ging in Yahoos Forschungslabors, um zwei Jahre lang Online-Geselligkeit zu studieren. 2007 trat er Facebook bei, das für ihn das weltweit mächtigste Instrument zur Erforschung der menschlichen Gesellschaft ist. Zum ersten Mal, sagt Marlow, haben wir ein Mikroskop, mit dem wir nicht nur soziales Verhalten auf einer sehr feinen Ebene untersuchen können, die wir noch nie zuvor gesehen haben, sondern auch Experimente durchführen können, denen Millionen von Benutzern ausgesetzt sind.
Marlows Team arbeitet mit Managern auf Facebook zusammen, um Muster zu finden, die sie nutzen könnten. Sie untersuchen beispielsweise, wie sich ein neues Feature unter den Nutzern des sozialen Netzwerks verbreitet. Sie haben Facebook dabei geholfen, Benutzer zu identifizieren, die Sie vielleicht kennen, aber nicht befreundet sind, und diejenigen zu erkennen, die Sie möglicherweise nur als Bekannte bezeichnen möchten, um ihre Updates weniger auffällig zu machen. Dennoch passt die Gruppe seltsam in ein Unternehmen, in dem Softwareingenieure Rockstars sind, die nach dem Mantra 'Bewegen Sie sich schnell und Dinge kaputt machen' leben. Das Mittagessen mit dem Datenteam hat das Gefühl, als würde man sich an einer Spitzenschule treffen. das typische Mitglied der Gruppe kam frisch von einer Doktoranden- oder Junior-Akademiestelle und spricht lieber über die Weiterentwicklung der Sozialwissenschaften als über Facebook als Produkt oder Unternehmen. Einige Mitglieder des Teams haben eine Ausbildung in Soziologie oder Sozialpsychologie, während andere in der Informatik begannen und damit begannen, menschliches Verhalten zu untersuchen. Es steht ihnen frei, einen Teil ihrer Zeit und die Daten von Facebook zu verwenden, um die grundlegenden Muster und Motivationen menschlichen Verhaltens zu untersuchen und die Ergebnisse in akademischen Zeitschriften zu veröffentlichen – so wie die Forscher von Bell Labs sowohl die Technologien von AT&T als auch das Studium der grundlegenden Physik vorangetrieben haben.
Es mag seltsam erscheinen, dass ein acht Jahre altes Unternehmen ohne bewährtes Geschäftsmodell sich die Mühe macht, ein Team mit einer solchen akademischen Ausrichtung zu unterstützen, aber Marlow sagt, es sei sinnvoll. Die größten Herausforderungen, die Facebook zu lösen hat, sind die gleichen Herausforderungen wie die Sozialwissenschaften, sagt er. Zu diesen Herausforderungen gehört es, zu verstehen, warum sich einige Ideen oder Moden von einigen wenigen Menschen verbreiten, um universell zu werden und andere nicht, oder inwieweit die zukünftigen Handlungen einer Person ein Produkt der vergangenen Kommunikation mit Freunden sind. Die Veröffentlichung von Ergebnissen und die Zusammenarbeit mit Universitätsforschern werden zu Erkenntnissen führen, die Facebook helfen, seine Produkte zu verbessern, fügt er hinzu.

Eytan Bakshy experimentierte mit der Art und Weise, wie Facebook-Nutzer Links teilten, damit seine Gruppe untersuchen konnte, ob die Site wie eine Echokammer funktioniert.
Ein Beispiel dafür, wie Facebook als Stellvertreter für die Untersuchung der Gesellschaft im Allgemeinen dienen kann, ist eine kürzlich durchgeführte Studie zu der Annahme, dass jede Person auf der Welt nur sechs Grad von jeder anderen getrennt ist. Die bekannteste reale Studie aus dem Jahr 1967 umfasste einige Hundert Personen, die versuchten, Postkarten an einen bestimmten Bostoner Aktionär zu schicken. Die Version von Facebook, die in Zusammenarbeit mit Forschern der Universität Mailand durchgeführt wurde, umfasste im Mai 2011 das gesamte soziale Netzwerk, das mehr als 10 Prozent der Weltbevölkerung ausmachte. Die Analyse der 69 Milliarden Freundschaftsbeziehungen zwischen diesen 721 Millionen Menschen zeigte, dass die Welt kleiner ist, als wir dachten: Vier vermittelnde Freunde reichen normalerweise aus, um jemanden einem zufälligen Fremden vorzustellen. Wenn man eine andere Person auf der Welt in Betracht zieht, kennt ein Freund Ihres Freundes im Durchschnitt einen Freund seines Freundes, schloss das Fachpapier markant. Dieses Ergebnis trifft möglicherweise nicht auf jeden auf der Welt zu, aber es gibt gute Gründe zu der Annahme, dass es und andere Erkenntnisse des Data Science-Teams auch außerhalb von Facebook wahr sind. Letztes Jahr stellte das Internet & American Life Project des Pew Research Center fest, dass sich 93 Prozent der Facebook-Freunde persönlich kennengelernt hatten. Einer von Marlows Forschern hat eine Methode entwickelt, um das Bruttonationalglück eines Landes anhand seiner Facebook-Aktivitäten zu berechnen, indem er das Auftreten von Wörtern und Sätzen protokolliert, die positive oder negative Emotionen signalisieren. Das Bruttonationalglück schwankt in einer Weise, die darauf hindeutet, dass die Messung korrekt ist: Es springt während der Feiertage und sinkt, wenn bekannte Persönlichkeiten des öffentlichen Lebens sterben. Nach einem schweren Erdbeben in Chile im Februar 2010 brach der Wert des Landes ein und es dauerte viele Monate, bis er sich wieder normalisierte. Dieses Ereignis schien das Land insgesamt sympathischer zu machen, als Japan im März 2011 sein eigenes großes Erdbeben und den darauffolgenden Tsunami erlitt; Während Chiles Bruttonationalglück sank, schwankte die Zahl in keinem anderen erfassten Land (Japan war nicht darunter). Adam Kramer, der den Index erstellt hat, sagt, er wollte damit zeigen, dass die Daten von Facebook kostengünstige und genaue Möglichkeiten zur Verfolgung sozialer Trends bieten könnten – Methoden, die für Ökonomen und andere Forscher nützlich sein könnten.
Andere von der Gruppe veröffentlichte Arbeiten haben einen offensichtlicheren Nutzen für die grundlegende Strategie von Facebook, die darin besteht, uns zu ermutigen, die Site zu einem zentralen Bestandteil unseres Lebens zu machen und dann das Erlernte zum Verkaufen von Anzeigen zu verwenden. Eine frühe Studie untersucht, welche Arten von Updates von Freunden Neuankömmlinge im Netzwerk ermutigen, eigene Beiträge hinzuzufügen. Dieses Jahr kurz vor dem Valentinstag a Blogbeitrag vom Data Science Team listete die beliebtesten Songs bei Personen auf, die kürzlich auf Facebook signalisiert hatten, dass sie eine Beziehung eingegangen oder verlassen haben. Es war ein Hinweis auf die Art der Korrelation, die Facebook helfen könnte, nützliche Vorhersagen über das Nutzerverhalten zu treffen – ein Wissen, das ihm helfen könnte, bessere Vermutungen darüber anzustellen, für welche Anzeigen Sie zu einem bestimmten Zeitpunkt mehr oder weniger offen sind. Vielleicht interessieren sich Menschen, die gerade eine Beziehung verlassen haben, für ein Balladenalbum, oder vielleicht sollte kein Unternehmen seine Marke mit der Flut von Emotionen assoziieren, die der Tod eines Freundes mit sich bringt. Die wertvollsten Online-Anzeigen werden heute neben bestimmten Websuchen geschaltet, weil die Suchenden genau das ausdrücken, was sie wollen. Dies ist einer der Gründe, warum die Einnahmen von Google das Zehnfache von Facebook betragen. Aber Facebook kann irgendwann erraten, was die Leute wollen oder nicht wollen, noch bevor sie es merken.
Kürzlich hat das Data Science Team begonnen, seine einzigartige Position zu nutzen, um mit der Funktionsweise von Facebook zu experimentieren und die Website zu optimieren – die Art und Weise, wie Wissenschaftler ein Ameisennest anstupsen –, um zu sehen, wie die Benutzer reagieren. Eytan Bakshy, der letztes Jahr zu Facebook kam, nachdem er mit Marlow als Doktorand an der University of Michigan zusammengearbeitet hatte, wollte herausfinden, ob unsere Aktionen auf Facebook hauptsächlich von denen unserer engen Freunde beeinflusst werden, die wahrscheinlich einen ähnlichen Geschmack haben. Das würde die Theorie beleuchten, dass unsere Facebook-Freunde eine Echokammer erschaffen, die Nachrichten und Meinungen verstärkt, von denen wir bereits gehört haben. Also legte er sich daran, wie Facebook für eine Viertelmilliarde Nutzer funktionierte. Über einen Zeitraum von sieben Wochen wurden die 76 Millionen Links, die diese Benutzer miteinander teilten, protokolliert. Dann verhinderte Facebook bei 219 Millionen zufällig ausgewählten Gelegenheiten, dass jemand einen von einem Freund geteilten Link sehen konnte. Durch das Ausblenden von Links wurde eine Kontrollgruppe erstellt, mit der Bakshy beurteilen konnte, wie oft Menschen am Ende dieselben Links bewerben, weil sie ähnliche Informationsquellen und Interessen haben.
Er fand heraus, dass unsere engen Freunde stark beeinflussen, welche Informationen wir teilen, aber insgesamt wird ihr Einfluss durch den kollektiven Einfluss zahlreicher weiter entfernter Kontakte in den Schatten gestellt – was Soziologen schwache Bindungen nennen. Es ist unsere vielfältige Sammlung schwacher Bindungen, die am stärksten bestimmt, welchen Informationen wir ausgesetzt sind.
Diese Studie liefert starke Beweise gegen die Vorstellung, dass soziale Netzwerke schädliche Filterblasen erzeugen, um sie zu verwenden Aktivist Eli Pariser ist der Begriff für die Auswirkungen der Abstimmung der Informationen, die wir erhalten, um unsere Erwartungen zu erfüllen. Die Studie zeigt aber auch, welche Macht Facebook hat. Wenn [Facebooks] News Feed das ist, was jeder sieht, und er kontrolliert, wie Informationen verbreitet werden, kontrolliert er, wie Informationen an die Gesellschaft weitergegeben werden, und darauf müssen wir sehr genau achten, sagt Marlow. Er weist darauf hin, dass sein Team Facebook hilft zu verstehen, was es mit der Gesellschaft macht, und veröffentlicht seine Feststellungen zur Erfüllung einer öffentlichen Transparenzpflicht. Eine weitere aktuelle Studie , das untersuchte, welche Arten von Facebook-Aktivitäten Menschen dazu bringen, sich von ihren Freunden stärker unterstützt zu fühlen, fällt in dieselbe Kategorie.
Facebook nutzt seine Plattform nicht, um das Verhalten der Benutzer zu optimieren, wie es es getan hat, indem es sie dazu gebracht hat, sich als Organspender zu registrieren. Im Gegensatz zu akademischen Sozialwissenschaftlern haben die Mitarbeiter von Facebook einen kurzen Weg von einer Idee zu einem Experiment an Hunderten von Millionen Menschen.
Aber Marlow spricht als Angestellter eines Unternehmens, das hauptsächlich durch die Betreuung von Werbetreibenden floriert, die den Informationsfluss zwischen seinen Benutzern kontrollieren möchten. Tatsächlich arbeitet Bakshy mit Managern außerhalb des Data Science Teams zusammen, um werbebezogene Erkenntnisse aus den Ergebnissen von Experimenten zum sozialen Einfluss zu extrahieren. Werbetreibende und Marken sind ebenfalls Teil dieses Netzwerks. Daher ist es ein sehr wichtiger Bestandteil des Geschäftsmodells, ihnen einen Einblick zu geben, wie Menschen die von ihnen produzierten Inhalte teilen, sagt Marlow.
Facebook sagte potenziellen Investoren vor dem Börsengang, dass sich die Menschen mit einer um 50 Prozent höheren Wahrscheinlichkeit an Anzeigen auf der Website erinnern, wenn sie von einem Freund sichtbar unterstützt werden. Herauszufinden, wie Einfluss funktioniert, könnte Anzeigen noch einprägsamer machen oder Facebook helfen, Wege zu finden, mehr Menschen dazu zu bringen, seine Anzeigen zu teilen oder darauf zu klicken.
Soziale Entwicklung
Marlow sagt, sein Team wolle die Regeln des sozialen Online-Lebens erraten, um zu verstehen, was in Facebook vor sich geht, und nicht, um Möglichkeiten zu entwickeln, es zu manipulieren. Unser Ziel sei es nicht, das Kommunikationsmuster in der Gesellschaft zu ändern, sagt er. Unser Ziel ist es, sie zu verstehen, damit wir unsere Plattform anpassen können, um den Leuten die Erfahrung zu bieten, die sie wollen. Aber einige der Arbeiten seines Teams und die Einstellungen der Facebook-Führungskräfte zeigen, dass das Unternehmen nicht davor zurückschreckt, seine Plattform zu nutzen, um das Verhalten der Benutzer zu optimieren. Im Gegensatz zu akademischen Sozialwissenschaftlern haben die Mitarbeiter von Facebook einen kurzen Weg von einer Idee zu einem Experiment an Hunderten von Millionen Menschen.
Im April, teilweise beeinflusst durch Gespräche beim Abendessen mit seiner Medizinstudenten-Freundin (jetzt seine Frau), beschloss Zuckerberg, dass er sozialen Einfluss innerhalb von Facebook nutzen sollte, um die Registrierung von Organspendern zu erhöhen. Benutzer erhielten die Möglichkeit, auf ihren Timeline-Seiten auf ein Kästchen zu klicken, um zu signalisieren, dass sie registrierte Spender waren, was eine Benachrichtigung an ihre Freunde auslöste. Die neue Funktion löste eine Kaskade sozialen Drucks aus, und die Zahl der Organspender stieg in 44 Bundesstaaten um den Faktor 23 an.
Marlows Team ist dabei, die Ergebnisse der letzten Zwischenwahlen in den USA zu veröffentlichen, die ein weiteres eindrucksvolles Beispiel für das Potenzial von Facebook zeigen, den Einfluss seiner Nutzer aufeinander zu lenken. Seit 2008 bietet das Unternehmen Nutzern die Möglichkeit, ihre Stimme zu signalisieren; Facebook macht dies bei seinen Freunden mit einem Hinweis darauf aufmerksam, dass sie auf jeden Fall auch abstimmen sollten. Marlow sagt, dass seine Gruppe bei den Wahlen 2010 die Wählerregistrierungsprotokolle mit den Daten abgeglichen hat, um zu sehen, welche der Facebook-Benutzer, die einen Schubs erhielten, tatsächlich zur Wahl gegangen sind. (Er betont, dass die Forscher mit kryptographisch anonymisierten Daten arbeiteten und bestimmte Benutzer nicht mit ihren Abstimmungsprotokollen abgleichen konnten.)

Sameet Agarwal findet Wege für Facebook, seinen enormen Datenschatz zu verwalten, was dem Unternehmen ein einzigartiges und wertvolles Know-how verleiht.
Dies ist nur der Anfang. Indem das Unternehmen mehr darüber erfährt, wie kleine Änderungen auf Facebook das Verhalten der Benutzer außerhalb der Website verändern können, könnte das Unternehmen schließlich anderen ermöglichen, Facebook auf dieselbe Weise zu nutzen, sagt Marlow. Wenn die American Heart Association beispielsweise eine gesunde Ernährung fördern wollte, könnte sie sich vielleicht auf ein Playbook von Facebook Social Engineering beziehen. Wir wollen eine Plattform sein, auf der andere Veränderungen anstoßen können, sagt er.
Auch Werbetreibende würden gerne genauer wissen, was eine Kampagne auf Facebook dazu bringen könnte, das Handeln der Menschen nach außen zu beeinflussen, obwohl ihnen die Grenzen der Lenkbarkeit des Menschen bewusst sind. Mir ist nicht klar, dass die Sozialwissenschaft jemals eine Ingenieurwissenschaft sein wird, die Brücken bauen kann, sagt Duncan Watts, der im kürzlich eröffneten New Yorker Forschungslabor von Microsoft im Bereich Computational Social Science arbeitet und zuvor zusammen mit Marlow in den Labors von Yahoo gearbeitet hat. Wenn Sie jedoch über genügend Daten verfügen, können Sie Vorhersagen treffen, die besser sind als nur zufällige Vermutungen, und das ist wirklich lukrativ.
Daten verdoppeln
Wie andere Social-Web-Unternehmen wie Twitter hat Facebook nie den Ruf für technische Innovation erlangt, den Internet-Pioniere wie Google genießen. Wenn Silicon Valley eine High School wäre, wäre die Suchfirma das stille Mathegenie, das sich sozial nicht hervorgetan hat, aber etwas Unverzichtbares erfunden hat. Facebook wäre das nervige Kind, das einen Club mit einer solchen sozialen Dynamik gründete, dass die Leute beitreten mussten, ob sie wollten oder nicht. In Wirklichkeit beschäftigt Facebook Horden talentierter Software-Ingenieure (viele von Google und anderen Mathegenie-Unternehmen abgeworben), um seinen unwiderstehlichen Club aufzubauen und zu pflegen. Besonders innovativ ist die Technologie, die zur Unterstützung der Bemühungen des Data Science Teams entwickelt wurde. Die Größe, in der Facebook tätig ist, hat dazu geführt, dass es Hardware und Software entwickelt, um die andere Unternehmen beneiden, die versuchen, sich an die Welt der Big Data anzupassen.
In einer Art Übergabe des technologischen Staffelstabs baute Facebook sein Datenspeichersystem durch die Erweiterung der Leistungsfähigkeit der Open-Source-Software Hadoop auf, die von der Arbeit bei Google inspiriert und bei Yahoo entwickelt wurde. Hadoop kann scheinbar unmögliche Rechenaufgaben bändigen – wie die Arbeit an allen Daten, die Facebook-Nutzer ihm anvertraut haben –, indem es sie auf viele Maschinen innerhalb eines Rechenzentrums verteilt. Aber Hadoop wurde nicht mit Blick auf die Datenwissenschaft entwickelt, und seine Verwendung für diesen Zweck erfordert eine spezielle, unhandliche Programmierung. Die Ingenieure von Facebook haben dieses Problem mit der Erfindung von Hive gelöst, einer Open-Source-Software, die jetzt von Facebook unabhängig ist und von vielen anderen Unternehmen verwendet wird. Hive fungiert als Übersetzungsdienst, der es ermöglicht, riesige Hadoop-Datenspeicher mit relativ einfachem Code abzufragen. Um den Rechenaufwand zu reduzieren, kann es zufällige Stichproben eines gesamten Datensatzes anfordern, eine Funktion, die für Unternehmen, die von Daten überschwemmt werden, von unschätzbarem Wert ist. Viele der Daten von Facebook befinden sich in einem Hadoop-Speicher mit einer Größe von mehr als 100 Petabyte (eine Million Gigabyte), sagt Sameet Agarwal, ein Director of Engineering bei Facebook, der an der Dateninfrastruktur arbeitet, und die Menge wächst exponentiell. In den letzten Jahren haben wir uns jedes Jahr mehr als verdoppelt, sagt er. Das heißt, sein Team muss ständig effizientere Systeme bauen.
Eine mögliche Verwendung des Datenspeichers von Facebook wäre der Verkauf von daraus gewonnenen Erkenntnissen. Solche Informationen können die Grundlage für jede Art von Geschäft sein. Angenommen, Facebook kann dies tun, ohne Benutzer und Aufsichtsbehörden zu verärgern, könnte dies lukrativ sein.
All dies hat Facebook eine einzigartige Expertise verliehen, sagt Jeff Hammerbacher, Marlows Vorgänger bei Facebook, der die Bemühungen des Unternehmens zur Entwicklung einer eigenen Datenspeicher- und Analysetechnologie initiiert hat. (Er verließ Facebook 2008, um Cloudera zu gründen, die Hadoop-basierte Systeme entwickelt, um große Datensammlungen zu verwalten.) Die meisten großen Unternehmen haben etablierten Softwareunternehmen wie Oracle viel Geld für Datenanalyse und -speicherung bezahlt. Aber jetzt versuchen große Unternehmen zu verstehen, wie Facebook mit seinem enormen Informationsschatz zu Open-Source-Systemen umgeht, sagt Hammerbacher. Ich habe kürzlich einen Tag bei Fidelity verbracht, um ihnen zu erklären, wie die Rolle des „Datenwissenschaftlers“ bei Facebook konzipiert wurde … und ich habe die gleiche Diskussion bei unzähligen anderen Firmen geführt, sagt er.
Da Führungskräfte in allen Branchen versuchen, die Chancen von Big Data zu nutzen, deutet das starke Interesse an Facebooks Datentechnologie darauf hin, dass das Anzeigengeschäft möglicherweise nur ein Ableger von etwas viel Wertvollem ist. Die Tools und Techniken, die das Unternehmen entwickelt hat, um große Informationsmengen zu verarbeiten, könnten zu einem eigenständigen Produkt werden.
Gold abbauen
Facebook braucht neue Einnahmequellen, um die Erwartungen der Anleger zu erfüllen. Selbst nach seinem enttäuschenden Börsengang hat es ein erstaunlich hohes Preis-Gewinn-Verhältnis, das nicht durch die Flut an billigen Anzeigen gerechtfertigt werden kann, die die Website jetzt anzeigt. Der neue Campus von Facebook in Menlo Park, Kalifornien, der zuvor von Sun Microsystems bewohnt wurde, macht diesen Druck greifbar. Die 3.500 Mitarbeiter des Unternehmens rattern auf Platz für 6.600. Ich ging an leeren Schreibtischen in einem Gebäude vorbei; ein anderer, nebenan, war völlig unbewohnt. In der Nähe wartete ein brachliegendes Grundstück, vermutlich bis jemand eine Nutzung unserer Daten erfindet, die den Aufwand für die Entwicklung der Fläche rechtfertigt.
Eine potenzielle Verwendung wäre einfach der Verkauf von Erkenntnissen, die aus den Informationen gewonnen wurden. DJ Patil , Data Scientist in Residence bei der Venture-Capital-Firma Greylock Partners und zuvor Leiter des Data-Science-Teams von LinkedIn, glaubt, dass Facebook sich von Gil Elbaz inspirieren lassen könnte, dem Erfinder des AdSense-Werbegeschäfts von Google, das über ein Viertel des Google-Umsatzes erwirtschaftet. Er hat die Werbung hinter sich gebracht und leitet jetzt ein schnell wachsendes Startup, Sachlich , die Unternehmen auffordert, auf große, sorgfältig kuratierte Datensammlungen zuzugreifen, die von Restaurantstandorten bis hin zu Body-Mass-Indizes von Prominenten reichen, die das Unternehmen aus kostenlosen öffentlichen Quellen und durch den Kauf privater Datensätze sammelt. Factual bereinigt Daten und stellt das Ergebnis als On-Demand-Wissensspeicher über das Internet zur Verfügung, der von Software, nicht von Menschen, erschlossen werden kann. Kunden verwenden es, um die Lücken in ihren eigenen Daten zu schließen und intelligentere Apps oder Dienste zu erstellen; Facebook selbst verwendet beispielsweise Factual für Informationen über Geschäftsstandorte. Patil weist darauf hin, dass Facebook selbst zu einer Datenquelle werden könnte, die den Zugang zu Informationen verkauft, die aus den Handlungen seiner Nutzer zusammengestellt wurden. Solche Informationen könnten die Grundlage für fast jede Art von Geschäft sein, etwa für Online-Dating oder Popmusik-Charts. Angenommen, Facebook kann diesen Schritt unternehmen, ohne Benutzer und Aufsichtsbehörden zu verärgern, könnte dies lukrativ sein. Ein Online-Shop, der seine Werbeaktionen gezielter gestalten möchte, könnte beispielsweise Facebook als Informationsquelle nutzen, um zu erfahren, welche Marken an welchen Orten am beliebtesten sind oder wie sich die Popularität bestimmter Produkte im Laufe des Jahres ändert.
Hammerbacher stimmt zu, dass Facebook seine Data Science verkaufen könnte und verweist auf seinen derzeit kostenlosen Insights-Service für Werbetreibende und Website-Besitzer, der zeigt, wie ihre Inhalte auf Facebook geteilt werden. Dies könnte für Unternehmen viel nützlicher werden, wenn Facebook Daten hinzufügt, die erhalten wurden, wenn der Like-Button Aktivitäten im gesamten Web verfolgt, oder demografische Daten oder Informationen darüber, was die Leute auf der Website lesen. Es gibt einen Präzedenzfall, solche Analysen gegen Gebühr anzubieten: Ende 2011 begann Google, 150.000 US-Dollar jährlich für eine Premium-Version eines Dienstes zu verlangen, der den Webverkehr eines Unternehmens analysiert.
Zurück bei Facebook ist Marlow nicht derjenige, der Entscheidungen darüber trifft, was das Unternehmen verlangt, auch wenn seine Arbeit sie prägen wird. Was auch immer passiert, sagt er, das Hauptziel seines Teams sei es, das Wohl der Menschen zu unterstützen, die Facebook ihre Daten zur Verfügung stellen, um den Service intelligenter zu machen. Auf dem Weg, sagt er, werden er und seine Kollegen das Selbstverständnis der Menschheit voranbringen. Dies spiegelt Zuckerbergs oft angezweifelte, aber scheinbar echte Überzeugung wider, dass Facebooks Aufgabe darin besteht, die Kommunikation in der Welt zu verbessern. Fragt nur noch nicht genau, was das bringt. Es ist schwer vorherzusagen, wohin wir gehen werden, denn wir befinden uns noch in einem sehr frühen Stadium dieser Wissenschaft, sagt Marlow. Die Anzahl der möglichen Dinge, die wir von den Daten von Facebook verlangen können, ist enorm.
Tom Simonite ist Technologieüberprüfung s leitender IT-Redakteur.
