Data Mining enthüllt die überraschenden Faktoren hinter erfolgreichen Filmen

Die Komödie von 2007 Evan allmächtig spielte Steve Carell und Morgan Freeman, zwei große Kassenstars. In gewisser Weise ist es also nicht verwunderlich, dass der Film über 100 Millionen Dollar an Einnahmen einbrachte. Zum Vergleich die Komödie von 2001 Supertruppen spielte einige relative Unbekannte und nahm magere 18,5 Millionen Dollar ein.





Und doch würde ein kluger Investor mit ziemlicher Sicherheit eher den zweiten als den ersten wählen, um in ihn zu investieren. Das liegt daran Supertruppen kosten im Vergleich dazu nur 3 Millionen Dollar Evan Allmächtiges 175 Millionen US-Dollar und erzielte einen Return on Investment von mehr als 5, verglichen mit -0,4 für den größeren Film.

Aber wie entscheidet man im Voraus, in was man investiert? Heute bekommen wir dank der Arbeit von Michael Lash und Kang Zhao von der University of Iowa eine Art Antwort. Diese Jungs haben eine Datenbank mit über 100 Kategorien filmbezogener Informationen erstellt, wie z. B. Budget und Einnahmen, die beteiligten Stars, worum es in dem Film ging und wann er veröffentlicht wurde, und dann einen maschinellen Lernalgorithmus verwendet, um Muster zu entdecken die die Rentabilität vorhersagen. Und die Ergebnisse sind überraschend.

Das Team begann mit der Kombination von Daten aus zwei Online-Quellen: der Internet Movie Database und BoxOfficeMojo. Auf diese Weise sammelten sie Daten zu über 14.000 Filmen und 4.000 Schauspielern, Regisseuren usw., wobei sie sich insbesondere auf Filme konzentrierten, die zwischen 2000 und 2010 veröffentlicht wurden.



Lash und Zhao verwendeten diese Daten dann, um herauszufinden, wie erfahren einzelne Schauspieler waren, wie viel Umsatz und Gewinn jeder ihrer Filme gemacht hatte und ob sie in Filmen mit anderen Schauspielern aufgetreten waren. Sie haben eine ähnliche Berechnung auch für Direktoren durchgeführt.

Sie verwendeten auch die Handlungszusammenfassungen auf IMDb, um den Inhalt der Filme zu vergleichen. Und sie haben für jeden Film eine Kapitalrendite berechnet, um ein Gefühl für seine Rentabilität zu bekommen.

Die Aufgabe für den maschinellen Lernalgorithmus bestand darin, diese Daten zu durchsuchen und nach Mustern zu suchen, die mit der Rentabilität korrelieren.



Es stellt sich heraus, dass der Faktor, der am stärksten mit der Rentabilität eines Films korreliert, die durchschnittlichen Bruttoeinnahmen sind, die mit den vorherigen Filmen des Regisseurs erzielt wurden. Mit anderen Worten, Direktoren, die in der Vergangenheit mehr Umsatz generiert haben, werden in Zukunft mit einer höheren Rentabilität korreliert.

In vielerlei Hinsicht ist das nicht überraschend. Gute Regisseure wie Christopher Nolan sind dem Kinopublikum oft bekannt und können eine beachtliche Attraktion darstellen.

Die Ergebnisse sorgen jedoch für eine deutliche Überraschung. Sie zeigen, dass beliebte Stars mit höheren Einnahmen korrelieren, aber nicht mit der Rentabilität. Mit anderen Worten, große Stars ziehen Menschenmassen an, garantieren aber keinen Gewinn, vermutlich, weil ihre Einstellung in erster Linie viel kostet.



Andere Faktoren, die sich als wichtig erweisen, sind, ob der Film ein R-Rating hat oder als ausländisch bezeichnet wird, was vermutlich mit geringeren Gewinnen korreliert (obwohl Lash und Zhao dies nicht klar machen).

Unsere Experimente auf der Grundlage von Filmen aus 11 Jahren zeigen, dass [unser Algorithmus] gute Arbeit leisten kann, wenn es darum geht, den Erfolg von Filmen vorherzusagen, sagen sie.

Das ist eine merkwürdige Studie, der es an Überzeugungskraft mangelt. Es gibt verschiedene Möglichkeiten, den Kassenerfolg im Voraus vorherzusagen, obwohl sich nur wenige an Investoren richten, die natürlich frühzeitig in den Prozess einbezogen werden müssen.



Wenn man dieser Methode glauben darf, zeigt sie den wahren Wert eines Regisseurs mit der richtigen Erfolgsbilanz und zeigt auch, dass Starpower nicht der Garant für den Erfolg ist, den sich viele vorstellen. Das ist etwas, woran die Investoren denken Evan allmächtig zu Beginn des Produktionsprozesses dieses Films nützlich gewesen sein könnte.

Der wirkliche Test besteht natürlich nicht darin, die Vergangenheit vorherzusagen, sondern die Zukunft vorherzusagen. Wenn dieser Algorithmus in der Lage ist, potenziell profitable Filme auszuwählen, bevor sie überhaupt gedreht sind, dann werden Lash und Zhao wohlhabende Personen werden. Wir sind gespannt, wie sie sich schlagen.

Ref: arxiv.org/abs/1506.05382 : Frühe Vorhersagen des Filmerfolgs: das Wer, Was und Wann der Rentabilität

verbergen