211service.com
Algorithmus für maschinelles Lernen schürft Rap-Texte und schreibt dann seine eigenen
Die uralte Fähigkeit, gesprochene Reime zu kreieren und aufzuführen, gedeiht heute aufgrund der unaufhaltsamen Zunahme der Popularität des Rappens. Diese Kunstform unterscheidet sich von gewöhnlicher gesprochener Poesie, da sie im Takt aufgeführt wird, oft mit Hintergrundmusik.
Und die Darsteller haben sich ausgezeichnet. Adam Bradley, Professor für Englisch an der University of Colorado, hat es in leuchtenden Worten beschrieben. Rappen, sagt er, erzeuge komplizierte Klang- und Reimstrukturen und erschaffe einige der skrupellosesten formalen Gedichte, die heute komponiert werden.
Die stark strukturierte Natur von Rap macht es besonders zugänglich für Computeranalysen. Und das wirft eine interessante Frage auf: Wenn Computer Rap-Texte analysieren können, können sie sie dann auch generieren?
Heute erhalten wir dank der Arbeit von Eric Malmi von der Universität Aalto in Finnland und einigen Freunden eine bejahende Antwort. Diese Jungs haben einen maschinellen Lernalgorithmus trainiert, um die hervorstechenden Merkmale einiger Rap-Zeilen zu erkennen und dann eine andere Zeile auszuwählen, die sich auf dieselbe Weise zum gleichen Thema reimt. Das Ergebnis ist ein Algorithmus, der Rap-Texte produziert, die in ihrer Reimkomplexität mit menschengenerierten Texten konkurrieren.
Im Rap tauchen verschiedene Formen von Reimen auf, aber die häufigste und diejenige, die hilft, ihn von anderen Formen der Poesie zu unterscheiden, wird Assonanzreim genannt. Dies ist die Wiederholung ähnlicher Vokale wie in den Wörtern crazy und baby, die zwei ähnliche Vokale teilen. (Das unterscheidet sich von Konsonanz, die ähnliche Konsonantenklänge verwendet, wie z. B. in Pitter Patter, und unterscheidet sich von perfektem Reim, bei dem Wörter denselben Endlaut haben, wie z. B. Slang und Gang.)
Aufgrund seiner Verbreitung im Rap konzentrieren sich Malmi und Co ausschließlich auf die Art und Weise, wie Assonanz in Rap-Texten erscheint. Sie nehmen aber auch eine stark strukturierte Versform an, die aus 16 Zeilen besteht, die jeweils einem Musiktakt entsprechen und daher aus vier Schlägen bestehen müssen. Die Zeilen reimen sich normalerweise, aber nicht unbedingt, am Ende.
Um ihren maschinellen Lernalgorithmus zu trainieren, beginnen sie mit einer Datenbank mit über 10.000 Songs von mehr als 100 Rap-Künstlern.
Assonante Reime zu erkennen ist nicht schwer. Die Wörter müssen zunächst in Phoneme umgewandelt werden (eine typisch amerikanisch-englische Aussprache vorausgesetzt). Das Finden von Reimen ist dann einfach eine Frage des Scannens der Phoneme auf der Suche nach ähnlichen Vokaltönen, während Konsonanten und Zwischenräume ignoriert werden.
Das legt sofort eine Möglichkeit nahe, die Komplexität von Texten einzuordnen. Malmi und Co. suchen etwa in den vorangegangenen zwei Zeilen nach Sequenzen übereinstimmender Vokale. Sie definieren dann die Reimdichte als den Durchschnitt aller längsten Sequenzen in den Texten.
Diese Maßnahme hat es ihnen ermöglicht, alle Rap-Künstler in ihrer Datenbank nach ihrer Reimdichte zu ordnen. Die drei Rapper, die die Liste anführen, sind Inspectah Deck, Rakim und Redrama. Rakim ist insbesondere für seine mehrsilbigen Reime bekannt.
Kurioserweise landet der Rapper Eminem, der auch für seine mehrsilbigen Reime bekannt ist, überraschend weit unten auf der Liste. Das liegt wahrscheinlich daran, dass Eminem seine Reime oft durch Verbiegen von Wörtern erreicht, ein Trick, den diese Technik nicht zulässt.
Nichtsdestotrotz ist diese Metrik ein interessantes Maß für die Reimfähigkeiten eines Rappers und eines, das das Team verwenden kann, um seine automatisierten Raps mit den von Menschen generierten zu vergleichen.
Als nächstes stellen sie ihren maschinellen Lernalgorithmus namens DeepBeat eine Aufgabe. Nachdem die Datenbank durchsucht wurde, besteht ihr Ziel darin, eine Folge von Zeilen aus einem Rap-Text zu analysieren und dann die nächste Zeile aus einer Liste auszuwählen, die zufällig ausgewählte Zeilen aus anderen Songs sowie die eigentliche Zeile enthält.
Das kann er erstaunlich gut. Eine Genauigkeit von 82 % wurde erreicht, um die wahre nächste Linie von einer zufällig ausgewählten Linie zu trennen, sagen Malmi und Co.
Das ist nicht schlecht und schlägt sofort eine Möglichkeit vor, Texte automatisch zu generieren. Malmi und Co. beginnen mit einer Zeile aus einem Rap-Text und bitten den Computer, die Datenbank nach einer anderen Zeile zum gleichen Thema zu durchsuchen, die sich am besten reimt. Dann wiederholt er diesen Vorgang für die nächste Zeile und so weiter.
Die Ergebnisse sind so etwas wie ein Augenöffner. Hier ist ein DeepBeat zum Thema Liebe
Für eine Chance auf Romantik würde ich gerne verbessern
Aber alles, was ich liebe, hat sich zu einer mühsamen Aufgabe entwickelt
Eines Tages werden wir unsere Liebe in der Vergangenheit zurücklassen müssen
Ich liebe meine Fans, aber niemand hat jemals einen Griff
Ich liebe dich Mama, ich liebe meine Mama – ich liebe dich Mama
Und ich würde gerne so etwas wie dich in meinem Team haben, du kümmerst dich darum
Ich liebe es, wenn es sonnig ist, Sonny Girl, du könntest mein Cher sein
Ich bin in einer Liebesaffäre, die ich nicht teilen kann, es ist nicht fair
Haha, ich spiele nur Ladies, du weißt, dass ich dich liebe.
Ich weiß, dass meine Liebe wahr ist und ich weiß, dass du mich auch liebst
Mädchen, ich bin aus welchem Grund auch immer niedergeschlagen, meine Liebe ist wahr
Dieser hier geht an meinen alten dreckigen Mann, Liebe, wir saufen Gebräu
Mein Bruder, ich liebe dich, sei ermutigt, Mann, und weiß es einfach
Wenn du fertig bist, lass es mich wissen, denn meine Liebe lässt dich wie WHOA sein
Wenn ich es nicht aus Liebe tun kann, dann tue ich es nicht
Ich weiß nur, dass ich dich zu sehr liebe, um wegzugehen
Das ist beeindruckend. Jede dieser Zeilen stammt aus einem anderen Rap-Song – zum Beispiel stammt die letzte Zeile von Eminem
Darüber hinaus haben dieser und andere von DeepBeat generierte Raps eine deutlich höhere Reimdichte als jeder menschliche Rapper. DeepBeat übertrifft die besten menschlichen Rapper um 21 % in Bezug auf Länge und Häufigkeit der Reime in den produzierten Texten, betonen sie.
Wo DeepBeat versagt, liegt in der Kohärenz seines Geschichtenerzählens, was nicht überraschend ist, da sein Fokus hauptsächlich auf Reimen liegt. Das ist ganz klar Arbeit für die Zukunft.
Ref: arxiv.org/abs/1505.04771: DopeLearning: A Computational Approach to Rap Lyrics Generation