fbpx

Lennon ou McCartney? A lógica de Data Science aplicada na identificação da autoria de canções

 


blog_beatles.jpg

Estudo resolve a disputa sobre a autoria de canções dos Beatles com uma inusitada apropriação da lógica da Data Science.

As técnicas utilizadas em estudos de Data Science podem ser aplicadas em um número infindável de contextos. É sempre interessante entender os métodos utilizados com o intuito de gerar insights para nossas próprias pesquisas e ampliar nossa capacidade de enxergar fenômenos através dos dados.

Uma aplicação inusitada de técnicas estatísticas foi feita recentemente, com o objetivo de identificar o verdadeiro autor de “In My Life”: John Lennon ou Paul McCartney? O estudo foi conduzido por Mark Glickman, professor de estatística em Harvard, e Jason Brown, professor de matemática na Universidade de Dalhousie.

A maior parte das músicas dos Beatles foi assinada pela dupla Lennon-McCartney, porém, algumas canções foram disputadas pelos autores após a separação da banda. É o caso de “In My Life”. Paul McCartney já afirmou ter sido o responsável pela melodia, enquanto Lennon disse, em sua última entrevista, que o baixista o ajudou somente em um pequeno trecho da música.

 

Assim, os pesquisadores decidiram usar seus conhecimentos para resolver o impasse. “Nós nos perguntamos se técnicas de análise de dados poderiam ser utilizadas para tentar descobrir o que acontecia na música para distinguir se a autoria era de um ou outro”, explica Glickman.

 

O campo de estudos do trabalho é a estilometria – o uso de técnicas estatísticas para determinar autoria. Normalmente, ela é aplicada à análise de textos literários e funciona por meio da identificação de padrões recorrentes de palavras que marcam a provável identidade de um autor.

 

Para estabelecer os padrões de autoria, os pesquisadores analisaram todas as músicas dos Beatles lançadas entre 1962 e 1966 e verificaram como elas se encaixavam em relação a cinco aspectos. Cada aspecto foi construído a partir da presença de um determinado conjunto de características de cada música. Diz Glickman:

 

A ideia básica por trás da nossa abordagem é converter a canção – cujo conteúdo musical é difícil de ser quantificado de qualquer maneira direta – em um conjunto de diferentes estruturas de dados que permitem estabelecer a autoria segundo uma abordagem quantitativa.

Pense em como é decompor uma cor em seus componentes de vermelho, verde e azul […]. Nós estamos fazendo a mesma coisa com canções dos Beatles, mas com mais de três componentes. No total, nosso método divide as músicas em um total de 149 componentes.

 

Cada um desses 149 componentes contém padrões encontrados no repertório dos Beatles e foram encaixados em cinco grandes categorias, segundo a frequência em que ocorreram: 

  • Acordes e uso de acordes incomuns

  • Melodias cantadas pela voz principal

  • Combinações de acordes e uso de combinações incomuns

  • Pares de notas consecutivas na melodia

  • Linhas melódicas de até quatro notas

Essas cinco categorias servem como assinaturas de estilo de composição porque, segundo o professor Glickman, há um antecedente conhecido no estilo de composição dos Beatles: as melodias escritas por John Lennon não variavam muito.

 

Pense em “Help!”, música de Lennon. Ela basicamente segue: “When I was younger, so much younger than today” e o tom não muda muito. Ele fica na mesma nota repetidamente e só muda em pequenos compassos. Enquanto que, com Paul McCartney, você pega uma canção como “Michele” e ela segue: “Michelle, ma belle. Sont les mots qui vont très bien ensemble”. Em termos de tom, caminha por toda parte.

A abordagem estatística utilizada para inferir a autoria de uma canção segundo suas características musicais pode ser entendida em três etapas sucessivas. Em primeiro lugar, o modelo definiu o autor segundo a freqüência de cada um dos 149 componentes identificados. Por exemplo, Lennon tinha tendência a escolher determinada nota como tônica (a nota principal da música), McCartney tendia para outra.

 

Em segundo lugar, os pesquisadores usaram a “regra de Bayes” – uma técnica comum em estudos de probabilidade – para inferir quem era o autor mais provável segundo características aprendidas por meio de 70 canções escritas por Lennon ou McCartney (cuja autoria era declarada e de somente um dos compositores). Em último lugar, os resultados do modelo foram aplicados às canções cuja autoria é disputada entre os dois autores.

 

O resultado é que a probabilidade de que Paul McCartney seja o autor da melodia de “In My Life” é somente 0,18%. Como diz Glickman, “o que basicamente significa que a canção é, muito provavelmente, de Lennon”.

 

Os autores acreditam que essa tecnologia pode ser aplicada a um universo maior de canções. “Nós podemos olhar a história da música popular e mapear o fluxo da influência estilística”, afirma Glickman, em um exemplo inusitado das possíveis aplicações da lógica de Data Science.