Data Science e Hollywood: é possível prever desempenho de bilheteria pela análise de sentimento dos roteiros?

 


blog_hollywood.jpg

Um estudo realizado na Inglaterra tem gerado comentários na imprensa sobre o quão eficiente pode ser a previsão de sucesso comercial na indústria do entretenimento por meio de métodos da Data Science

 

Qual é o assunto da pesquisa?

 

 

A pesquisa parte de uma indagação ampla: como empresas podem desenhar produtos e serviços customizados para refletir corretamente as preferências do consumidor? Na pesquisa acadêmica, é usual partir de um questionamento amplo em favor de um recorte mais restrito – e mais facilmente investigável. Nesse caso, o estudo investiga se o sucesso de bilheteria de Hollywood pode ser previsto a partir do formato dos roteiros dos filmes.

 

O artigo foi realizado por pesquisadores das seguintes importantes instituições de ensino britânicas: Universidade de Cambridge, Universidade de Birmingham  e Universidade do Oeste da Inglaterra.

 

Qual foi o método utilizado?

 

 

Os pesquisadores analisaram roteiros de 6.147 filmes a partir de legendas disponibilizadas no site http://opensubtitles.org. Cada frase do roteiro passou por um processo de análise de sentimento e recebeu um valor dentro do seguinte intervalo: -1 (emocionalmente negativo) até 1 (emocionalmente positivo). Esse processo de valoração das frases é um dos recursos do chamado processamento natural da linguagem (natural language processing ou NLP) – um dos métodos de Data Science.

 

Com os dados da análise de sentimento em mãos, os pesquisadores montaram clusters de filmes com roteiros que seguiam “arcos dramáticos” semelhantes. Eles descobriram seis clusters, listados a seguir.

 


Fonte: Folha de S.Paulo

Fonte: Folha de S.Paulo

 

 

Em seguida, os seis clusters de roteiros foram testados estatisticamente para que fosse averiguado se eram preditivos de parâmetros de sucessos dos filme – tais como receitas de bilheteria (publicadas no site www.the-numbers.com) e avaliação do espectador e da crítica (segundo o www.imdb.com). Em outras palavras, os pesquisadores queriam entender se o tipo de roteiro de um filme era capaz de prever o sucesso de um filme.

 

É interessante notar que todos os bancos de dados são gratuitos e têm acesso público, o que mostra como é possível realizar estudos interessantes com boa teoria e big data.

 

Resultados

 

 

Os resultados mostraram que o arco dramático “Homem no buraco” – caracterizado por uma queda seguida de uma ascensão – foi aquele que teve melhor sucesso comercial, independentemente do gênero do filme e do orçamento da produção.

 

No entanto, os roteiros não foram bons preditivos para nenhum dos outros parâmetros de sucesso – avaliação do espectador e da crítica. Logo, os resultados sugerem que filmes comercialmente mais bem-sucedidos não são necessariamente aqueles mais apreciados pela audiência, mas, sim, aqueles que conseguiram atrair mais atenção. Ou seja, os filmes do cluster “Homem no buraco” não foram os mais apreciados, mas seguramente foram os filmes sobre os quais mais se falou a respeito.

 

Para explorar ainda mais essas suposições, os pesquisadores testaram se as avaliações do IMDb eram associadas com as receitas obtidas na bilheteria, mas não encontraram associação. Mais do que isso, o estudo notou que as avaliações são negativamente correlacionadas com as receitas – filmes com pior avaliação tiveram melhor bilheteria. No entanto, indicadores de popularidade (tais como número total de avaliações) são positivamente correlacionados com as receitas.

 

 

Por fim, os orçamentos dos filmes tiveram correlação positiva com as receitas em todos os arcos dramáticos: maior orçamento significa maior receita, independentemente do roteiro. No entanto, a combinação entre três elementos – arco dramático, orçamento e gênero – pode levar a resultados diferentes. Segundo a professora Ganna Pogrebna, coordenadora do estudo:

 

Seria muito simplista dizer que a indústria deveria se concentrar em filmes “Homem no buraco”. A escolha cuidadosa da combinação entre orçamento e gênero pode produzir filmes financeiramente bem-sucedidos com qualquer arco dramático. Por exemplo, os arcos “Ícaro” são bons para filmes com orçamento baixo. Se você quiser gravar uma tragédia de sucesso com arco “Da fortuna à miséria”, faça um filme épico com um grande orçamento de mais de 100 milhões de dólares.

 

Os resultados de todas as possíveis combinações estão publicadas no estudo original. Esse tipo de análise pode auxiliar empresas a repensar seus modelos de desenvolvimento de produtos. É um exemplo inspirador para nós, que trabalhamos com Data Science e negócios. Como acrescenta a professora Pogrebna:

 

Usar análise de sentimento para mapear as preferências dos espectadores permitirá às empresas projetar conteúdo focado no consumidor, conteúdo que os espectadores realmente queiram ver. Isso pode transferir a responsabilidade sobre a tomada de decisão sobre o conteúdo das empresas para os consumidores.