fbpx

Como a Netflix aplica data science?

 


NETFLIX.JPG

A Netflix é o que de fato podemos chamar de marca disruptiva — ela transformou e inovou o mercado de streaming com suas estratégias de fornecimento de conteúdo totalmente focadas no cliente.

E por trás dessa preocupação com a experiência do usuário tem um extenso estudo, análise e inteligência de dados para poder encantar os telespectadores com conteúdos únicos e muito bem direcionados; afinal, quanto mais satisfeitos com os títulos apresentados (encontrados) e com a experiência de navegação, mais tempo os clientes se mantém como usuários-assinantes do serviço. 

A grande sacada que mudou a realidade e o relacionamento com a empresa foi a utilização de machine learning e data science traçando um algoritmo acertado na criação de séries e filmes e um sistema de recomendação baseado no gosto e comportamento de cada usuário.

Como funciona data science na Netflix?

Focando aqui no sistema de recomendação da Netflix, ele funciona a partir de algumas estratégias, como análise de tendência, análise preditiva e categorização de conteúdo — tudo isso ancorado, sempre, numa extensa compilação de dados.

Compilação de dados

Além de coletar os dados demográficos como idade, sexo e endereço do usuário a Netflix acompanha dados de comportamento sobre o que cada pessoa assiste e como ela navega na plataforma (quantas vezes acessa, tempo que gasta pesquisando conteúdos, de que dispositivo acessa, categorias nas quais as pessoas gasta mais e menos tempo avaliando, tempo de reprodução de traillers, se a pessoa faz downloads de títulos para assistir offline e quantos faz, etc.). Tudo isso com a intenção de ter o maior número de pontos de mensuração possíveis (data points) para oferecer uma experiência fortemente customizada.

Análise de tendência e análise preditiva

Com base nestes milhares de data points, coletados constantemente, os data scientists da Netflix constroem, então, modelos preditivos com a finalidade de desenhar os chamados por eles de “cenários perfeitos”, que consistem em situações nas quais os clientes recebem conteúdos que com uma alta probabilidade irão gostar. Para isso, os modelos atribuem de 3 a 5 grupos diferentes (entre mais de 1300 grupos possíveis) para cada usuário, com base em seus comportamentos e preferências. 

A estratégia de análise e desenho de tendências permite que sejam desenvolvidas e verificadas as probabilidades de sucesso da alocação de conteúdos para os perfis de usuários correspondentes a um usuário específico, exibindo-se os títulos segundo indicação do modelo preditivo e checando o engajamento obtido em relação a eles. 

Com técnicas estatísticas avançadas (como modelos de regressão, árvores de decisão, análises fatoriais, etc.) também é possível que sejam propostas, por exemplo, mudanças nos enredos, possíveis continuações de seriados (novas temporadas) e diferentes versões imagens de capa para um título. Considerando-se o número de pessoas que clicam no conteúdo dependendo da imagem exibida, a Netflix modela a imagem da capa dos programas nas cores e estilos mais bem-sucedidos com tags semelhantes. Faz também indicações de outros entretenimentos de categorias, temas, artistas, histórias, nacionalidades e tempos de duração similares, entre outras coisas.

A Netflix utiliza esse tipo de análise também para identificar gaps e assuntos do momento para que possam criar séries, filmes e documentários inéditos com combinação de temas que tem grandes chance de fazer sucesso. Como foi o caso das séries House of Cards e Stranger Things, construídas a partir de insights trazidos pelos algoritmos que identificaram informações comportamentais dos assinantes e seus assuntos preferidos — fazendo com que fosse possível entregar o que o público realmente queria. 

 Outro uso interessante que esses modelos geram é a inusitada forma de categorizações e gêneros alternativos que a Netflix usa para sugerir programas semelhantes aos que os usuários gostaram de assistir.

Os cientistas de dados criaram 76.897 maneiras únicas de descrever tipos de filmes, que são chamados de “gêneros alternativos”. Usando os diversos data points eles conseguiram ir então muito além daquelas tradicionais categorizações de filmes, séries e até teatro (entre drama, ficção, suspense, etc.); criando, por exemplo, categorias como “o coração do Natal”, “documentários sobre política do leste asiático”, “filmes com mulheres independentes e românticas”. 


netflix 1.JPG

Como funciona o algoritmo da Netflix?

Por meio de  machine learning, vários dados sobre a utilização do serviço são coletados para que sejam aproveitados em um novo algoritmo de treino. Após serem desenvolvidos, os algoritmos são então testados com os usuários por meio de uma estratégia de teste A/B.

Nessa estratégia é possível conferir a preferência do telespectador, verificando se essa nova organização dos dados funciona melhor no engajamento que o algoritmo anterior. 

Como num teste A/B usual, o teste é feito com dois grupos: o grupo A tem contato com a experiência atual, enquanto o grupo B tem contato com o novo algoritmo criado. O que tiver melhor envolvimento com os conteúdos fica então mantido na plataforma. 

Mas, nem tudo são flores: a dificuldade do teste A/B

Esse modelo funciona muito bem para plataformas que trabalham com um sistema de recomendação, porém sua utilização deixa uma lacuna.

Vamos imaginar que após aplicar o teste A/B, o grupo B com o novo algoritmo mostra um maior engajamento em comparação com o grupo A. Assim o correto é aplicar o novo algoritmo aprendido pela máquina para todos os grupos.

No entanto, havia uma porcentagem no grupo A que gostava da experiência que tinham anteriormente, esse grupo acaba ficando prejudicado por um período de tempo até seus dados serem analisados novamente para que um novo sistema seja aplicado. 


netflix 2.JPG

Ser (ou se tornar)  uma empresa orientada por dados não é fácil como girar uma chavinha, fazendo com que isso aconteça de um dia para o outro.

É necessário testar, errar, e testar de novo. 

Para trabalhar com dados e desenvolver estratégias acertadas é preciso muita paciência, cuidado e responsabilidade na extração e aplicabilidade; para que se possa chegar numa inteligência de negócios que gere satisfação e fidelização dos clientes.

A Netflix sabe muito bem disso. Ela pode falhar, os algoritmos de melhor performance podem não funcionar pra todo mundo; mas ela está em teste e aprimoramentos constantes. E, com isso, batendo recordes ano após ano.