Como é feita a modelagem de dados do Marketing Mix Modeling?

A regressão linear se apresenta como a melhor técnica para modelagem de dados para o Marketing Mix Modeling. Neste post, explicamos como ela funciona e quais são seus pré-requisitos.

 

Já abordamos por aqui um overview sobre o Marketing Mix Modeling, suas aplicações e a maneira como ele é utilizado. Agora, falaremos sobre como é realizada a modelagem dos dados nesse método.

Antes de tudo, é importante ter em mente que qualquer consultoria preditiva exige que o modelo de negócios seja compreendido por quem vai rodar o modelo. Por isso é importante que o Marketing Mix Modeling não seja aplicado como uma suíte de produtos, mas por meio de inteligência de negócios que seja capaz de fazer recomendações sólidas, com insights e acompanhamento.

Outro ponto importante é que um trabalho de Marketing Mix Modeling deve ser transparente. Todos os bancos de dados devem ser entregues, tal como todos os algoritmos do que foi realizado. Feitas essas observações, vamos à técnica.

Confira o e-book da Ilumeo em parceria com a Adobe e o MIT Sloan Management Review, sobre como usar ciência de dados e o Marketing Mix Modeling para aumentar a capacidade de otimizar recursos em marketing e garantir um maior retorno sobre o investimento.

Por que utilizar regressão linear?

A premissa básica do Marketing Mix Modeling é entender qual é o efeito do investimento realizado em cada canal de mídia no resultado final da campanha. É importante ressaltar que o papel da comunicação é trazer interessados. Se a venda será feita ou não, depende de uma série de outras questões da operação. Por exemplo, interesse do consumidor, a negociação que será feita etc.

Para entender a influência de cada canal no resultado final, é necessário escolher um teste estatístico capaz de entender o comportamento dos dados ao longo do tempo. No Marketing Mix Modeling, é comum utilizar a regressão linear. No entanto, várias outras técnicas estatísticas poderiam ser utilizadas. A seguir, vamos listá-las e mencionar porque elas não são escolhidas.

1200px-Linear_regression.svg.png

Outra possível técnica estatística seria a série temporal. Ela é um método consagrado em análises macroeconômicas. No entanto, possui a limitação de não suportar valores ausentes. Ou seja, ela não aceitaria uma campanha com lacunas de inserções e, em um muitas ocasiões, é uma decisão da gestão não investir em determinada mídia em determinado momento.

Outro método seria a Estimação Logit. Ele é robusto e seus modelos estabilizam com amostras baixas. Porém, ele analisa somente variáveis de resultado binárias (por exemplo, sim ou não, vendeu ou não vendeu). Já a geração de leads é uma variável contínua – uma variável numérica com infinitos valores.

Outro método seria a Cox Regression, porém ela também permite somente variáveis de resultado binárias. Por fim, modelos Var também poderiam ser utilizados, mas elestambém não permitem valores ausentes.

Assim, a regressão linear se apresenta como a melhor técnica para predizer dados futuros. Ela prevê com maior precisão como é o comportamento do investimento em mídia. A princípio, quanto mais for investido em mídia, mais leads serão gerados. A regressão permite testar essa hipótese.

Ao contrário dos outros testes citados, ela permite análises com valores ausentes e, mais do que tudo, explica variáveis contínuas. Ou seja, é possível entender como diferentes variáveis (no caso, os investimentos em diferentes canais de mídia) afetam o resultado em números contínuos (por exemplo, geração de leads, vendas ou número de contratos). Por fim, a regressão linear é capaz de prever a relação entre variáveis – no caso, entre os diferentes canais nos quais foi feito investimento.

A equação da regressão está representada a seguir. Embora programas de computador automatizem a utilização dessa equação, é interessante observá-la para entender a lógica por trás do Media Mix Modeling.

equation.png

A variável Y é a resposta de negócio que deve ser estimada – como dissemos, geração de leads, vendas, fluxo de loja e por aí vai. Ela pode ser qualquer resultado de negócio que seja de interesse do pesquisador. Tudo depende da jornada do consumidor que está sendo analisada.

O valor de beta zero representa o momento zero de investimento. Em outras palavras, se não for feito investimento em mídia, qual será a variável de resposta. Quando uma empresa interrompe o investimento, a experiência mostra que esse valor residual diminui com o tempo. A marca sai do foco do consumidor, perde awareness. Logo, é importante investir em comunicação para alavancar as variáveis de resultado. No entanto, vale dizer que o Marketing Mix Modeling permite entender qual é o tempo de vida residual de cada investimento. Logo, é possível entender quanto tempo é possível permanecer sem investimento sem perda de resultado.

Na sequência, os valores betas de X correspondem à variação dos investimentos realizados nos diferentes canais de mídia. Por fim, o valor “e” se refere ao erro. É a parte da variável resposta que não é explicada pelos investimentos. Por exemplo, parte da geração de leads pode ser gerada por propaganda boca a boca ou ação da concorrência – elementos que não estão representados no modelo.

Aliás, ainda que seja possível acrescentar essas variáveis no modelo, elas são variáveis exógenas, que a gestão não consegue controlar. Outros exemplos dessas variáveis seriam o nível de confiança do consumidor pelo índice da GV, PIB, taxa de desemprego pelo IBGE. Essas variáveis podem ser analisadas para entender se estão influenciando o modelo, porém, caso influenciem, elas deverão ser excluídas da análise. Isso porque a intenção é entender quais variáveis que estão sob controle da gestão têm efeito sobre a geração de leads.

O desempenho de diferentes abordagens criativas de campanhas podem ser testadas. O banco de dados do Marketing Mix Modeling é construído à luz do que a gestão tem como tática – tanto de mídia, quanto de criação – desde que esses dados estejam acessíveis. Porém, é interessante lembrar que, antes de qualquer teste estatístico, são definidas hipóteses.

Por exemplo, se determinada marca apoia um projeto social e não existe expectativa de que esse apoio gere diretamente fluxo na concessionária, não faria sentido medir o efeito desse apoio no resultado final via Media Mix Modeling. Seria possível, mas não faria sentido teórico.

business-charts-commerce-computer-265087.jpg

Pré-requisitos

O Marketing Mix Modeling exige alguns pré-requisitos para ser utilizado. Do ponto de vista de banco de dados, é importante analisar se existem algum dado outlier – ou seja, um dado totalmente diferente da distribuição dos outros dados. Por exemplo, se a variável de resposta analisada for geração de leads, é possível que, em determinado mês, algum fator tenha triplicado essa geração. Logo, é importante considerar se tal dado deve ser excluído da análise ou se ele deve ser mantido.

Outro ponto importante é a transformação de curvas. É possível que o comportamento do investimento não seja linear. Nesse caso, é possível ajustar os dados de maneira que a variância seja mantida, mas a análise conjunta dos dados seja compatibilizada.

Em geral, são necessários pelo menos 90 dias de histórico de campanha – online e offline – para que o modelo seja ajustado. Isso é necessário para entender se o modelo fica estável e, então, projetar a predição para o futuro. No entanto, esse periodo depende do número de inserções que foi feito durante a campanha. Empresas que têm um orçamento menor e menos inserções provavelmente precisem de um tempo maior até que seja alcançada estabilidade do modelo.

Por fim, é necessário que o anunciante faça investimentos com variação, caso contrário a estatística não consegue explicar a variação da geração de leads. Ou seja, se os investimentos em mídia forem os mesmos, em todos os canais, ao longo de todo o tempo, não é possível relacionar essas variáveis com o resultado. É importante montar a programação da campanha com variação e, assim, investigar o que explica a variação na geração de leads.

Quer se aprofundar mais? Confira o e-book Como otimizar investimentos publicitários e aumentar o retorno de investimentos? produzido pela Ilumeo em parceria com a Adobe e o MIT Sloan Management Review.