fbpx

Como funciona a Análise de Cluster?

Análise de Cluster é uma técnica estatística que pode ser utilizada para agrupamento de clientes a partir de suas atitudes.

Na primeira edição do Datalab, realizada entre julho e setembro de 2018, recebemos Evandro Lopes, professor de marketing na Unifesp e consultor sênior da Ilumeo. Ele explicou a Análise de Cluster, uma técnica estatística que pode ser utilizada para agrupamento de clientes e posterior estabelecimento de padrões de ação.

Para compreender a Análise de Cluster, é importante definir que variáveis são a maneira como entendemos o mundo estatisticamente. Em 1980, o pesquisador do marketing Richard Bagozzi definiu comportamento como uma manifestação (compra, decisão, troca), enquanto uma atitude é um afeto (coletável, por exemplo, por meio de uma declaração ou de um questionário).

Assim, marketing trabalha com ambas as variáveis – comportamento e atitude – mas está mais apto a influenciar o comportamento, pois ele é mais fácil de ser alterado. Um consumidor pode ter preferência por determinada marca (atitude), mas sucumbir ao concorrente por causa de uma promoção realizada em um momento específico (comportamento).

A atitude é formada durante um longo período de tempo, está dentro do consumidor, tal como acontece com a construção de uma marca. Já o comportamento tende a ser explicado pela atitude – quanto mais ela é favorável em relação a determinado produto, mais existe intenção de comprá-lo.

Assim, é essencial que um estudo estatístico entenda teoricamente quais são as variáveis atitudinais envolvidas no fenômeno que está sendo estudado. A teoria é essencial para que as variáveis investigadas não funcionem como meras proxies (variáveis indicativas) sem fundamentação. Na Análise de Cluster, especialmente, é importante que essas variáveis sejam verdadeiros construtos que reflitam as atitudes. São estas, latentes e internas, que fornecem subsídio para que os indivíduos estudados sejam separados em grupos. Uma vez que esses grupos com atitudes semelhantes sejam identificados, aí sim é possível investigar quais características são comuns e identificam as personas definidas por cada grupo.

tecnica2.png

Na Análise de Cluster, busca-se verificar se conjuntos de variáveis que tenham ligação causal entre si têm relacionamentos que constituam agrupamentos. Quando se estuda grupos de consumidores, é a atitude que fornece os gatilhos para que os clusters sejam formados. Para medir essa atitude, é necessário usar escalas validadas cientificamente e entender os pressupostos teóricos que sugerem aqueles agrupamentos – independentemente da origem desses pressupostos: literatura científica, análise qualitativa ou entrevistas com experts.

Algumas técnicas estatísticas dependem do talento do analista e essa é uma delas. Isso porque algumas das decisões não são parametrizadas, mas estão na mão de quem está rodando a análise. Logo, esse profissional precisa entender não somente de estatística, mas também de negócios. Isso porque é ele quem decide a respeito de duas questões fundamentais na Análise de Cluster: a similaridade de cada agrupamento (ou seja, se cada grupo carrega as mesmas características) e a dissimilaridade entre os agrupamentos (se cada grupo deve ser diferente dos demais).

Em outras palavras, o analista delimita o ponto de corte entre a similaridade e a dissimilaridade. Quando há muita tolerância à similaridade, todos os indivíduos parecem pertencer ao mesmo grupo. Quando há muita tolerância à dissimilaridade, cada indivíduo é um grupo por si só. Logo, é preciso de um ponto médio que permita o gerenciamento entre esses diferentes clusters.

Inúmeros grupos de consumidores, com características intrínsecas a cada um, talvez não sejam acionáveis. Porém, assumir um plano de trabalho que conversa com alguns poucos clusters talvez seja algo executável. Logo, o analista precisa ter conhecimento da gestão para atender quais agrupamentos são acionáveis. Cada um deles então pode ser transformado em uma persona para, a partir daí, estabelecer propostas, estratégias de comunicação, campanhas, canais de trade etc.

O ideal é que os consumidores pudessem ser facilmente agrupados. No entanto, a vida real impõe que utilizemos técnicas estatísticas para identificar cada cluster separadamente.

ideal.png
real.png

Premissas da Análise de Cluster

Tal como qualquer outra técnica estatística, a Análise de Cluster pede por algumas premissas para que possa ser executada. Em primeiro lugar, é preciso eliminar as variáveis que não representam possibilidades de aderência. Há variáveis que são testadas a partir da fundamentação teórica, mas não se ajustam aos clusters identificados. Essa exclusão pode ser feita por meio de análise fatorial – ou seja, com a eliminação de variáveis que não compõem fatores.

É também necessário eliminar as variáveis que não diferenciem significativamente os grupos. Em outras palavras, após os clusters serem formados, variáveis que não diferenciem os grupos não justificam as personas ou as ações sugeridas para cada cluster. Além disso, não se deve incluir variáveis indiscriminadamente porque a análise é sensível à inclusão de variáveis irrelevantes.

Por fim, é importante tomar cuidado com casos “aberrantes”, que não representam a população em geral – os outliers. Esse cuidado é fundamental para que se tenha uma amostragem representativa. Outliers são, por exemplo, entrevistados que respondem todos os itens do questionário com a mesma alternativa. Todas as técnicas multivariadas são muito suscetíveis à presença desses elementos estranhos. Logo, é preciso realizar um tratamento anterior dos dados analisados.

Uma vez atendidas as premissas, as etapas da Análise de Cluster podem ser resumidas da seguinte maneira:

tecnica.png

 

Observações gerenciais

A Análise de Cluster é muito útil porque a tecnologia atia; permite com que a comunicação seja realizada com públicos cada vez mais segmentados. Quanto maior a digitalização, mais individualizada é a comunicação e, logo, maior é a possibilidade de tratar de maneira diferenciada cada cluster.

Também vale notar que só vale a pena oferecer tratamentos distintos se os grupos tiverem comportamentos distintos e, além disso, for possível estabelecer padrões de ação para cada cluster. Logicamente, não é interessante trabalhar com um número infindável de grupos, pois isso inviabilizaria o estabelecimento de padrões específicos para cada um.

Padrões, aliás, também podem ser estabelecidos para anomalias. Consumidores que apresentem comportamento inesperado também podem receber padrões de ação automatizados, caso isso seja de interesse da gestão. Da mesma maneira, também é preciso refletir, quando a companhia recebe um novo lead, como identificar a qual cluster ele pertence. Uma vez que Data Science é sobre padrão de ação, é importante automatizar todos esses processos e torná-los aplicáveis na vida real.

Por fim, vale ter cuidado na hora de nomear um cluster ou uma persona. É possível que a análise tenha sido executada de maneira impecável, mas a leitura desses resultados seja confundida por nomes de grupos estereotipados, como “nerds”, “millennials” ou quaisquer outros nomes que possam atribuir valores indevidos e, logo, atrapalhar os padrões de ação.

 

Para saber mais

Tudo o que foi descrito neste artigo foi apresentado no curso Data Lab – Entendendo a Ciência por Trás dos Dados, uma parceria entre a Ilumeo e a Sandbox. O curso aborda o repertório técnico sobre Data Science que o estrategista de negócios precisa dominar. O programa foi formado a partir de conversas com CEOs e CMOs, com o intuito de formar profissionais que saibam enxergar, briefar, entender e criticar projetos analíticos de Data Science.