Com a aproximação da Black Friday, é importante observar como os recursos de Data Science são utilizados nas promoções desse período – por exemplo, no gerenciamento de preços, estoque e previsão de vendas.
A Black Friday se aproxima e grande parte do comércio se prepara para vendas online e em lojas físicas. No cenário digital contemporâneo, é importante observar como os recursos de Data Science são aplicados nas promoções desse período.
É por meio desses recursos que gigantes como Amazon e Walmart escolhem as ofertas que valem a pena, preveem os dias de melhores de vendas e, mais do que tudo, se dão ao luxo de vender seus estoques por preços tão baixos.
Quais dados são utilizados?
Segundo a Forbes, as lojas de varejo usam dados históricos para acompanhar tendências de vendas desde sempre. No entanto, com o aumento do big data e das vendas online, Data Science não só rastreia dados históricos, mas é capaz de criar análises preditivas de vendas e, assim, ficar à frente das tendências.
Na medida em que os consumidores navegam em sites de compras, é possível rastrear itens visualizados, comprados, adicionados e removidos do carrinho. É simples determinar se tais produtos foram visualizados no celular ou no computador, dentre uma série de outros comportamentos do cliente no site.
Para que eles servem?
Essas análises ajudam a direcionar algoritmos para criar, testar e prever quais consumidores têm maior probabilidade de comprar e quais produtos produzirão maior receita – a partir de tendências de compra, comportamento do cliente, popularidade de itens e margens de lucro.
Em suma, os produtos são classificados de acordo com a probabilidade de compra em uma venda de curto prazo e com base no interesse mostrado nesses itens no passado.
Machine learning
Os descontos são determinados por meio de machine learning, de maneira que seja possível determinar, diante das previsões, qual volume de vendas ainda produziria ROI.
Esses dados também podem ser aplicados para o resto do ano, com o intuito de determinar como compensar os descontos oferecidos na Black Friday. Por exemplo, os preços de certos itens de alto interesse podem ser elevados para compensar os descontos.
Mídias sociais
Social listening também é um fator na determinação de estoque e vendas. Comentários, compartilhamentos e publicações em mídias sociais podem ser coletados e analisados para identificar interesse em produtos e a probabilidade de uma venda de curto prazo, como a Black Friday.
Previsão de gastos do consumidor
O portal Datanami lembra que, no passado, os varejistas conseguiam manter apenas alguns poucos dados históricos e compará-los com variáveis como dados demográficos, localização da loja ou padrões climáticos.
Agora, o poder dos sistemas de processamento paralelo permite dividir os dados em um nível muito mais preciso, o que resulta em previsões melhores e mais precisas sobre o comportamento do consumidor.
Dessa maneira, os padrões de compra dos consumidores afetam o conteúdo que é visto online e o preço do produto. Assim, o trabalho de Data Science estimula compras por impulso e usa itens com baixa margem como isca – para atrair compras adicionais de alta margem. E como funciona esse trabalho?
Modelos preditivos
Nós mencionamos a existência de modelos de machine learning utilizados na Black Friday. Porém, como eles funcionam? Há um número incontável de possíveis aplicações, mas um exemplo de predição de costumer spending pode ilustrar bem o passo a passo desse trabalho. O site The making of… a Data Scientist publicou um tutorial que explica de maneira simples esse modelo.
Suponhamos que uma empresa de varejo queira entender o total de gastos que um cliente pode ter ao comprar produtos de diferentes categorias. No exemplo, essa empresa tem dados sobre as compras de vários produtos no mês passado. São esses os dados que serão utilizados para criar um modelo preditivo de gastos, o que ajudará a criar ofertas personalizadas para diferentes clientes.
Concepção do problema
Antes de analisar os dados, é importante entender como a empresa pretende usar o modelo. Esse primeiro brainstorming ajuda a determinar como o problema será concebido, quais algoritmos serão selecionados e como medir o desempenho de cada um.
No caso deste exemplo, o sistema de machine learning necessário pode ser categorizado da seguinte maneira:
-
Tarefa de aprendizado supervisionado: pois serão utilizados dados de treinamento já rotulados (já sabemos quanto um cliente gastou em um produto específico);
-
Tarefa de regressão: o algoritmo realizará regressões estatísticas para prever os valores que o cliente gastará na Black Friday;
-
Aprendizado em lote simples: como não haverá um fluxo contínuo de dados no sistema, não há necessidade de construir um modelo que se ajuste rapidamente à alteração de dados. Os dados são pequenos o bastante para se ajustarem à memória.
Seleção da medida de desempenho
Normalmente, para problemas de regressão, a medida de desempenho típica é o erro quadrático médio da raiz (RMSE). Essa função indica quanto erro o sistema comete em suas previsões.
Criação de hipóteses
Antes de analisar os dados disponíveis, é necessário tecer hipóteses sobre os resultados esperados. Quais seriam as variáveis que poderiam influenciar no valor que um cliente gasta na Black Friday?
No caso do exemplo, podemos dividir em quatro níveis diferentes: nível da cidade, nível da loja, nível do produto e nível do cliente.
-
Hipóteses no nível da cidade:
-
Tipo e tamanho da cidade: cidades urbanas provavelmente vendem mais, em razão dos níveis mais altos de renda da população;
-
Densidade populacional: cidades com áreas densamente povoadas vendem mais, devido a maior demanda;
-
População mais jovem: cidades com populações mais jovens têm tendência a gastar mais na Black Friday.
-
-
Hipóteses no nível do cliente:
-
Renda: pessoas com maior renda gastam mais em produtos.
-
Idade e sexo: Homens com idades entre 25 e 40 anos gastam mais em produtos tecnológicos;
-
Tamanho da família: famílias têm gastos mais contidos, compram apenas as melhores ofertas e os produtos essenciais;
-
Histórico de compras: clientes que já têm histórico de compras são propensas a comprar mais produtos na Black Friday.
-
-
Hipóteses no nível da loja:
-
Localização: lojas localizadas em ruas movimentadas têm melhores vendas;
-
Tamanho: lojas maiores, com maior variedade de produtos têm melhores vendas;
-
Concorrência: lojas sem concorrentes próximos têm maiores vendas;
-
Marketing: lojas que gastam mais em marketing têm os melhores resultados de vendas.
-
-
Hipóteses no nível do produto:
-
Categoria: a maioria dos clientes estará interessada em produtos tecnológicos;
-
Preço: clientes gastam mais em produtos com maiores descontos;
-
Publicidade: produtos mais anunciados vendem mais;
-
Visibilidade: produtos mais visíveis vendem mais;
-
Marca: clientes investem mais em marcas já conhecidas.
-
Além disso, outras questões também podem ser interessantes:
-
Qual tipo de cliente gasta mais?
-
Qual categoria de produto e loja teve as vendas mais altas?
-
Quais produtos famílias e pessoas solteiras costumam comprar?
-
De acordo com idade e sexo, quais são os produtos mais comprados?
-
Quais cidades gastam mais?
-
As lojas com alto orçamento de marketing têm vendas mais altas?
-
A renda do cliente afeta sua compra?
-
Os jovens procuram mais produtos tecnológicos?
Dado disponível
Vamos supor que só temos estes dados disponíveis:
Não há quaisquer informações sobre as lojas. Há algumas informações relacionadas ao cliente, como faixa etária, sexo, ocupação e estado civil. Por outro lado, existem dados sobre o tamanho da cidade e há quanto tempo o cliente vive lá. Quanto ao produto, há apenas informações sobre categorias e valor gasto.
Vamos supor, também, que temos motivos para acreditar que sexo, idade, categoria da cidade e categoria do produto são os preditores que mais influenciam a quantia gasta por um cliente na Black Friday. Logo, a variável de destino é a compra.
Organização da análise
O objetivo do cientista de dados é identificar as variáveis mais importantes e definir o melhor modelo de regressão para prever a variável de destino. Essa análise é dividida em sete etapas:
-
Análise exploratória dos dados (EDA) + pré-processamento dos dados;
-
Engenharia de recursos + transformação de recursos;
-
Modelagem;
-
Ajuste de hiperparâmetro;
-
Agrupamento.
Foram feitas algumas hipóteses sobre os dados, logo podemos realizar algumas explorações básicas e sugerir alguma inferência. É a análise exploratória de dados (EDA). O objetivo desta fase é dar uma olhada superficial e procurar qualquer irregularidade.
Por exemplo, é possível olhar a distribuição da variável de destino (a quantia gasta). Também já é possível concluir que, como esperado, solteiros compram mais produtos na Black Friday, é possível conferir o número de compras segundo faixa etária etc.
Na sequência, a engenharia de recursos e a transformação de recursos lidam com a preparação de todas as variáveis. A modelagem testa os diferentes algoritmos estatísticos para descobrir qual fornece melhores previsões, e o ajuste de hiperparâmetro e o agrupamento são outras etapas mais complexas da construção do modelo de machine learning.
Desafios
O portal Datanami também recorda que a utilização de Data Science na Black Friday apresenta grandes desafios. Muitas vezes, o potencial dos dados sobre transações e comportamento do cliente é subaproveitado. Isso porque, muitas vezes, sistemas díspares e diversidade de dados tornam difícil reunir as informações de compras.
O desafio fica ainda maior quando são utilizados dados não estruturados (como mídia social) para avaliar como os compradores se sentem e como respondem às campanhas. Assim, as empresas que conseguem unificar seus dados e analisá-los ganham grande vantagem competitiva.
Estoque
O portal Datafloq, também especializado em tecnologia, nota que um dos maiores desafios para todos os varejistas é a organização do estoque. Antigamente, os varejistas se preparavam para a próxima temporada de acordo com os itens típicos de cada estação. No entanto, os clientes de hoje são diferentes. Eles são mais independentes de sazonalidade e investem muito em sua individualidade.
É por isso que, para que a Black Friday atenda às expectativas dos clientes, é necessário realizar uma análise profunda do target: saber quais são suas preferências e hábitos de compra para, assim, prever o que sairá das prateleiras. A melhor maneira de fazer isso é analisar o comportamento online do cliente com a marca.
Seleção de preço
No caso de um grande evento de vendas como a Black Friday, as estratégias de preços exigem a combinação de fatores macroeconômicos, comportamento histórico de compra, popularidade de um produto e, é claro, margens de lucro. Soluções de Data Science permitem analisar esses aspectos, identificar o relacionamento entre eles e desenvolver modelos de preços adequados.
Por exemplo, para se preparar para a Black Friday, a Amazon classifica os produtos com base no estoque disponível, como seus clientes se envolveram com eles no passado, como esses itens se encaixam nas tendências atuais de compra e sua semelhança com os produtos vendidos durante a Black Friday anterior.
Ao coletar essas informações, a empresa não apenas define preços adequados e os melhores produtos para as promoções, mas também se concentra em outros aspectos do processo, como o número de trabalhadores sazonais que deverão ser contratados, os custos de contrato e a previsão do crescimento da receita.
Futuro do varejo
O portal InformationAge atenta que ainda deve levar um pouco de tempo para que os varejistas absorvam a lógica de Data Science. Porém, a exploração de recursos analíticos pode gerar receita rapidamente, melhorar a produtividade e reduzir custos. Além disso, a capacidade de prever tendências de compra, preferências do cliente e padrões de negociação ajuda a proteger os negócios contra problemas futuros.
As tendências gerais são claras: o varejo é um setor com muitos dados, e tirar proveito de todos esses dados um melhor gerenciamento dos negócios requer a combinação de soluções de tecnologia e análises do varejo.
A maioria dos varejistas apenas arranhou a superfície do que é possível, e agora cabe aos tomadores de decisão e proprietários de negócios perceber e abraçar plenamente o potencial dessa nova revolução digital. O futuro do varejo depende do uso inteligente de dados.