Data Science aplicado a e-commerce para gerar mais lucratividade

 


ecoomerce-capa.png

Veja as principais formas que um e-commerce pode utilizar a Ciência de Dados a seu favor e confira um caso de uso de um player internacional

 

O comércio eletrônico é uma das áreas com maior potencial para se desenvolver com a utilização de técnicas de Data Science. Com toda a jornada do consumidor ocorrendo online, aumentam as possibilidades de mapear o comportamento desde os seus interesses até a concretização de compra, se valendo dos dados dos usuários de forma estratégica.

São muitos os pontos de contato rastreáveis, como cliques em anúncios, visualização de itens, as próprias compras e transações financeiras e as avaliações de produtos e comentários. O volume de informações é um recurso valioso para a ciência de dados, que se dedica a vasculhar no Big Data para identificar padrões e traçar previsões de futuro que terão impacto positivo nos resultados de negócios.

Neste post, vamos trazer as principais formas que um e-commerce pode utilizar a Ciência de Dados a seu favor.

Modelagem de Life Time Value do Cliente

O Life Time Value – LTV – ou valor de vida do cliente, é a previsão de quanto lucro líquido o cliente pode trazer para a empresa. 

A fórmula básica para calcular o LTV é: Valor médio do pedido x Número de pedidos repetidos x Vida média do cliente

  • Considera-se “Valor médio do pedido” = valor médio de todos os pedidos anteriores.

  • “Número de vendas repetidas” = Número de vezes que os pedidos foram feitos.

  • “Média de vida do cliente” = quanto tempo uma pessoa permanece como seu cliente.

Ao estimar quanta receita cada cliente pode trazer, a empresa consegue prever a quantidade de receita futura, gerando previsibilidade de caixa e adotando ações que melhorem a performance desse indicador.  Por exemplo, é possível identificar que um cliente pode trazer R$ 5.000,00 nos próximos três anos, enquanto outro cliente tem a previsão de trazer apenas R$ 1.000,00. Esse já é um norteador para traçar estratégias de marketing, como campanhas promocionais, incentivo de venda cruzada e o quanto investir buscando aumentar o ticket médio desses clientes.

Com Data Science, essa previsibilidade do LTV pode ocorrer de forma mais automatizada e com mais assertividade, além de já sugerir as melhores ações possíveis para melhorar os índices.

Sistemas de recomendação

Os sistemas de recomendação não são tão novidade assim, mas podem fazer uma diferença brutal na experiência do cliente e no caixa da empresa. Já contamos em outro post aqui no blog como a Netflix utiliza o artifício para personalizar a experiência dos assinantes. Nos e-commerces, pode ser usado para filtrar as escolhas do usuário com base em suas pesquisas anteriores ou na pesquisa de outro cliente semelhantes ou até por meio dos seus dados de compra, personalizando o site com a seleção de produtos mais relevantes para o perfil em questão.

Na prática, ao procurar um smartphone em uma lona online, por exemplo é possível que você queira comprar acessórios como uma capa e uma película. O site pode, através de um sistema de Machine Learning, analisar as compras anteriores e dados de buscas de seus clientes e fazer a melhor recomendação, visando aumentar suas vendas de produtos.

Existem várias maneiras de configurar um sistema de recomendação e cada técnica fornece recomendações de maneiras diferentes. As três principais são:

  • Filtragem colaborativa

  • Filtragem baseada em conteúdo

  • Filtro de recomendação híbrido

Na filtragem colaborativa as recomendações são feitas com base nos dados coletados sobre as atividades do usuário no site e ao encontrar semelhanças com as atividades de outros usuários. É a técnica mais popular empregada nos e-commerces, pois não precisa saber sobre o item antes de recomendá-lo ao cliente, apenas tenta encontrar as semelhanças entre os interesses dos diferentes usuários.

Já a filtragem baseada em conteúdo fornece recomendações com base no perfil do usuário e na descrição do produto, filtrando recomendações com base no histórico do gostavam no passado.

E o filtro de recomendação híbrido é a combinação de filtragem colaborativa e baseada em conteúdo, podendo ser usada de múltiplas maneiras. É possível fazer previsões de forma separada usando Filtragem Colaborativa e Baseada em Conteúdo e depois combinar os resultados ou utilizá-los como pré-filtro para uma terceira técnica, como é o caso da própria Netflix.

Utilizar este mecanismo tornará o site muito mais atrativo para o usuário, possibilitando um aumento na receita da empresa com a facilidade na venda de mais artigos.

Retenção de clientes

Investir na retenção de clientes é um ponto que todo comércio eletrônico deve considerar para agregar valor ao seu negócio. Em outro post já dissecamos o passo-a-passo de Data Science para prever o churn de clientes.

A retenção de clientes está diretamente ligada ao LTV. A questão é que, quando um cliente faz um pedido no e-commerce, há a possibilidade de voltar e comprar mais (se ficar satisfeito). E se já é bom ter novos clientes, os clientes existentes geram mais receita do que os novos e o custo de aquisição de um novo cliente, via de regra, é bem maior do que a recompra.

Existem muitas formas de conseguir a retenção de clientes, mas o modelo mais comumente usado é o Modelo de Churn. Utilizar Data Science otimiza este modelo e ajuda a manter a receita do negócio de forma que parece imperceptível, como contamos neste case com a Youse.

O modelo de churn ajuda a identificar clientes com maior probabilidade de comprar na concorrência, calculando a taxa de rotatividade, por exemplo, e uma vez identificados, é possível tomar medidas para mantê-los na base. Nestes modelos, diferentes métricas podem ser usadas, como número de clientes perdidos, porcentagem de clientes perdidos, valor de negócios recorrentes perdidos ou porcentagem do valor recorrente perdido.

Extrair poder das avaliações

O processamento de linguagem natural pode ser valioso em grandes e-commerces para que a equipe de dados analise as centenas ou milhares de avaliações dos usuários e transforme as informações encontradas em insights acionáveis.

Neste campo, é possível utilizar os dados para melhorar a satisfação dos clientes com a otimização de diversos setores, seja em termos de produto, logística, atendimento, entre outros fatores, que consequentemente impactarão nos índicos de LTV, retenção e aquisição de novos clientes.

Aqui, WordClouds – ou Nuvem de Palavras – são uma forma popular de exibir a importância das palavras em uma coleção de textos e ajudar a entender as avaliações em larga escala e, posteriormente, fazer uma análise de sentimentos dos usuários para priorizar as ações que terão maior impacto positivo, por exemplo.


mark-konig-Tl8mDaue_II-unsplash.jpg

Um caso de uso de Data Science para e-commerce

A ucraniana Romexsoft conta como utilizou Data Science na prática para aumentar a lucratividade de um cliente de um e-commerce de moda. O varejista era possuía uma ampla linha de roupas e calçados casuais e esportivos para pessoas de todas as idades, para ambos os sexos e para preferências de estilo. O problema era que a maioria dos clientes não estava voltando para comprar mais ou não sabia de outros produtos que seriam adequados. A proposta era mudar o comportamento dos clientes e levá-los a comprar mais.  

Inicialmente foi possível localizar as páginas menos populares com maior taxa de rejeição, os produtos mais e menos populares, com base na correlação entre visualizações e compras reais. Por exemplo, havia vários calçados que o varejista estava pensando em descartar. Embora tenha havido muitas visualizações, a proporção de compras foi bastante baixa. Na verdade, o problema descoberto não era o produto – era o preço.  

O trabalho mais robusto de Data Science passou por remodelar a estrutura do site, revisar agrupamentos de produtos e recomendar os preços corretos para produtos de “baixa venda”. O trabalho final analisou o comportamento de cada cliente individual para determinar como mudar esse comportamento para se traduzir em mais compras. 

Para uma análise profunda foi preciso organizar os produtos com base no tipo (camiseta, sapatos), sexo, grupos de idade, sua finalidade (casual ou esporte), marcas / preços e um histórico do número de visualizações de cada página do produto. Foram gerados mais de 150.000 registros de dados para teste.  

Usando ciência de dados com Java e Apache Spark, foi aplicado um sistema de filtragem de correlação item a item recomendado pela Amazon. Cada produto foi descrito por tipo, sexo, idade, marca e finalidade. A filtragem ocorreu por três variáveis – o código do item, o código do produto e a “taxa”, definida como cliques para esse produto. Isso gerou dados sobre as preferências reais dos clientes.


Exemplo de amostra dos dados

Exemplo de amostra dos dados

Em seguida a ideia foi gerar dados que informassem a taxa prevista (click-throughs) de clientes que olharam para mais de um produto, caso vissem produtos semelhantes. Esta tabela mostra um cliente olhando para um produto específico e a taxa real do produto (número de vezes que o cliente realmente clicou).


ecommerce2.JPG

A próxima tabela mostra o mesmo cliente e a taxa de produto prevista se forem mostrados itens semelhantes:


ecommerce3.png

É possível ver quão próximas as taxas reais e previstas estão. O que esse aprendizado de máquina de ciência de dados diz ao proprietário da empresa é que ele deve mostrar a clientes individuais produtos semelhantes, dos quais os clientes podem nem ouvir falar, mas que serão mais adequados para ele. E este é o valor de usar a ciência de dados no varejo – informando o varejista sobre o potencial de os clientes clicarem em outros produtos quando apresentados a eles. E como os dados colocam os clientes em grupos, esses grupos de clientes, com comportamento e interesses semelhantes, podem ver os mesmos produtos semelhantes.

Agora que o varejista sabe que apresentará produtos semelhantes aos seus clientes, o próximo desafio é determinar os produtos a serem apresentados. Novamente, o aprendizado de máquina assume o controle com base em grupos de clientes e taxas de produtos anteriores desses grupos e, em seguida, gera uma lista de produtos semelhantes aos quais os clientes devem ser expostos.

A tabela a seguir é um exemplo do que esse relatório de dados mostrará, com base em seis produtos adicionais que devem ser mostrados a cada cliente, juntamente com as classificações previstas:


ecommerce4.png

Com base nos dados existentes também é possível determinar os compradores potenciais para um determinado grupo de produtos ou uma determinada marca, mesmo que eles não expressem nenhum interesse prévio em alguma marca específica. O modelo permite comparar com pessoas que têm preferências de compra semelhantes e que já compraram a marca em questão. Como resultado, é possível restringir o segmento de compradores em potencial que se sentirá interessado em um determinado grupo de produtos:


ecommerce5.png

A conclusão é de que os clientes que concluíram compras específicas no passado e essas compras foram semelhantes às de um grupo de clientes, então as compras futuras podem ser previstas. Usando dados reais dessas compras e aplicando o aprendizado de máquina para ciência de dados, o proprietário da empresa pode personalizar e direcionar a experiência e a jornada de cada cliente em seu site.

Outro valor desse modelo é que as vendas podem ser mais precisas e gerenciar melhor o estoque – algo que certamente ajudará a aumentar os lucros da empresa. As previsões podem ser tão precisas quanto afirmar que a empresa venderá de 100 a 120 tênis Nike Air Max Model com 90% de probabilidade na próxima semana.