Como a Lyft usa Machine Learning para marketing personalizado?

 


lyft.jpg

Pesquisadora da Lyft – segunda maior empresa de transporte privado dos EUA, atrás da Uber – ilustra o caminho entre problemas de negócios até a construção de modelos de Machine Learning.

A Lyft é a segunda maior empresa de transporte privado dos EUA, atrás da Uber. Em acordo com a tendência das grandes companhias de tecnologia do mundo, a Lyft não centraliza, mas compartilha aprendizados e desafios da sua trajetória. É nesse espírito que integrantes da equipe de engenharia contam histórias no blog Lyft Engineering.

 

A pesquisadora Beatrice Girard contou recentemente sobre seu trabalho para melhorar o marketing personalizado com o uso de Machine Learning. É uma iniciativa importante, pois a personalização é um componente fundamental no processo atual de engajamento com o cliente. Na Lyft, a pesquisadora afirma que a personalização contribui para o crescimento sustentável dos mercados e para a construção de um relacionamento único com motoristas e passageiros.

 

Os usuários são diversos em termos de necessidades, preferências, expectativas e experiências passadas. Logo, é essencial levar em consideração essa diversidade, de maneira a enviar comunicações relevantes (como e-mails e cupons), entregar experiências valiosas e melhorar a retenção de clientes.

 

Assim, Beatrice Girard mostrou um exemplo aplicado de como um problema de marketing personalizado é resolvido com técnicas de Machine Learning.

 

A pergunta certa

 

A primeira etapa da maioria dos trabalhos aplicados de Machine Learning consiste em entender a perspectiva de negócios do problema. Qual é a questão de negócios implícita? Quais recursos estão disponíveis? Quais são as principais métricas?


thought-catalog-ZMVtx_KJtOk-unsplash.jpg

Girard sugere como exemplo um parceiro de negócios que tenha enviado a seguinte mensagem para alguns cientistas de dados e pesquisadores da Lyft:

 

Problema inicial

Olá! Nós teremos muitos motoristas na rua na próxima semana e queremos mantê-los ocupados. Você poderia encontrar maneiras de conseguir mais passageiros? E me avisaria antecipadamente sobre o quão eficientes seremos?

 

Um aspecto importante do trabalho de um cientista da Lyft consiste em reformular essa mensagem em um problema de marketing personalizado, acionável e concreto. Aí, sim, ele pode ser resolvido com técnicas de Machine Learning.

 

Para atender às necessidades da questão formulada, uma boa direção pode ser o envio de ofertas personalizadas para alguns passageiros. No ambiente da Lyft, ofertas de marketing podem ser relacionadas a preços (como cupons, assinaturas etc.) ou baseadas em experiências (upgrade de serviço, menor tempo estimado para chegada, serviços adicionais etc.).

No caso, a pesquisadora exemplificou como funcionam ofertas de cupons. Os diferentes recursos disponíveis para resolver esse problema são:

 

  • Um inventário de ofertas (diferentes tipos de cupons que podem ser enviados)

  • Um pool de passageiros com diferentes perfis

  • Algum orçamento para investimento

 

Na sequência, as métricas chave são definidas. Girard exemplifica por meio do personagem John, um passageiro hipotético da Lyft em Nova York, que recebeu um cupom.


Este é John!

Este é John!

Com o cupom em sua conta, John provavelmente contratará mais corridas via Lyft do que o faria sem. Esse aumento é chamado de “corridas incrementais”. Para estimar a incremento, é necessário estimar o número de corridas que John teria feito sem o cupom em sua conta.

 

Além disso, o envio de cupons tem um custo para a Lyft. Os passageiros que os recebem não pagam o preço total da corrida e a empresa cobre a diferença. Logo, o custo do envio de um cupom para John pode ser escrito como a soma de todos os descontos de que ele usufruirá.

 

Seria possível usar métricas mais refinadas de retorno e custo. Por exemplo, ao levar em conta o lucro adicional gerado por viagens incrementais e interferências com o mercado. Mas, de qualquer forma, já temos um problema mais bem definido.

 

Problema final

Qual oferta do inventário [recurso] deveríamos enviar, para quais passageiros [recurso], para maximizar [necessidade de negócio] o número de viagens incrementais [métrica], dadas algumas restrições orçamentárias [métrica, recurso] e a manutenção do controle sobre a variação [necessidade de negócio]?

 

Ferramentas de Machine Learning

 

Técnicas de Machine Learning podem ajudar o problema de várias maneiras. Primeiro, é preciso entender como as métricas chave se movem quando diferentes grupos de passageiros recebem diferentes ofertas de marketing. Para isso, é construído um conjunto de dados de treinamento, por meio da distribuição aleatória de ofertas e do monitoramento das métricas.

 

Então, são programados modelos de Machine Learning (modelos baseados em árvores ou redes neurais) para prever as viagens e os custos incrementais, dadas as características do passageiro e das ofertas. Esse é um problema difícil e requer trabalho de modelagem e engenharia de recursos.

 

No entanto, esses modelos não levam em conta a incerteza inerente às previsões. O comportamento humano pode variar bastante. Passageiros não seguem a mesma agenda toda semana, nem sempre estão no mesmo humor, não reagem da mesma maneira na mesma situação e por aí vai.

 

A única coisa que realmente pode ser prevista é a probabilidade de alguém ter um comportamento. No caso do exemplo dado, para um determinado segmento de passageiros que recebem um cupom, as viagens incrementais e o custo seguem uma distribuição de probabilidade como o gráfico a seguir.


1_nojF-vdF9aMyi_l0u6rOJQ.png

Por fim, os modelos passam por um processo de otimização, para que sejam ajustados e sejam os mais eficientes possíveis em relação ao uso de orçamento e geração de corridas incrementais.

 

Em resumo

 

O pipeline de dados pode ser resumido da seguinte maneira:

 

  • Definição de métricas e disponibilização de recursos

  • Aquisição de dados

  • Construção de modelos preditivos para corridas e custos incrementais

  • Implementação de um programa de otimização que administre as variações

 

No entanto, este não é o fim da história. Tendências inesperadas de sazonalidade ou mudanças significativas no comportamento do usuário podem acontecer. Se os conjuntos de dados de treinamento não forem atualizados, as previsões podem ficar rapidamente distantes da realidade e o desempenho dos modelos pode cair.

 

O exemplo da Lyft ilustra de maneira interessante o caminho entre o problema de negócios até a construção de modelos de Machine Learning. Mesmo quem ainda não utiliza uma lógica de automatização em seus negócios pode se inspirar para entender como projetos de personalização podem agregar valor a experiências, produtos e comunicações.