fbpx

Os desafios da ciência de dados na formação de preços dinâmicos

Quais as formas de desenvolver um algoritmo de precificação dinâmica, as metodologias utilizadas e um exemplo de aplicação real.

 

Dinamismo é um conceito que descreve um sistema que muda com o tempo e de acordo com determinadas circunstâncias. Nesse sentido, existem várias maneiras de construir uma solução dinâmica de preços. Aqui vamos descrever as abordagens consideradas mais relevantes a partir da experiência de Juan Manuel Mayén Gijón, PhD e Head of Data Science da Pricing Hub, empresa focada em soluções tecnológicas de precificação dinâmica sediada em Paris e Barcelona.

pricing1.png

Granularidade com base nos atributos do produto e do consumidor final

Os mecanismos de preços baseados em regras que combinam vários atributos de produtos e clientes são capazes de produzir uma granularidade profunda, o que torna a estratégia de preços quase impossível de rastrear do ponto de vista competitivo.

Por exemplo, na indústria de viagens, os preços podem ser baseados em n atributos como ida, ida e volta, origem, destino, duração da viagem, companhia aérea, categoria de tarifa, etc. Os preços também podem ser baseados em características do cliente como número de passageiros, dia da semana em que a reserva foi feita, o sistema operacional usado, o dispositivo, geolocalização, hora do dia em que o cliente decidiu comprar, etc.

O nível de granularidade pode se tornar tão fino que o sistema pode chegar perto de um nível personalizado de preços. Por um lado, isso pode ser percebido como injusto e, no limite, discriminatório.Esses sistemas baseados em regras podem ser aprimorados por meio do aprendizado de máquina, mais especificamente por modelos de propensão. Isso pode ajudar a diferenciar melhor os clientes, estudando sua propensão a comprar ou incluir um serviço de entrega, mas também seu valor de cesta de compras ou valor de vida útil esperado, por exemplo.

Essa precificação granular foi associada no passado ao nome “precificação dinâmica”, quando, na verdade, a política de precificação é totalmente estática e pré-estabelecida. É possível configurar, manualmente, no sistema de mecanismo de preço, uma regra baseada no consumidor final, onde o preço de um item muda de acordo com a hora do dia ou com o dia da semana que o consumidor decide comprar. O simples fato de clientes diferentes chegarem em horários diferentes dá a impressão de que os preços evoluem ao longo do tempo. Na verdade, são múltiplas faixas de preço aplicadas de acordo com um conjunto pré-definido de regras – ou seja, um algoritmo estático.

 

Seleção de baseline

Em mecanismos baseados em regras que definem preços especificando um incremento em cima de um referenciaal, diferentes baselines podem ser usadas. Por exemplo: o preço do provedor, o preço de equilíbrio, o preço do ano anterior ou o preço da concorrência. Este último é a abordagem mais comum usada no varejo. Essas regras se enquadram na categoria de “Se a empresa A oferecer SKU X a um preço P_A, então meu preço (meu_P) será $ 50,00 mais barato:

  • my_P = P_A -10 $. (eq.1)

     

O dinamismo aqui surge porque as regras envolvem um sinal externo que pode evoluir com o tempo: o preço do concorrente. A política de preços, representada pela equação 1, é estática, mas é o ambiente ou contexto que muda (ou seja, o valor da variável P_A na equação).

A favor dos sistemas de preços baseados em regras é que os usuários se sentem capacitados, pois não há aquele efeito de “caixa-preta”. Tudo está definido com clareza e muda com muita previsibilidade. Por outro lado, o sistema de regras pode se tornar muito complexo ao vincular muitos “IFs”. Com o passar do tempo, a inteligência por trás de uma infinidade de regras pode se tornar obscura por causa de tantas sobreposições.

Porém, a principal desvantagem de um sistema baseado em regras estáticas é a dificuldade em acompanhar o cenário externo, que é fundamental para uma formação de preço adequada.

 

Preços baseados em metas

Ao basear a precificação em metas, utilizamos metodologias que estimam ou calculam como alguns KPIs se relacionam com o preço. Exemplos de KPIs aplicáveis aqui podem ser: manter 30% da margem de lucro sobre a venda ou então atingir um número X de vendas por mês.

Então, indicado um KPI, o mecanismo de preço é capaz de selecionar a abordagem de precificação que maximiza as probabilidades de atingir a meta. Porém, as metas podem se tornar complicadas ao introduzir restrições como “maximizar o lucro, mas não danificar o volume além de 5%”. Por isso, para entender como o KPI se relaciona com o preço, é importante usar um processo em duas etapas, modelando separadamente a relação KPI / volume e a relação do volume com as variáveis externas.

  • KPI ($, C) = (KPI / volume) ($, C) * Volume ($, C). (eq.2)

Onde $ representa o preço e C representa a consolidação ponderada de todas as variáveis contextuais.

Entre este tipo de mecanismo de preços, diferenciamos dois modelos: preços com base em dados históricos e preços baseados em experimentação

 

Preços com base em dados históricos

Essa abordagem usa dados históricos para encontrar padrões entre o desempenho histórico do KPI e os preços históricos. Uma vez definidos esses padrões, é possível deduzir o que aconteceria se uma determinada configuração de preço fosse simulada.

Aqui, a Big Data é fundamental, pois uma grande quantidade de dados históricos é necessária já que o aprendizado requer exposição a diferentes configurações de preços. Além de outras questões que são vistas na prática em todo tipo de empresa, como: armazenamento dos dados de preços de forma homogênea, cálculos corretos de precificação no passado, variações econômicas durante os períodos. A pandemia de Covid-19 é um exemplo aqui, pois nunca houve tamanha diferença no comportamento dos consumidores do passado que sirva como base para modelar os preços no momento atual. Por essas e outras questões, podem ser que esses dados históricos não representem o futuro de uma forma razoável.

 

Preços baseados em experimentação

Uma outra maneira de obter um bom entendimento de como os KPIs se comportam em relação ao preço é por meio de experimentação contínua, ou seja, movimentos de preços constantes e medições subsequentes do desempenho desses KPIs. O fato de ser contínuo nos permite acompanhar as mudanças permanentes nas relações KPI-preço e eliminar a suposição de que o passado deve representar com precisão o futuro. A questão complicada aqui é encontrar um equilíbrio entre a exploração “positiva” de preços (experimentos para entender melhor os relacionamentos, mas não otimizar) e a exploração “injusta” de preços (movimentos de preços que buscam fins puros de otimização).

Os modelos de Reinforcement Learning (RL) são especialmente adequados para a precificação baseada em experimentação. Isso ocorre porque eles se baseiam na exploração positiva, mas também porque as recompensas de uma ação (ou seja, decisões de preço) podem ser definidas de forma que estejam alinhadas com os objetivos de negócios da empresa. Porém, um problema com os modelos RL é que eles podem levar muito tempo para aprender, o que torna a implementação desanimadora.

É importante notar que na abordagem baseada na experimentação, o dinamismo pode ser triplo:

  • Como uma adaptação a uma mudança ambiental, por exemplo, medindo uma demanda maior do que o esperado;

  • Como a consequência da segmentação do cliente, isso é idêntico ao dinamismo granular mencionado acima, diferenciando entre, por exemplo, compradores de dias de semana e finais de semana;

  • E como um efeito de maior compreensão à medida que os modelos se tornam mais inteligentes graças à experimentação contínua.

Os mecanismos de precificação com base no objetivo dependem muito menos da experiência do usuário do que da própria precificação baseada em regras. Um usuário de precificação com base em metas ainda tem influência na seleção de modelos de elasticidade, modelos de previsão e suas suposições que os suportam, no entanto, as adaptações de preço são automatizadas. Por outro lado, na precificação baseada em regras, na busca da otimização, o usuário precisa criar ativamente uma nova regra ou modificar uma existente e esperar que a mudança alcance o efeito desejado. Portanto, os mecanismos de precificação com base em metas evitam ideias preconcebidas incorretas e são mais ágeis.

 

Por fim, temos que a construção de um algoritmo de precificação dinâmico pode ser realizada de várias maneiras. De uma perspectiva de desempenho, as diferentes metodologias são difíceis de comparar porque:

  1. Uma empresa raramente tem duas soluções de preços dinâmicas coexistentes;

  2. A experiência dos usuários é importante;

  3. A adequação entre a abordagem e o tipo de empresa/indústria desempenha um papel importante.

Ainda assim, Juan Manuel Mayén Gijón se posiciona e alega que, por experiência, o preço baseado em experimentação se sai melhor do que as outras abordagens para criar valor. Como vivemos em um mundo em constante mudança, sua adaptabilidade a novas realidades é superior à dos preços baseados em regras e preços históricos graças à experimentação contínua, e sua eficiência para se adaptar aos novos objetivos da empresa é muito melhor.

Leia também em nosso blog: O uso de Machine Learning na otimização de pricing


Exemplo de modelo dinâmico de preços

O consultor sueco Etienne Yuan compartilha sua experiência na construção de um sistema de preços dinâmico para uma empresa de trem de longa distância e como isso aumentou o número de assentos vendidos sem alterar horários, nem reduzir o preço médio por assento.

No caso, a empresa de trem praticava apenas um preço para todos os clientes, assim:

  • Receita = preço x quantidade

     

A empresa cobrava 6 euros por bilhete, então ela podia vender 60 bilhetes (capacidade de um trem), para um total de € 360 em receita.

trem2.jpeg

Então se a companhia ferroviária pudesse cobrar preços diferentes para passageiros adultos e crianças, então eles poderiam aumentas as receitas de um máximo de € 360 que poderiam atingir com um único preço, para € 440 (40 bilhetes a € 8 por adulto , mais 20 bilhetes a € 6 por criança).

trem1.jpeg

A área sob a curva de demanda representa o valor que um determinado bem ou serviço está entregando ao cliente. Então, se puder cobrar não apenas dois preços diferentes para dois tipos diferentes de clientes, mas vários preços diferentes para vários tipos de clientes, é possível capturar a maior parte da área sob a curva de demanda e aumentar substancialmente a receita, sem ter que incorrer no custo de aumentar as partidas, mudar a disposição dos assentos, aumentar a publicidade ou oferecer serviços adicionais a bordo.

Durante o projeto, descobriu-se que as compras de passagens tornam-se mais frequentes cerca de um mês antes da partida, acelerando uma semana antes da partida e com um pico de passagens compradas um dia antes da partida.

trem3.jpeg

À medida que o tempo para a partida se aproxima, a venda de ingressos acelera e, portanto, o número de ingressos restantes a serem vendidos diminui de acordo.  Também foi descoberto que, quanto mais tarde um passageiro comprou uma passagem, menos sensível ao preço ele era. Assim, encontrou-se a variável que permitiu discriminar os preços: Tempo.

O desafio do trabalho era encontrar o preço específico a ser cobrado em um determinado momento, dado o determinado número de bilhetes disponíveis para venda. Nesse caso, há duas equações compartilhando duas variáveis que podem ser resolvidas simultaneamente:

  • A função de demanda de preço: P = g (Q)
    onde Preço (P) é uma função (g) de Quantidade (Q).

  • E o Número de Bilhetes restantes: Q = h (T)
    onde Quantidade (Q) é uma função (h) do Tempo (T).

Isso leva há uma nova função, onde o preço é uma função do tempo:

  • P = f (T) = g (h (T))

trem5.jpeg

Esta função informa qual preço por ingresso cobrar em um determinado momento, considerando quantos ingressos ainda estão disponíveis para venda.

Agora, havia duas classes de preços: as novas passagens com descontos dinâmicos e não reembolsáveis; e o preço total, que permaneceu disponível para compra como um bilhete totalmente reembolsável ao mesmo preço total fixo o tempo todo.

Uma das primeiras decisões que precisou ser feita foi alocar assentos por partida para essas duas classes de bilhetes, o que foi feito inicialmente manualmente, mas posteriormente automatizado, usando dados históricos como referência.

Para simplificar as comunicações de marketing, foi decidido não cobrar mais do que o preço total da passagem listado, limitando efetivamente o preço máximo, mesmo se o trem estivesse muito cheio. Na mesma linha, também decidiu-se nunca cobrar menos de 20% do preço total do bilhete.

Também foi necessário agrupar s diferentes partidas e implementar diferentes matrizes para os diferentes clusters. Um exemplo de uma das matrizes pode ser visto a seguir.

Gráfico de dispersão demonstrando lucros por fabricante

A introdução desse sistema de preços permitiu aposentar um mais antigo e mais complicado, que dependia de muito mais variáveis, exigindo muitas entradas manuais e uma cara taxa de licenciamento de software. Substituí-lo por um mais simples, mais robusto e mais barato que exigia menos, na verdade, apenas dois insumos: tempo de partida e quantidade de lugares vendidos.

Os economistas costumam dizer que todas as informações são, em última análise, destiladas no preço. E, neste caso, funcionou exatamente assim. Na verdade, foram feitas previsões mais precisas com menos entradas, de modo que o modelo exigiu menos manutenção. A simplicidade é mais barata de manter.

Depois que essas matrizes de preços entraram em operação, houve um aumento de 5% no número de ingressos vendidos. Não apenas das vendas adicionais dos ingressos com desconto, mas, curiosamente, também do aumento dos ingressos com preço integral, porque o sistema permitiu prever com mais precisão o número de ingressos com preço integral que poderiam ser vendidos.

Dado o custo marginal quase zero dos ingressos adicionais vendidos, quase todo o aumento associado na receita foi diretamente para o resultado, já que praticamente nenhum custo variável adicional teve que ser incorrido depois que as matrizes foram implementadas no sistema de ingressos, resultando em um aumento significativo da margem de lucro.