Como acertar na recomendação de cosméticos?

 


cosmeticos.jpg

A recomendação de produtos é particularmente difícil na indústria dos cosméticos. No entanto, recursos de Data Science podem ser utilizados para resolver essa questão.

Mecanismos de recomendação podem ser encontrados frequentemente. Ao buscar determinado produto em sites de compra, é comum que o usuário se depare com frases como “clientes que compraram este item também compraram…” e uma seleção de produtos relacionados. No entanto, a construção desses mecanismos de recomendação é particularmente difícil na indústria dos cosméticos. Isso por causa da variabilidade de opções e dos possíveis riscos que novos produtos podem apresentar para a pele. Assim, o portal Towards Data Science publicou um projeto que procura dar conta do desafio.

 

Em primeiro lugar, Jiwon Jeong, pesquisadora responsável pelo projeto, coletou dados da loja online da Sephora. Ela optou por focar em itens para cuidado com a pele, das seguintes categorias: creme hidratante, tratamento facial, limpador, máscara facial, tratamento para os olhos e proteção solar. O conjunto de dados teve um total de 1472 itens, com informações sobre marca, preço, ranking, tipos de pele e componentes químicos.

 

A escolha do parâmetro de recomendação

 

Quando se trata de cosméticos, recomendar produtos a partir de artigos usados anteriormente não é adequado. Isso porque o conjunto de dados para treinamento do algoritmo seria muito pequeno. Uma pessoa comum experimentou poucos produtos em comparação com o número de cosméticos que existem no mundo.

 

Além disso, o risco de possíveis problemas de pele é um problema complexo. Por exemplo, pessoas de gosto similar poderiam ser agrupadas e, a partir do ranking dos produtos preferidos desse grupo, novos produtos poderiam ser sugeridos. No entanto, o tipo de pele e as características de cada pessoa tornam esse tipo de recomendação problemática. Logo, para que uma análise seja confiável e estável, o parâmetro mais adequado são os componentes químicos dos produtos.

 

Pré-processamento dos dados

 

Escolhido o parâmetro, foi feito um processo de mineração de dados em texto (text mining) a partir das descrições dos componentes químicos dos produtos. Como é possível observar no exemplo a seguir, as descrições são variadas. Algumas contêm somente os ingredientes, outras contêm observações e algumas apresentam até avisos adicionais.

 


produto2.png

 

Somente os componentes químicos são necessários. Logo, a estratégia foi analisar algumas descrições individualmente e identificar quais foram os padrões utilizados para estruturação dos textos. Isso permitiu filtrar somente os textos relacionados aos ingredientes. 

Processamento de linguagem natural

 O processamento de linguagem natural é a área da Data Science que procura entender a linguagem humana por meio de algoritmos. No projeto em questão, esse recurso foi utilizado para transformar cada ingrediente em um código. Isso permitiu que fosse gerada uma matriz que localizava cada cosmético segundo sua composição química.

 

Na sequência, um gráfico foi criado para visualização dos dados. Cada ponto do mapa corresponde a um produto e a localização dos pontos mostra quais artigos estão próximos ou distantes – de acordo com sua composição. O gráfico é interativo e, ao passar com o cursor do mouse sobre cada ponto, o usuário pode visualizar o nome do produto, marca, preço e ranking.

 


visualizacao.gif

Além disso, é possível calcular a similaridade entre cada ponto. Por exemplo, ao escolher o hidratante para pele seca “Peat Miracle Revital Cream of Belief”, o algoritmo gera uma lista dos cosméticos com propriedades similares, como na tabela a seguir. Finalmente, a partir dessa lista, é possível produzir uma recomendação fundamentada de novos produtos. 


recomendacao.png

As amplas possibilidades da Data Science

 

Jiwon Jeong lembra que esse mapeamento de produtos pode ser aplicado a qualquer tipo de indústria, em produtos com todos os tipos de característica. Ao colocar itens no plano de coordenadas, é possível entender visualmente as relações entre os produtos e obter uma recomendação confiável para nossa próxima escolha.

 

Essa análise pode, inclusive, gerar serviços ainda mais refinados. Por exemplo, é possível mostrar imagens e descrições dos artigos, além de fornecer links diretos para a página de cada produto em um site. Com conhecimento químico especializado, pode-se gerar um gráfico diferente, que localize os produtos segundo poder de hidratação ou risco de toxicidade. São todas aplicações de Data Science que permitem oferecer para os consumidores análises e serviços do mais alto nível.