A mudança radical no mundo modificou a forma como os dados são utilizados nas empresas, que passaram a diversificar suas fontes de dados, implantaram modelos considerando outros tipos de crises e passaram a olhar para análises mais simples.
A pandemia de Covid-19 mudou muita coisa no mundo dos negócios. O campo de análise de dados, por exemplo, enfrenta um problema complicado: como usar dados passados e prever o comportamento futuro diante da incerteza. Poucas organizações estão enfrentando negócios como de costume ou como esperado.
Um olhar interessante sobre o assunto é abordado por Thomas Davenport, professor de Information Technology and Management e membro do MIT Initiative on the Digital Economy, junto com Jeffrey D. Camm, diretor do Center for Analytics Impact.
“É difícil obter bons dados sobre o futuro, por isso temos que usar dados do passado. E se o passado não é mais um guia para o futuro, teremos dificuldades para fazer qualquer tipo de análise preditiva”, contextualiza Thomas Davenport.
O cenário que surge é que as empresas estão investindo tempo para fazer uma pausa e avaliar quais são os dados relevantes para levar em conta no período da pandemia. Também é visto uma aceleração da adoção de dados externos relacionada ao avanço do vírus, para pensar estratégias futuras. Neste processo, os cientistas de dados acabam se tornando um pouco epidemiologistas ‘amadores’, afinal, para prever o impacto da Covid-19 nos negócios é preciso prever o que vai acontecer com o ele. Aliás, quando se imaginou envolver dados de uma doença na estratégia de negócios?
Além disso, a percepção é que somente os dados internos da empresa são insuficientes. É preciso contar com dados externos para conseguir uma leitura mais abrangente do contexto. Informações que não são apenas dos seus clientes mas que levem em conta outros indicadores econômicos, como movimentação nos portos e níveis de confiança do consumidor. As montadoras, por exemplo, têm olhado para os níveis de poluição em certas cidades como uma proxy da frequência de uso de carros. Mais poluição significa mais tempo, indicando que as atividades estão voltando ao normal e as pessoas vão comprar carros novamente. Já os criadores de gado estão procurando informações sobre o fechamento de frigoríficos como um indicador de desaquecimento do setor.
No início do lockdown, os sistemas de Inteligência Artificial ficaram bagunçados e começaram a fazer previsões erradas por conta da mudança radical de comportamento das pessoas. A questão é que as organizações avançaram em direção à análise preditiva nos últimos anos, utilizando dados para antecipar tendências e necessidades futuras. Mas prever a demanda é difícil mesmo em tempos normais e, com a instabilidade gigantesca da pandemia, o movimento foi de deixar de lado os programas de análise preditiva e retornar à análise descritiva mais simples.
“O modelo preditivo mais simples é o que aconteceu ontem. É isso que vamos usar para prever o que vai acontecer hoje”, analisa Jeffrey D. Camm.
Dados de desastres
O conselho Davenport e Camm é de que as empresas não deveriam desconsiderar totalmente os dados do período pandêmico. Provavelmente haverá outros problemas graves no futuro, bem como desastres de outros tipos, assim como foi a crise econômica de 2008. Por exemplo, algumas empresas de bens de consumo em determinadas regiões do mundo têm buscado criar modelos para saber como lidar com furacões. Há variáveis como a amplitude do alcance do furacão para entender quais centros de distribuição devem receber mais atenção. Esse mesmo tipo de coisa faz sentido em relação à pandemia e a outras situações extremas que possam surgir, como uma guerra, ou uma crise econômica aguda.
Em algumas empresas, as equipes de dados passaram a se concentrar em pontos problemáticos específicos. Craig Brabec, diretor global de análises de dados da Ford, contou ao MIT que os executivos passaram a se interessar menos por relatórios e análises de painéis coletados durante a pandemia. Agora tendem a se debruçar mais em análises mais específicas como a extensão dos atrasos ferroviários no porto mexicano de Veracruz, que impacta diretamente em sua operação.
“Equipes inteiras foram colocadas nisso, fazendo quase as mesmas análises de sempre, mas em um ritmo acelerado. Um relatório mensal ou trimestral agora pode ser solicitado semanalmente ou mesmo diariamente”, disse Brabec.
Para o futuro
Baseado na experiência de diretores de ciência e análise de dados ouvidos pelo MIT, a estratégia no futuro próximo e de longo prazo deve ser:
Pesar a relevância dos dados – o que excluir, o que manter, o que imputar
Os dados incomuns durante a pandemia devem ser excluídos? Deve ser substituído por valores imputados com base em dados anteriores à pandemia? Os dados pré-covid serão relevantes no futuro? A resposta a essas perguntas certamente será diferente por setor. Usando médias móveis – onde se calcula a média de um subconjunto de dados para equilibrar as flutuações aleatórias – e outras técnicas de previsão de suavização foram mencionadas por vários gerentes de análise como uma forma de navegar até que ponto pode é possível confiar nos dados de pré e pós-pandemia.
Abraçar o uso crescente de dados externos
Tentar modelar eventos de baixa probabilidade e altamente perturbadores exigirá um aumento na quantidade de dados externos usados para explicar melhor como o mudo está mudando. Os dados externos corretos podem fornecer um sinal de alerta anterior ao que pode ser fornecido pelos dados internos.
Fazer auditoria e teste de estresse
Vários líderes de análise mencionaram a necessidade de manter o controle sobre seus modelos de aprendizado de máquina. Eles disseram que planejavam auditar a entrada de dados, as suposições do modelo e a saída do modelo com mais frequência. Como os modelos responderão a demanda zero, demanda dez vezes maior ou anomalias como o preço negativo do petróleo? Técnicas desenvolvidas para controle de qualidade em engenharia industrial, como limites de controle e amostragem de aceitação, precisam ser aplicadas ao aprendizado de máquina para garantir que os modelos estejam “sob controle”.
Construir um portfólio de modelos especializados
Considerar o desenvolvimento de um planejamento de cenários de crise e anomalia e simulações para construir modelos especializados que podem ser “retirados da prateleira” conforme necessário. O que foi aprendido desde o surto de covid-19 que pode ser implementado se houver ondas de infecções de outras doenças?
A capacidade de gerar modelos personalizados e adaptáveis rapidamente será um fator determinante do sucesso das empresas. É um mundo caótico, diferente dos dados relativamente estáveis e dos cenários analítico do passado.