Medindo o valor dos dados

 


21.09 - post2.png

Quanto valem os dados da sua empresa e como calcular isso?

 

O velho clichê diz que dados são o novo petróleo. E isso vira justificativa para acumular mais e mais dados de todas as fontes possíveis. Mas a questão é que os dados em si não têm valor, a menos que possamos transformá-los em informações que nos orientem para melhores decisões.

Por exemplo: os dados de uma única pessoa não são muito valiosos sozinhos. Porém, combinar os dados gerados por milhares de pessoas é uma história completamente diferente. 

Para permanecer na analogia, o petróleo é uma commodity, que pode ser comprada e vendida. Já os dados são um ativo, que crescem em valor com sua dimensão e aplicação. Por isso, podemos definir o valor dos dados como o impacto financeiro mensurável de como a organização os utiliza

Na prática, os dados podem agregar valor a uma organização de muitas maneiras. Para termos uma ideia dos seus impactos financeiros, podemos olhar tanto para o lado de reduzir custos quanto para gerar receitas. Por exemplo, dados de sensores e análises preditivas na linha de produção industrial para entender melhor as falhas das máquinas e planejar manutenções, reduzindo custos operacionais; ou, então, utilizar dados de clientes e prospects para criar segmentações e personalizações para campanhas de marketing online, aumentando a quantidade de clientes captados e gerando mais receitas.

 

Como descobrir o valor monetário concreto dos dados?

Se podemos atribuir valor aos dados na redução de custos ou no aumento das receitas, é necessário calcular de alguma forma o retorno do investimento. Coletar, mover, organizar, preparar e armazenar dados não é gratuito. Para determinar o ROI em dados, é preciso entender se os benefícios sã oso maiores que custos.

O investimento em dados é sempre um investimento no negócio e vai depender em qual etapa do ciclo de vida dos dados isso acontece. Em 1992, George Labovitz e Yu Sang Chang desenvolveram a regra 1-10-100 para custos de dados: 

  • $ 1 para verificar ou padronizar os dados no ponto de entrada;

  • $ 10 se você esperar para limpar os dados até que estejam em seu sistema;

  • $ 100 para controle de danos se os dados forem usados sem serem limpos.

 

É importante frisar que o retorno sobre os dados não pode ser medido apenas pelo seu volume, velocidade ou mesmo pela qualidade. Para serem valiosos, os dados devem estar acessíveis às pessoas que precisam deles, quando precisam – um estado chamado de integridade dos dados.

Por exemplo, a farmacêutica AstraZeneca obteve um ROI de 40:1 (quarenta para um) em seu processo de transformação digital. Com a implantação de um catálogo de dados digital, 90% dos seus dados podem estar prontos para análise em apenas 3 minutos. Isso reduziu em 30 dias o tempo que a AstraZeneca leva para realizar testes clínicos, economizando US$ 1 bilhão por ano. Ao tornar os dados mais acessíveis em toda a empresa, eles literalmente tornaram seus dados mais valiosos para os negócios. Para cada US$ 1 gasto em dados, eles agora recebem US$ 40 de volta. 

 

Modelos de avaliação para informação

Existem mesmo fórmulas reais pra calcular o valor concreto dos dados em si, mas são coisas bastante complexas, que servem mais para os setores de planejamento financeiro das corporações. São estruturas para determinar o valor e o impacto comercial dos ativos de informações. Um texto no blog Show Me Data apresenta pelo menos duas delas.

A primeira é o chamado valor intrínseco da informação (IVI) permite avaliar a qualidade inata dos ativos de dados. Este método descreve como as informações são completas e precisas e qual a probabilidade de outras organizações terem esses dados.


1.png

A fórmula para o valor intrínseco da informação (IVI)

  • Validity:  A porcentagem de registros com valores corretos.

  • Coverage:  uma estimativa da porcentagem de outras organizações que não têm  esses dados.

  • Scarcity:  o número de registros no conjunto de dados como uma porcentagem do universo total de registros potenciais.

  • Useful Life:  O número de períodos (meses, por exemplo) que cada registro pode ser razoavelmente usado ou é relevante,

 

Esse valor intrínseco da informação pode ser usado como uma ferramenta para comparar a utilidade potencial de várias fontes de informações semelhantes. As informações com um alto IVI são boas candidatas a serem altamente disponibilizadas na organização, e as informações com um baixo IVI podem ser o alvo dos esforços de melhoria da qualidade dos dados, ou podem ser totalmente descartadas se o custo de gerenciamento e proteção dessas informações for injustificado.

Valor comercial da informação (BVI)

Ao contrário do IVI, o BVI – valor comercial da informação – reconhece a relevância e a qualidade das informações para as atividades empresariais. Ele pode ser usado como uma maneira rápida de medir o benefício potencial que esses ativos fornecem.


A fórmula para o valor comercial da informação (BVI)

A fórmula para o valor comercial da informação (BVI)

  • Relevance (p) – A utilidade potencial (0 a 1) das informações para o processo de negócios p.

  • Validity – A porcentagem de registros com valores corretos.

  • Coverage – O número de registros no conjunto de dados como uma porcentagem do universo total de registros potenciais.

  • Timeliness – A probabilidade de que, a qualquer momento, as informações sejam atuais (coincidam com os fatos do mundo real). Esta é uma versão medida mais facilmente do intervalo de tempo entre os eventos do mundo real e o aparecimento desses eventos em um conjunto de dados.

 

O BVI exige que se enumere os processos de negócios que podem se beneficiar dos dados e se atribua uma “pontuação de relevância”.

Ao comparar os processos que já usam essas informações com aqueles que ainda não se beneficiaram delas, podemos identificar rapidamente as oportunidades de extração de valor dos ativos de informação existentes. Além disso, é possível defender a apreensão de investimentos ou o descarte de informações com um BVI baixo.

A desvantagem do BVI é que, para identificar a relevância de vários processos de negócios, pode ser necessário envolver muitas pessoas de toda a organização. Por fim, a métrica de relevância é altamente subjetiva, o que pode prolongar o processo de análise.

Além dessas duas equações, também existem cálculos para o valor de desempenho da informação, valor do custo, valor econômico, valor de mercado, entre outros modelos de avaliação da informação.

 

Dados para venda?

De fato, o valor dos ativos de informação nunca foi maior. De acordo com a Comissão Europeia, em 2020 o valor dos dados personalizados – apenas uma classe de dados – é estimado em 1 trilhão de euros, quase 8% do PIB da União Europeia.

A questão é que quando falamos em valores, não se trata de vender esses dados por um preço, mas sim e perceber que os dados são a força vital de uma organização.

O valor dos dados para gigantes como Amazon e Alibaba, por exemplo, não é capturado em uma abordagem de preços. Seus dados podem ser valiosos para terceiros, mas são mais valiosos para as próprias empresas, que buscam otimizar suas operações. Na verdade, sem dados, elas perderiam grande parte do seu diferencial competitivo.

Portanto, não podemos pensar no valor dos dados simplesmente como o preço que outras pessoas estão dispostas a pagar. Temos que pensar de forma mais ampla.

Podemos pensar nisso como o ciclo de valor / avaliação, como sugere o canal do Open Data Science. Temos que avaliar e entender quais dados temos e atribuir um valor a eles para que outras pessoas na organização reconheçam seu valor e descubram como torná-los ainda mais valiosos. A partir disso, deve-se investir para garantir que os dados sejam adequados para o propósito, criando uma boa governança, com padrões, sistemas e procedimentos para adquirir dados de boa qualidade.

Depois de ter bons dados, podemos começar a usá-los. Isso pode ser por meio de melhores operações. Pode ser por meio de uma entrega mais eficiente de produtos e serviços. Pode ser usando os dados para gerar percepções novas e significativas que são, por si mesmas, valiosas.

Por fim, revisamos o que aprendeu, perguntando-se: o que aprendemos com a aplicação de nossos dados? Como poderíamos fazer isso melhor no futuro? Existem conjuntos de dados novos e diferentes que precisamos acessar?

O framework completo fica assim:


3.png

Este ciclo é infinito – oscila entre as fases de avaliação e valor dos dados. E é o valuation, algo sobre o qual se fala há muitos anos, que poucos são capazes de implementar adequadamente. E, em parte, é por isso que tantas iniciativas de dados falham.