Gerenciando dados como uma cadeia de suprimentos

 


12.07-cadeia-dados.png

Como um approach semelhante a uma cadeia de suprimentos física pode organizar a estrutura de dados de uma organização

 

A maioria das empresas luta com alguns problemas comuns relacionados a organizar, utilizar todo o potencial dos seus próprios dados. Um dos principais problemas é que as empresas geralmente se concentraram nos recursos técnicos de gerenciamento de dados necessários para coletar, armazenar e mover dados. O foco é mais na infraestrutura e menos nos resultados: os produtos de dados usados para tomar decisões, agregar vantagens competitivas a produtos e serviços e satisfazer os clientes.

Há ainda outra questão problemática: a maioria das organizações não adota uma linguagem de dados comum. O setor de marketing coleta, trata e utiliza os dados de um jeito, o setor de vendas de outro jeito, o financeiro de outra forma e assim por diante. Assim, os dados acabam ganhando significados diferentes para pessoas diferentes em contextos diferentes. Isso leva outros departamentos a configurar seus próprios bancos de dados “quase redundantes”, aumentando a confusão geral.

Se o fluxo de dados não for adequado, a empresa não poderá obter o máximo de benefícios de seus dados, que deveriam fluir facilmente por uma organização e seus ecossistemas. Por isso, faz sentido pensar a estrutura de dados como se fosse uma cadeia de suprimentos física, como um processo pelo qual algo entra em uma organização, passa por uma transformação e surge como algo de valor para ser utilizado pelas pessoas. Isso pode ajudar a fazer com que os dados funcionem de acordo com os objetivos de negócios e crie um ambiente para ajudar a atingir esses objetivos.

Afinal, essa estrutura tende a colocar igual ênfase em todas as fases do gerenciamento de dados – da coleta à organização e ao consumo de produtos de dados. 

Para entender uma cadeia de suprimentos de dados, a analogia é imaginar uma cadeia de suprimentos tradicional mesmo – a sequência de processos que transformam matérias-primas em produtos acabados – e depois a distribuição dos produtos acabados. O gerenciamento da cadeia de suprimentos rastreia como os bens e serviços fluem por meio da cadeia de maneira eficaz. O desafio é que a maioria das organizações tem uma cadeia de suprimentos de dados, mas não têm visibilidade de como ela funciona.

Nessa abordagem os dados são a matéria-prima que entra em uma organização. Eles são então armazenados, processados e distribuídos para análise – semelhante à transição da matéria-prima para a distribuição de um produto acabado, ou neste caso, de dados brutos em insights. A última etapa de uma cadeia de fornecimento envolve um portal ou plataforma de dados facilmente pesquisável que permite ao usuário das áreas de negócios descobrir e solicitar o que precisa para seu ambiente específico.

Na prática, essa cadeia de fornecimento de dados consiste em três partes. Primeiro, do lado da oferta, os dados são criados, capturados e coletados. Durante o estágio intermediário de gerenciamento e intercâmbio, os dados são enriquecidos, selecionados, controlados e aprimorados. Então, do lado da demanda, os dados são utilizados, consumidos e aproveitados.

Uma outra metáfora interessante aqui é a cozinha de um restaurante. O melhor chef do mundo terá dificuldade para fazer uma boa refeição em uma cozinha bagunçada com ingredientes sem etiqueta, ou pior, com etiqueta errada nas prateleiras. Mesmo que o chef tenha um assistente, ele não saberá quais ingredientes precisam ser comprados no supermercado porque não sabe o que está no armário. O chef que é determinado vai perseverar, vasculhar os armários para descobrir o que está lá, mas pode levar o dia todo para fazer um almoço simples, e sempre há o perigo de colocar açúcar na sopa em vez de sal. Além disso, ninguém quer pagar um chef de nível internacional para limpar as panelas e frigideiras; no entanto, isso é basicamente o que algumas empresas estão fazendo quando contratam cientistas de dados experientes que passam suas horas vasculhando ou ‘limpando’ dados não confiáveis.

 

Passos em direção a uma cadeia de suprimento de dados

Esse texto da revista das escola de negócios de Harvard propõe como a cadeia de abastecimento de dados pode ser estabelecida dentro de uma empresa seguindo algumas das mesmas etapas usadas no processo físico tradicional:

1.  Estabelecer as responsabilidades de gerenciamento. Como primeira etapa, o diretor de dados ou gerente de produto deve nomear um “gerente da cadeia de abastecimento de dados” de sua equipe para coordenar o esforço e recrutar partes responsáveis de cada departamento, incluindo fontes de dados externas, em toda a cadeia de abastecimento. Em seguida, a etapa é colocar questões associadas ao compartilhamento de dados e propriedade em primeiro lugar.

2.  Identificar e documentar os dados e os requisitos de custo, tempo e qualidade associados necessários para criar e manter produtos de dados.

3.  Descrever a cadeia de abastecimento. Criar um fluxograma que descreva pontos de criação de dados/fontes originais de dados e as etapas executadas para mover, enriquecer e analisar dados para uso em produtos de dados.

4.  Definir e estabelecer métricas. Geralmente, a ideia é implementar métricas que indiquem se os requisitos são atendidos. Começar com a precisão dos dados e o tempo decorrido desde a criação dos dados até a incorporação em um produto de dados. As métricas variam para a cadeia de suprimentos de cada produto de dados.

5.  Estabelecer o controle do processo e avaliar a conformidade com os requisitos. Usar as métricas para colocar o processo sob controle e determinar o quão bem os requisitos da etapa dois são atendidos e para identificar as lacunas.

6.  Investigar a cadeia de suprimentos para identificar as melhorias necessárias – de modo geral e para produtos de dados específicos. Determinar onde as lacunas descobertas na etapa cinco se originam no fluxograma da etapa três.

7.  Fazer melhorias e monitorar continuamente.  Identificar e eliminar as causas raízes das lacunas identificadas na etapa seis e voltar às etapas anteriores, se necessário. Monitorar continuamente os dados de entrada e os produtos de dados, procurando melhorar os produtos e os novos dados e melhores fontes necessárias para isso.

8.  “Qualificar” as fontes de dados. As empresas continuarão a empregar um número cada vez maior de fornecedores de dados externos e é útil identificar aqueles que fornecem dados de alta qualidade de maneira consistente. As auditorias de seus programas de qualidade de dados fornecem os meios para “qualificar” aqueles que o fazem e identificar áreas de fraqueza daqueles que não o fazem.

 

 

Um exemplo na prática

O Key Bank, um dos 20 principais bancos dos EUA em tamanho de ativos, usa um amplo conceito de cadeia de fornecimento de dados para estruturar suas iniciativas de gerenciamento de dados. Ele divide seu processo nas áreas de “capturar / organizar / consumir” e tenta melhorar a eficiência e eficácia em cada área. Recentemente, o banco mudou muito de seu armazenamento de dados e análises para a nuvem e encontrou grandes melhorias em flexibilidade e velocidade em toda a cadeia de suprimentos. Suas atividades de consumo eram historicamente focadas em recursos clássicos de business intelligence, mas agora também tem uma forte função de ciência de dados.

Isso exigiu uma mudança na cadeia de suprimentos em direção a uma maior virtualização de dados e a capacidade de construir visualizações que abrangessem diferentes data marts e que também incorporassem fontes externas. O banco conseguiu usar sua cadeia de suprimento de dados para desenvolver rapidamente novos produtos bancários. Por exemplo, foi um dos maiores credores de empréstimos do Payroll Protection Plan nos Estados Unidos e também lançou recentemente um banco digital nacional para médicos. 

Os dados são um ativo tão importante para as empresas quanto qualquer outro tipo, e os produtos de dados são cada vez mais tão importantes quanto os físicos. O mesmo pensamento que aprimorou as cadeias de suprimentos físicos por décadas está se mostrando igualmente valioso para os dados.