fbpx

A importância dos metadados

 


metadados 2.png

Uma parte importante da organização e eficiência na jornada data-driven

 

Metadados basicamente são dados que descrevem outros dados. Na Tecnologia da Informação, o prefixo “meta” significa “uma definição ou descrição subjacente”. Logo, os metadados descrevem qualquer parte dos dados aos quais estão conectados.

E, paramos para pensar, esses metadados estão à nossa volta desde de quase sempre, como fichas de catálogo em bibliotecas, por exemplo. E agora estão em todo canto, nas fotos que tiramos, músicas que ouvimos e, claro, nas empresas de várias maneiras.

Os metadados resumem informações básicas sobre os dados, como tipo de ativo, autor, data de criação, uso, tamanho do arquivo etc. Eles são essenciais para a eficiência dos sistemas de informação para classificar e categorizar os dados, ajudando os usuários a descobrirem o que estão procurando.

Os metadados fornecem as respostas para as perguntas sobre quem, o quê, onde, quando e porquê sobre os dados. Na captura de tela abaixo há uma imagem de um conjunto de dados hospedado no portal de dados abertos da cidade de Salinas. É um um exemplo de metadados em ação:


Um exemplo visual: a tendência geral se inverte quando os dados são agrupados por alguma categoria representada por cores.

É importante observar que as organizações são repletas de dados estruturados e não estruturados e todos eles têm de alguma forma metadados. Os dados estruturados são mais facilmente organizados e descobertos pelos mecanismos de pesquisa dos bancos de dados, enquanto os dados não estruturados mais complexos. Os e-mails, por exemplo, são dados não estruturados, e eles não são categorizados facilmente porque raramente cobrem um único assunto. Mas eles têm data, hora, presença ou não de anexo etc.

Existem dois tipos principais de metadados: descritivos e estruturais. Metadados descritivos são informações usadas para identificação ou descoberta de um recurso. Pode ser um título, resumo, autor ou palavras-chave. Metadados estruturais geralmente se referem às propriedades de um objeto, como formato, tamanho, mídia, quando foi criado e assim por diante.

De acordo com um relatório publicado pela IDC, há uma lacuna aqui. Os metadados não estão acompanhando a velocidade dos projetos de Big Data, levando as empresas a perderem qualidade e agilidade na análise e interpretação de dados e geração de insights. À medida que cada nova iniciativa de Big Data é lançada, é essencial acompanhá-la com uma estratégia abrangente de gerenciamento de metadados antes que fique fora de controle. Sem metadados, muitos dados podem ficar inutilizáveis ou não gerenciáveis.

 

 

Benefícios

Aqui listamos alguns importantes benefícios de uma boa gestão de metadados dentro das empresas:

 

  • Consistência – os metadados contêm informações que ajudam os usuários a entender a diferença entre os termos usados em determinados negócios. Se uns chamam de vendas e outros de receitas, uns chamam de consumidores e outros de clientes, os metadados ajudam a garantir a consistência em algo único.

  • Compreensão dos relacionamentos – os metadados ajudam o usuário a resolver inconsistências ao determinar se os termos usados nas organizações estão associados ao não a todo o ambiente de dados. Se a mesma entidade em um formulário for declarada como parceira e outra como convidada, por exemplo, os metadados ajudariam a resolver esse problema.

  • Clareza da origem dos dados – os metadados geralmente contêm as origens de um conjunto de dados e ajudam a determinar de onde ele veio e como foi criado. Além disso, os metadados podem conter informações auditáveis sobre seus usuários, que criaram, alteraram, excluíram ou moveram dados com o carimbo de data / hora exato.

 

Para gerenciar metadados em uma escala corporativa grande, é comum criar um repositório de metadados. Existem três abordagens principais para construir isso: centralizada, distribuída ou híbrida.

 

Um repositório de metadados centralizado é a abordagem tradicional: todos no mesmo lugar para consulta. Essa abordagem oferece boa escalabilidade para que novos metadados sejam capturados, bom acesso às informações e desempenho razoavelmente alto. No entanto, ele corre o risco de ser um ponto único de falha e um gargalo de desempenho.

 

Um repositório de metadados distribuído permite que um usuário acesse metadados atualizados de todos os sistemas em tempo real. Essa abordagem oferece melhor qualidade de dados, pois os eles podem ser visualizados em tempo real. No entanto, como todos os sistemas precisam estar disponíveis em tempo real, uma única falha do sistema pode potencialmente derrubar o repositório de metadados.

 

Por último, a abordagem híbrida tenta casar o melhor dos dois mundos. Pode suportar o acesso em tempo real dos sistemas de origem e manter as definições de metadados de forma centralizada ou ter um caminho de referência para locais com as definições precisas, melhorando o desempenho e a qualidade.

 

Boas práticas

Algumas boas práticas a serem lembradas ao implementar metadados nas organizações:

  • Colaboração – Envolver outras pessoas sempre melhora os metadados. Conversar com pessoas dentro da organização e especialistas externos, trabalhar com grupos existentes focados em dados para obter uma variedade de perspectivas e pedir ajuda se precisar. Falar com outras pessoas tornará as práticas de metadados mais fortes a longo prazo.

  • Referências – Com metadados, tende a ser uma boa ideia utilizar o que já foi desenvolvido. Muito trabalho foi feito em todo o mundo para criar orientação de metadados, então é possível usá-los livremente. Não reinventar a roda e usar os grandes recursos que já existem é uma boa dica.

  • Documento em detalhes – a documentação é a base de metadados fortes. Manter uma documentação consistente (e também um catálogo de dados) ajudará a melhorar as práticas de metadados ao longo do tempo e aprender como a organização está colocando os metadados em prática.