Neste post mostramos os principais desafios da Análise e Ciência de Dados no setor público, alguns casos de uso em benefício dos cidadãos e apresentamos iniciativas do Reino Unido, um dos governos mais avançados do mundo neste quesito.
Enquanto o setor privado busca usar Ciência de Dados para melhorar a produtividade, descobrir novas oportunidades de negócios, otimizar os custos e as receitas, automatizar processos e obter vantagens competitivas de forma geral sobre os concorrentes, as organizações do setor público possuem o objetivo principal de fornecer serviços de melhor qualidade aos cidadãos. No entanto, a atuação dos governos em muitos países é lenta e os agentes despreparados para aproveitar as oportunidades que se apresentam.
Enquanto a iniciativa privada avança rapidamente no segmento, também no sentido de compreender as necessidades dos clientes e prever o comportamento do mercado, as entidades governamentais não são uma exceção porque alguns países ao redor do mundo também aplicam o uso dos dados para desenvolver suas políticas públicas. Os principais usos ocorrem em aplicações como controle de tráfego de automóveis, serviços de saúde, prevenção de fraudes e evasão fiscal, no setor Militar e de Defesa, prevenção de crimes e vigilância preventiva, segurança da informação e ataques cibernéticos, resposta a emergências e predição de desastres naturais.
Na área de Transporte Público, por exemplo, há casos em que o órgão público responsável é capaz de coletar dados de tráfego de centenas de ônibus, trens e metrôs e ainda de fontes distintas, como sensores de superfície de estradas, câmeras de tráfego e GPS nos veículos, processando e analisando esses dados para fornecer aos motoristas informações em tempo real sobre o congestionamento do trânsito. E quando os dados sobre densidade, volume e velocidade do tráfego são integrados às condições climáticas e à qualidade da estrada, a autoridade de transporte pode prever o risco de acidentes e, consequentemente, alertar os motoristas para que sejam cautelosos ou tomar outras medidas necessárias.
Principais desafios
O sul-coreano Jin-Wook Choi, PhD em Political Science pela University of Chicago, Diretor do Institute of International Development Cooperation na Korea University e professor de cursos de Análise de Dados para o Setor Público, cita os principais desafios da análise de dados deste segmento e lista alguns fundamentos do uso eficaz dos dados que às vezes são negligenciados:.
Compreender os fundamentos da análise de dados
Existem muitas novas ferramentas disponíveis que permitem ao setor público analisar dados. Por exemplo, a programação SAS e R são ferramentas comuns em análise estatística e modelagem de dados, enquanto o Tableau Public e Python são amplamente utilizados para visualização de dados. Embora a análise de dados possa ser realizada por cientistas de dados internos e especialistas externos, os funcionários do setor público devem ter conhecimento básico do processo, no qual a estatística é uma disciplina central. Sem saber como os dados são coletados, analisados, interpretados e visualizados, sua capacidade de extrair insights úteis para uma melhor tomada de decisão não pode ser garantida apenas pela observação dos resultados da análise de dados.
Construir infraestrutura digital para coletar, gerenciar e abrir dados
Pela sua própria natureza, o setor público tem amplo acesso a diversas fontes de dados. Mas apesar do potencial de coleta de dados, ele às vezes não dá atenção à padronização desses dados, dando-lhes um formato e uma estrutura comuns. Sem isso fica muito difícil integrá-los e extrair o máximo potencial das informações. Além disso, os dados coletados devem ser digitalizados e armazenados em nível nacional. Para fazer isso, como muitas organizações privadas fazem, seria fundamental que o setor público tivesse uma estrutura centralizada, com um CDO à frente, estabelecendo uma equipe dedicada ao gerenciamento da qualidade dos dados. Evidentemente, esses dados devem ser abertos ao acesso público para aumentar a transparência das operações e também oferecer acesso a novas oportunidades de utilização pela população e empresas.
Criar cultura de integração e compartilhamento de dados
O setor público deve perceber que os dados são um ativo importante para projetar políticas melhores e implementá-las de forma mais eficaz. Para tirar proveito disso, os dados coletados por várias unidades e organizações devem ser unificados por meio de limpeza, mapeamento e transformação. No entanto, os dados, em muitos casos, são fragmentados e espalhados dentro de uma organização e entre as organizações. Além disso, há uma cultura mais de posse do que de compartilhamento impregnada nesse setor, o que atrapalha muito esse tipo de iniciativa. Tanto a liderança organizacional quanto um CDO devem se esforçar para eliminar essa percepção antiquada e criar uma nova cultura de cooperação.
Desenvolver a capacidade de análise de dados
Novos ambientes, liderados por big data, estão revolucionando o volume, a variedade e a velocidade (também conhecidos como 3Vs do Big Data) dos dados. Consequentemente, novas ferramentas foram desenvolvidas para ajudar as organizações a conduzir análises de dados de maneira mais fácil e rápida. Um dos pré-requisitos que permitem ao setor público incorporar essas novas técnicas analíticas com sucesso em suas organizações é o investimento contínuo na capacidade de análise de dados entre os funcionários, não se restringindo apenas ao aprendizado de ferramentas analíticas, mas incluir uma visão clara que alinha a análise de dados com a missão organizacional, conhecimento básico de estatísticas e ética de dados.
Como o governo do Reino Unido utiliza Data Science
O governo britânico é um dos mais avançados do mundo no uso de Ciência de Dados no setor público. Uma iniciativa de vanguarda é o Data Science Campus, entidade criada em 2017 que oferece projetos para o Office for National Statistics (ONS), governo e organizações internacionais e do Reino Unido em geral.
Como um centro de excelência de ciência de dados entre governos, eles trabalham na fronteira da Ciência de Dados e Inteligência Artificial, desenvolvendo habilidades e aplicando ferramentas, métodos e práticas para melhorar a tomada de decisões que ajudem a moldar a política governamental, abrangendo áreas como economia, comércio, meio ambiente e a sociedade.
No site do Data Science Campus, há uma lista com dezenas de projetos, inclusive alguns com o código aberto e compartilhado via GitHub. Um dos projetos significativos que a equipe trabalhou recentemente foi na curadoria dos dados relacionados à pandemia. Novas fontes de dados foram exploradas para fortalecer as informações do governo relacionadas a tomadas de decisão sobre as ações de combate e prevenção, fornecendo indicadores mais oportunos na avaliação do impacto do distanciamento social, identificando o número de pessoas em isolamento, compreendendo as mudanças no comércio de mercadorias e avaliando o impacto nos negócios locais.
Uma dessas fontes de dados foi o conjunto de Relatórios de Mobilidade Comunitária publicados pelo Google. Esses relatórios mostram as mudanças nos níveis de pessoas que visitam diferentes tipos de locais em áreas ao redor do Reino Unido e outros países. Os dados fornecem informações sobre o impacto das medidas de distanciamento social e são criados com dados agregados e anônimos de usuários que ativaram a configuração do Histórico de Localização (desativada por padrão).
Os dados foram extraídos desses relatórios tanto para o Reino Unido quanto para outros países e disponibilizados publicamente junto com seus códigos fonte. Isso significa que usuários em todo o mundo podem reutilizar os dados em seu trabalho para dar suporte à resposta COVID-19. Tanto os códigos em Python quanto os dados estão disponíveis publicamente.
Outro projeto do Data Science Campus investiga o uso de técnicas de aprendizado de máquina para prever o desempenho do setor elétrico. Ele também tenta criar um quadro completo do perfil de eficiência energética para propriedades domésticas no País de Gales. Cerca de 53% das propriedades do país não têm esse tipo de informação. Essa lacuna na geração de relatórios torna mais difícil alcançar a ambição do governo galês de atingir emissões líquidas de carbono zero até 2050. O setor residencial do Reino Unido é responsável por 18% das emissões de gases de efeito estufa, que vêm predominantemente do aquecimento das residências, portanto, uma melhoria na eficiência energética das residências no País de Gales poderia ajudar significativamente a atingir a meta de emissão de carbono zero nas próximas três décadas.