Como Data Science previu o surto de coronavírus

 


corona.jpg

Funcionários da canadense BlueDot identificaram sinais do vírus três semanas antes do anúncio de restrições de viagens a Wuhan.

Três semanas antes do governo chinês anunciar restrições de viagem ao epicentro do coronavírus, em Wuhan, especialistas em dados médicos já estavam detectando sinais de um surto. O portal de negócios Marketplace explicou como funcionários da startup canadense BlueDot identificaram sinais do vírus e notificaram a Organização Mundial de Saúde, que emitiu um alerta precoce.

“Jornais chineses noticiaram algumas pessoas doentes que podiam ser associadas a um mercado de frutos do mar em Wuhan”, disse Isaac Bogoch, consultor da BlueDot, médico e investigador clínico da Universidade de Toronto. “E, então, [noticiaram] funcionários da saúde pública que estavam tendo reuniões entre hospitais”.

Essas informações são importantes porque computadores da BlueDot são alimentados com todos os tipos de dados – informações sobre doenças em animais, cronogramas de companhias aéreas, artigos na web. Tudo com o intuito de encontrar padrões de surtos e prever para onde eles podem se espalhar. Mesmo antes do coronavírus aparecer fora da China, Bogoch foi coautor de um artigo que previa que o vírus poderia ir primeiro para Tailândia ou Japão.

Três dias após a publicação do artigo, Nancy Messonnier, diretora do Centro Nacional de Imunização e Doenças Respiratórias do norte-americano CDC, anunciou: “Foram identificados três casos fora da China: dois na Tailândia e um no Japão, todos viajantes de Wuhan.”

A previsão de Bogoch e sua equipe foi precisa. Inicialmente, eles partiram da análise de padrões históricos de viagens. Segundo Bogoch: “Analisamos os dados de voos comerciais, apenas para ver para onde as pessoas de Wuhan estavam indo. Além disso, analisamos os destinos e qual é a capacidade de um país em lidar com uma ameaça de doenças infecciosas”.

Usar Inteligência Artificial em prol do alerta precoce para surtos globais não é apenas uma questão de saúde pública. Companhias aéreas, hotéis e linhas de cruzeiro perdem milhões de dólares se as pessoas param de viajar. Além disso, muitas empresas compram dados e análises de Inteligência Artificial para avaliar risco financeiro.


cdc-r-fJkCbZEkw-unsplash.jpg

Mídias Sociais

Outras iniciativas também têm o objetivo de prever a disseminação do coronavírus. O portal TechRepublic comentou como mídias sociais também podem enviar um sinal de alerta precoce de doença e como a análise de dados pode prever como ela se espalhará.

Embora o coronavírus seja uma emergência internacional maior do que o surto de SARS de 2003, desta vez os cientistas têm melhores sequenciamento de genoma, Machine Learning e ferramentas de análise preditiva para entender e monitorar o surto.

Durante o surto de SARS, foram necessários cinco meses para os cientistas sequenciarem o genoma do vírus. Já o primeiro caso de coronavírus foi relatado em dezembro e os cientistas conseguiram sequenciar o genoma em 10 de janeiro, apenas um mês depois.

Além disso, os cientistas têm outra fonte de dados que não existia em 2003: Twitter e Facebook. Em 2014, o Departamento de Inovação e Tecnologia de Chicago construiu um algoritmo que utilizava tecnologias de mineração de mídia social e previsão de doenças para direcionar inspeções a restaurantes. Funcionou: o algoritmo encontrou violações cerca de 7,5 dias antes da rotina normal de inspeção.

Theresa Do, líder da equipe do Federal Healthcare Advisory and Solutions, afirmou que mídias sociais podem ser utilizadas como um indicador precoce de que algo está acontecendo. Uma análise das postagens de mídia social pode ser combinada com outras fontes de dados para prever quem tem maior probabilidade de desenvolver doenças como coronavírus.

Por exemplo, algoritmos podem examinar nomes em passagens aéreas e comparar essas informações com dados de outras fontes para prever quem está viajando para determinadas áreas.

Um dos desafios atuais dessas tecnologias é equilibrar a necessidade de dados em tempo real com as preocupações sobre privacidade. “Se você pensar nos diferentes relógios inteligentes que as pessoas usam, é possível dizer se as pessoas estão ativas ou não e usá-las como parte do seu modelo. Mas as pessoas nem sempre estão dispostas a compartilhar isso porque, então, é possível rastrear onde elas estão”, a pesquisadora esclarece.

Segundo Theresa Do, o surto de coronavírus se assemelha ao surto de SARS, mas os governos estão compartilhando dados mais abertamente agora. Ela finaliza: “Podemos estar identificando muito mais casos positivos do que eles estão revelando, e isso desempenha um papel na maneira como construímos os modelos”, disse ela. “Um país não quer ser visto como detentor de mais casos, mas é assim que salvamos vidas”.

A estratégia da combinação de diferentes fontes de dados têm sido eficiente na previsão de surtos de doenças. A mesma estratégia pode ser aplicada na resolução dos mais diferentes problemas, inclusive no mundo dos negócios. É interessante observar tais aplicações tecnológicas na área da saúde para que analisemos quais dados devemos combinar para solucionar problemas em nossas áreas de atuação.