Quando a ciência de dados vira, de fato, ciência

 


21.09 - post1.png

Como escrever um artigo científico a partir de um projeto de ciência de dados

 

A produção de um artigo científico geralmente está associada a estudantes das universidades, pesquisadores e professores. Mas na verdade as empresas e o mundo corporativo podem, e devem, se beneficiar muito do saber científico. Isso porque as publicações trazem um alto nível de qualidade, inovação e rigorosa revisão, principalmente os publicados em revistas e journals de renome internacional, que passaram por forte escrutínio da comunidade científica. Logo, ao consumir esses artigos, os profissionais das empresas aumentam sua bagagem e podem utilizar os aprendizados em novos projetos no seu trabalho.

Aqui na Ilumeo, por exemplo, temos como premissa a aproximação da academia com o mercado. A cada projeto de Data Science com um novo cliente, estudamos papers científicos relevantes sobre o segmento a fim de embasarmos com o que de mais atual e importante existe de conhecimento produzido. Somando isso à própria experiência, as possibilidades de bons resultados se multiplicam. Um exemplo foi esse projeto com uma seguradora brasileira, onde conseguimos entender como diminuir a taxa de churn de clientes ao modificar a abordagem dos vendedores do call center.

Também incentivamos nossos consultores em Data Science na vida acadêmica e na produção de artigos científicos. Inclusive, um dos nossos fundadores, Diego Senise, construiu sua tese de doutorado sobre a relação de traços de personalidade com efeitos de recepção de propaganda e você pode conferir o resultado desse estudo aqui no blog.

Entre outros muitos, esses são alguns motivos de adotar a cultura da publicação científica:

  • Colocar sua pesquisa no papel o ajudará a esclarecer seus objetivos para a pesquisa, revisar e interpretar seus próprios dados e o forçará a comparar seu trabalho com o de outros.

  • A revisão por pares fornece um feedback importante sobre a validade de sua abordagem de pesquisa e pode fornecer uma visão sobre as próximas etapas para avançar e interpretar seu trabalho.

  • Comunicar as informações que você encontrou ajudará outros pesquisadores a avançar em seu trabalho, construindo, assim, o corpo de conhecimento que existe em sua área.

  • Escrever e publicar coloca sua pesquisa em um contexto mais amplo.

  • Seu artigo publicado pode ajudar no entendimento público de uma questão de pesquisa.

  • Ter um corpo robusto de trabalhos publicados ajuda a progredir em sua carreira, pois você pode ser considerado para nomeações acadêmicas e promoções.

 

Como começar?

Antes de tudo, é preciso olhar ao redor e descobrir o que outras pessoas já fizeram e estão fazendo nos mesmos campos de estudo que o seu. Então, a ideia aqui é pesquisar artigos semelhantes para criar uma boa base bibliográfica e um arcabouço teórico que lhe dê sustentação e com o qual você irá dialogar.

É uma parte trabalhosa e requer bastante tempo de estudo. Aqui é possível explorar alguns sites para pesquisar artigos semelhantes, como o Google Scholar ou IEEE Xplore. Se não encontrar nenhum paper, talvez não esteja procurando da maneira correta. Então tente novamente, talvez alterando as palavras-chave, até encontrar um número mínimo de artigos.

Salve os papers encontrados e depois comece a lê-los. Há um outro post em nosso blog que pode ajudar aqui, sobre como consumir conteúdos científicos de maneira produtiva. Ao ler os artigos de referência, a recomendação é escrever um resumo de cada um deles. Se preferir agrupe artigos semelhantes e faça um resumo único, mas vai ajudar muito a compreender e clarear as coisas. Também ajuda na percepção do que a sua produção será diferente das já existentes.

Uma das personalidades mais influentes em Data Science no mundo, Andrew NG, empresário, cientista de dados e professor de Stanford, conta que não gosta tanto de dirigir para seus compromissos porque prefere utilizar o tempo de deslocamento para estudar. Então ele normalmente carrega consigo uma pasta de documentos de pesquisas e artigos científicos sobre algum assunto em que está trabalhando no momento, enquanto aproveita a viagem com um Uber.

Ele entende que se ler alguns artigos por semana (nem todos com muitos detalhes), depois de um ano terá lido mais de 100 artigos e isso o levará a um bom domínio da disciplina, se mantendo constantemente atualizado com conteúdo de primeira linha com embasamento científico. Isso o ajudará a resolver problemas complexos em seu dia a dia.

 

A conexão entre academia e mercado

Tomamos como exemplo o paper escrito por um trio de cientistas de dados chineses relacionado a aprendizado profundo para análise de sentimento. A pesquisa foi considerado um dos trabalhos mais influentes do segmento nos últimos anos.

A análise de sentimento é um processo amplamente utilizado para identificar e categorizar computacionalmente as opiniões expressas em um trecho de texto, a fim de determinar se a atitude do escritor em relação a um determinado tópico, produto, etc., é positiva, negativa ou neutra. O assunto é especialmente valioso ao atuar em fontes de dados de mídia social.

O aprendizado profundo é outra tecnologia que está crescendo em popularidade como uma poderosa técnica de aprendizado de máquina que aprende várias camadas de representações ou recursos dos dados e produz resultados de previsão. O trabalho fornece uma visão geral informativa do aprendizado profundo e também faz um levantamento abrangente de sua aplicação atual na área de análise de sentimento.

O material, escrito ao longo de 34 páginas, documenta uma embasada pesquisa teórica e bibliográfica sobre o assunto, além de trazer um caso real de estudo de aprendizado profundo para análise de sentimento nas redes sociais de uma empresa da China. Neste caso, foi um caso prático e concreto, que aconteceu no campo de batalha dos negócios e que foi transformado em artigo científico para um estudo mais aprofundado. Isso permite a outros profissionais e pesquisadores utilizarem o caminho já percorrido pelos autores para embasar outra pesquisa e, principalmente, para replicar o conhecimento profissionalmente em suas realidades.

Se animou a produção científica, caro Data Scientist? Você pode conferir dicas aqui de como escrever um artigo científico passo a passo a partir de um projeto de ciência de dados.