Na Ciência de Dados é importante estar alinhado com a produção científica de ponta, que é muita volumosa. Para ser assertivo nesta busca elencamos algumas dicas a partir dos ensinamentos de um renomado professor de Stanford.
A capacidade de entender as informações produzidas pelos pesquisadores na vanguarda da pesquisa no campo da Inteligência Artificial e de Machine Learning é uma habilidade que todo profissional deveria adquirir.
Na Ilumeo, nos baseamos em produções científicas para desenvolver os projetos de Consultoria em Ciência de Dados. A equipe consome constantemente papers internacionais para desenhar o escopo, para estarmos de acordo com as melhores práticas científicas relacionadas ao tema do projeto em questão. Inclusive, é cultura da empresa incentivar que os colaboradores façam pós-graduações, mestrados e doutorados, oferecendo flexibilidade de carga horária e até mesmo recursos financeiros.
Áreas como Inteligência Artificial, Machine Learning e Deep Learning evoluem em ritmo acelerado e temos que nos equipar com o conhecimento de qualidade que só é possível através de trabalhos de pesquisa. Portanto, faz sentido que os profissionais de Ciência de Dados desenvolvam mentalidade e hábitos acadêmicos.
Porém, é fato que a academia ao redor do mundo inteiro tem uma produção muito volumosa, que pode ser bastante difícil de navegar de forma assertiva e produtiva, sem se perder e selecionando aquilo que de melhor foi produzido. Como se achar? Como separar o joio do trigo? Essas são questões fundamentais e nada triviais.
Como pesquisar de forma estruturada
Andrew NG, reconhecido professor de Machine Learning na Universidade de Stanford, nos EUA, e também co-fundador do Deeplearning.ai e do Coursera, destaca em uma de suas palestras como desenvolver uma abordagem sistemática para ler artigos e extrair o melhor deles dependendo da sua intenção.
Em dado momento, ele fornece um conjunto de perguntas a fazer ao se debruçar sobre um conteúdo. Essas perguntas geralmente mostram que o leitor entende as informações críticas apresentadas. As perguntas para entender essas informações vitais podem ser:
-
O que os autores do artigo pretendiam realizar e que talvez tenham alcançado?
-
Uma nova abordagem / técnica / método foi levantado nesse artigo? Quais são os principais elementos dessa proposta?
-
Quais conteúdos específicos do artigo são úteis para você?
-
Que outras referências você pode buscar?
Mas, sendo mais específico, Andrew utiliza um assunto chamado Pose Estimaton, que é um processo de prever a transformação de um objeto a partir de uma pose de referência definida pelo usuário, dada uma imagem ou uma varredura 3D. E sugere um passo a passo de como pesquisar de forma adequada o assunto.
A primeira etapa é simples: reunir informações sobre o tema. Podem ser artigos, blog posts, vídeos do YouTube, publicações no Medium ou no LinkedIn, trabalhos de pesquisa, entre outros, formando um compilado de fontes úteis.
O passo é seguinte é mergulhar nos recursos relevantes. Para isso, é essencial ter um método para rastrear o entendimento de cada fonte selecionada, como uma tabela que mede nível de entendimento sobre o assunto:
Andrew recomenda que pelo menos 10 a 20% do conteúdo de cada fonte seja consumido, garantindo assim a exposição ao conteúdo introdutório suficiente para uma avaliação sobre a relevância do material.
Para os artigos mais relevantes é necessário avançar para um nível mais alto de entendimento. A leitura de 5 a 20 artigos mostrará uma compreensão básica do assunto, talvez compreensão suficiente para avançar na implementação de técnicas.
Já uma leitura entre 50 e 100 artigos é possível considerar uma compreensão muito boa do domínio. Após analisar os recursos e a extração de informações vitais, sua tabela pode parecer algo semelhante ao mostrado abaixo.
O terceiro passo é uma dica rápida: tomar notas estruturadas que resumem as principais descobertas e técnicas de um artigo, com suas próprias palavras. Exercendo esse raciocínio em cima do conhecimento adquirido, a fixação e a aprendizagem são muito mais forte do que simplesmente destacar trechos ou simplesmente memorizar as palavras. Tentar ensinar isso para alguém, passar o conhecimento adiante, é outra forma de aprender mais.
Como ler um único artigo científico de forma produtiva?
De acordo com Andrew, ler um artigo da primeira palavra até a última em uma sessão pode não ser a melhor maneira de formar um entendimento. Pelo menos não no volume de leitura que temos para fazer hoje em dia. O melhor é ser preparar para revisar um artigo pelo menos três vezes, com três níveis de profundidade distintos, para entender bem seu conteúdo.
Na sua primeira passagem, a sugestão é ler o título, o resumo e ver as imagens ou figuras. Ali você já vai entender o quão relevante pode ser o artigo para você. A segunda passagem pode ser a leitura da introdução e da conclusão, dando outra passagem pelas imagens e um olhar dinâmico e rápido pelo restante do conteúdo. Você vai compreender ainda melhor o conteúdo e já começar a trazer conhecimento mais concreto para si. A terceira passagem do artigo sim pode envolver a leitura de todas as seções, mas pulando quaisquer formulações matemáticas ou técnicas complicadas que possam ser estranhas ao leitor. Também é recomendável pular quaisquer termos e terminologias que sejam desconhecidas.
Querendo utilizar de forma concreta e aplicável o conhecimento do artigo, aí sim temos que ler de maneira mais focada no detalhe dos modelos matemáticos ou estatísticos e se aprofundar em terminologias desconhecidas.