fbpx

Não automatize o Cientista de Dados

 


Imagem2.png

A Ciência de Dados está em processo de democratização, com tantos materiais disponíveis. Porém, um bom cientista de dados precisa ir além de ferramentas e tecnologia, aumentando seu repertório para estatística e estratégia de negócios, se tornando um líder e não um “rato de códigos”.

 

A Ciência de Dados é um dos campos com mais oportunidades para os próximos anos, seja para trabalho, negócios ou utilização em empresas. Tamanha efervescência da carreira atrai o olhar de profissionais, acadêmicos e jovens. O Cientista de Dados, de modo geral, consegue extrair insights que ajudam a direcionar o negócio ou promover automações que geram uma enorme eficiência e resultados na ponta.

A questão principal aqui são as motivações que as pessoas podem criar ao ingressar na área. Se há o interesse em trabalhar com dados, entender problemas de negócios, lidar com matemática e gostar de codificação, o caminho pode ser promissor. São muitas as possibilidades para desenvolver soluções inovadoras e o trabalho pode se tornar gratificante.

Porém, um ponto de atenção é a “mentalidade de rebanho”, a síndrome do “Maria vai com as outras”, de se tornar um Cientista de Dados por conta do status, de ser considerada “a profissão do futuro”, ou apenas pela motivação de ganhar mais dinheiro. É o mesmo status que possuir um MBA tinha no passado – e ainda têm, em algumas realidades.

“Muitas pessoas querem fazer isso, mas não sabem o que o trabalho realmente implica. E isso resultou em muitas pessoas se autodenominando cientistas de dados e tomando muitas decisões ruins. De fato, muitas pessoas que pensam em ingressar na profissão provavelmente nem sabem o que é ciência de dados”, conta Rahul Agarwal, cientista de dados sênior do Walmart Labs e colunista do Built In.

Ciência de Dados automatizada

Agarwal reflete que o campo da Ciência de Dados foi “democratizado” com a disponibilidade de tanto material disponível, principalmente online e de forma gratuita. É possível encontrar facilmente pacotes que permitem criar modelos com apenas algumas linhas de código. Por um lado, isso é bom, mas pode trazer alguns problemas efeitos adversos.

A disponibilidade de pacotes automatizados como esses leva a pensar que a Ciência de Dados pode ser totalmente automatizada, eliminando ou reduzindo a necessidade de profissionais com outros tipos de skill. Essas bases de código são úteis, mas elas consideram a Ciência de Dados puramente de uma perspectiva de codificação. E o trabalho vai muito além disso.

Inclui compreensão e identificação dos problemas a serem resolvidos e a definição de métricas corretamente. Às vezes será preciso configurar novos pipelines para coletar novos dados e resolver o problema, conversando com as partes interessadas e obtendo um olhar holístico das situações. É preciso analisar a rentabilidade do projeto para garantir que o investimento terá retorno lucrativo. No final de tudo ainda, o teste do modelo e a configuração do ciclo de feedback exigem inúmeras horas de discussões mergulhados no universo do negócio.

É exigido, portanto, um profundo conhecimento do profissional e um bom entendimento de negócios, para operacionalizar tudo isso de forma correta e com potencial de trazer resultados.

A mentalidade do cientista de dados, portanto, é diferente de um “rato de códigos”, que executa os códigos de programação sem entender o que se passa por trás dele. Com tantas instituições oferecendo cursos baseados em ferramentas e automações, há cada vez mais profissionais desse tipo nascendo. Mas  executar código não torna uma pessoa um cientista de dados.

Fazendo um paralelo com um web designer, é como se ele só subesse pilotar templates de WordPress, Wix, Squarespace etc. É verdade que o site fica de pé, mas isso não faz dele um web designer profissional, no senso estrito do termo.

O efeito Dunning-Kruger

O efeito Dunning-Kruger é um tipo de viés cognitivo em que uma pessoa com um pouco de conhecimento sobre algum assunto superestima suas habilidades porque não sabe o pouco que realmente sabe. Na Ciência de Dados isso também pode ocorrer.

O estágio de Dunning-Kruger na Ciência de Dados: é criado o primeiro modelo e você acha que sabe tudo o que há para saber, que domina o suficiente

 

O estágio “não sei de nada”: você vai a um evento, conversa com outros profissionais, se aprofunda na realidade da profissão e percebe que há muito, ainda, a aprender.

O estágio de “aprendizado ao longo da vida”: você cede ao fato de que sempre haverá coisas que não saberá e que precisa se atualizar e, portanto, há uma aprendizagem ao longo da vida envolvida na busca pela excelência pela Ciência de Dados.

O efeito Dunning-Kruger é algo que a maioria dos iniciantes enfrentará. O problema surge quando os recém-chegados são incapazes de deixar esse estágio e passar para os próximos em tempo hábil. Algumas pessoas ficam presas nesta fase, porque entraram em ciência dados com as expectativas erradas, sem entender a profundidade da área. 

A disponibilidade de bibliotecas, pacotes prontos, automações e cursos abundantes e gratuitos sobre tudo isso estão democratizando o campo da Data Science.

O que significa ser um cientista de dados na prática?

Embora algumas pessoas pensem na Ciência de Dados como um trabalho de codificação puro e que podem “dar um jeito” e “se virar” com algumas ferramentas, um bom profissional dessa área precisa aliar o tripé Estatística, Estratégia e Tecnologia.


Imagens de aula da Sandbox Escola de Estratégia, no curso Data LIVE.

Imagens de aula da Sandbox Escola de Estratégia, no curso Data LIVE.

A Data Science em si deve ser compreendida como uma lógica, não uma ferramenta, que utiliza técnicas estatísticas multivariadas para resolver um problema de forma acionável para a operação, algo que seja colocado em ação. Assim, um cientista de dados não possui skills somente de Tecnologia da Informação, alguém que programar determinados tipos de linguagem. É um profissional que sabe o que a linguagem de programação pode fazer, como ela é utilizada e em qual contexto e alia isso a estatística e estratégia de negócios para utilizar os dados disponíveis como matéria-prima para execução de algo que traga resultados.


Imagens de aula da Sandbox Escola de Estratégia, no curso Data LIVE.

Imagens de aula da Sandbox Escola de Estratégia, no curso Data LIVE.

Um profissional com essas habilidades bem desenvolvidas é um unicórnio no mercado, um gênio. Pode ser considerado impossível, uma utopia, mas a lição aqui não é sobre ser um super-homem e saber todas essas coisas. É sobre diversificar o repertório, entendendo de Estatística, Estratégia e Tecnologia.

Quando o foco está apenas em uma das áreas, como TI, a questão fica exclusivamente técnica e não existe o quesito liderança. Liderança? Sim! O Cientista de Dados é a pessoa que vai enxergar o potencial dos dados para resolver problemas e melhorar o negócio.