Entenda as semelhanças e diferenças na atuação dos profissionais da área de dados dentro de uma organização, do analista de dados até o CTO.
No mundo de Data Science é comum que ocorra certa confusão relacionada aos cargos e funções de um profissional da área dentro das empresas. De início é importante citar que o escopo de trabalho é muito mais amplo do que restringir todos ao rótulo de Cientista de Dados. Da parte operacional, passando pelo foco técnico e avançando até a parte estratégica, existem diferentes espaços de atuação e atribuições.
Cientistas de dados de todos os tipos estão em alta demanda no mercado brasileiro e mundial. Segundo a pesquisa Profissões Emergentes 2020, do LinkedIn, entre as 15 profissões mais emergentes de trabalho no Brasil, nove estão ligadas à TI e ao menos três estão ligadas a área de Dados, com Cientista de Dados figurando na 5ª posição, seguido de Engenheiro de Dados (6ª posição) e especialista em Inteligência Artificial (7ª posição).
O profissional de Data Science
Bem, de forma geral, já abordamos que um Cientista de Dados é um profissional que precisa entender do tripé: Estatística, Estratégia e Tecnologia, não se limitando às habilidades técnicas de TI. Porém, os profissionais de Dados ainda podem ter uma série de atuações diferentes dentro das organizações. Podem ser alocados em times específicos, como Marketing, Desenvolvimento, Negócios ou Produto, e podem também atuar em uma área particular de Dados que atenda às demandas gerais a partir de seu setor.
Em artigo para a Towards Data Science, o cientista de dados Yorgos Askalidis, atualmente no Instagram, relata que:
“Nos meus três anos no Spotify, mudei de título, de ‘Data Analyst’ para ‘Data Scientist’, sem que meu papel mudasse. E a partir daí, uma mudança no meu papel, de produto para financeiro, sem que meu título seja alterado. Novas posições híbridas também foram criadas, abrangendo ciência de dados, engenharia de dados e visualização de dados. Meu conselho seria não prestar muita atenção à palavra usada e, em vez disso, focar na descrição do trabalho, equipe, empresa e, é claro, no salário potencial”.
O escopo de cada profissional
Engenheiros de Dados: O engenheiro ou arquiteto de dados trabalha mais focado na parte técnica de desenvolvimento da estrutura e operação relacionada a dados. Cabe a ele definir as maneiras como os dados são armazenados e gerenciados e os processos para utilização e compartilhamento entre as pessoas na empresa. Assim, garante aos outros profissionais maior agilidade, qualidade e produtividade para extrair os dados e fazer análises.
Os engenheiros lidam com dados brutos, desestruturados, que podem conter inúmeros erros e incoerências e que precisam de sistemas específicos para serem utilizados de forma escalável, criando métodos para melhorar a eficiência, qualidade e confiabilidade dos dados, utilizando ferramentas e softwares como apoio.
De forma geral, os engenheiros de dados garantem o fluxo de dados pelos servidores. Estão diretamente ligados a infraestrutura de TI.
Um exemplo simples: o Engenheiro de Dados desenvolve e mantém um Data Lake e oferece APIs de acesso aos usuários, para suas análises e execução de modelos de Machine Learning.
Cientista de Dados: trabalham com dados (estruturados, semi-estruturados ou não-estruturados) conectando habilidades em matemática, estatística e programação para tratá-los e transformá-los em algoritmos acionáveis na operação das empresas.
Cabe ao Cientista de Dados descobrir soluções para os problemas de negócios e contribuir na tomada de decisões e estratégias empresariais, garantindo que os insights extraídos dos dados sejam entregues às principais partes interessadas do negócio, de forma sistêmica e rotineira.
Para isso, além de entender de negócios – o que é raro na posição – o cientista de dados precisa dominar as linguagens de programação como Python e R, para escrever os códigos dos modelos e conectá-los automaticamente à operação.
Engenheiro de Machine Learning: Yorgos Askalidis também aborda que o engenheiro de Machine Learning pode estar por trás de alguns dos aplicativos mais voltados para o usuário que a internet oferece atualmente, como sistemas de recomendações ou a lista de reprodução Discover Weekly do Spotify. A função fica em um meio-termo entre as áreas de ciência de dados e engenharia. É preciso entender de modelos estatísticos e de aprendizado de máquina e ser capaz de implementar uma solução de back-end escalável. Aqui, o principal indicador de desempenho é a qualidade do trabalho de back-end e os modelos de Aprendizado de Máquina.
Analistas de dados / BI: Cabe ao analista de dados utilizar os dados disponíveis e já tratados para obter respostas e insights úteis. Ele é o responsável por olhar para a massa de dados e entender o que eles querem dizer e traduzir isso em informação útil para apoiar tomadas de decisões estratégicas.
Aqui, utilizam ferramentas de inteligência de negócios, mas geralmente um analista de dados não cria algoritmos avançados de Machine Learning e nem faz construção de modelos preditivos.
Os analistas podem ser de produto, de negócios ou de inteligência de mercado, por exemplo. A função normalmente não envolve engenharia de back-end ou dados, utilizando essas estruturas já preparadas por outros profissionais.
Outra incumbência comum para essa função é o de data viz, pois ajuda os líderes de negócios a enxergarem os dados de forma que façam sentido para suas tomadas de decisões e análises. É como um designer dos dados, criando dashboards e tornando os dados visíveis em formas de gráficos e com outros apelos visuais. Embora existam ferramentas que automatizem e pré-definam essas opções, este profissional precisa entender como usar narrativa ou storytelling para apresentar a um público não-técnico as conclusões de um projeto de análise de dados.
Governança de Dados: Uma função que está ganhando espaço é a do profissional ligado à área de Governança de Dados, cuja atuação é alinhar tecnologia, processos e pessoas para definir os papeis, as responsabilidades e os processos necessários para gerir os dados estratégicos da empresa.
A função estratégica que a governança desempenha dentro de uma organização é garantir que os dados sejam gerenciados de forma estruturada, estabelecendo regras e políticas para seu acesso e uso entre diferentes áreas e níveis hierárquicos na organização.
Aqui, além de habilidades técnicas para entender essa relação de dados com negócios de forma mais abrangente, o profissional precisa nutrir soft skills para interagir bastante com outras áreas e estabelecer uma boa relação a fim de construir um ambiente colaborativo entre os envolvidos no processo, que muitas vezes são de fora da área de dados ou TI.
C.T.O: O Chief Technology Officer – CTO – é o profissional C-level responsável por coordenar e liderar toda a área de Tecnologia, incluindo as operações de dados. Algumas nomenclaturas já apontam para o CDO – Chief Data Officer – ou até mesmo CAO – Chief Analytics Officer – nas organizações que já tratam de forma um pouco distintas os setores de Tecnologia e Dados, principalmente fora do Brasil.
É uma posição executiva que exige um nível de experiência, conhecimento e responsabilidade ainda mais elevados, se reportando diretamente ao board. Um papel relevante do CTO é entender o protagonismo dados como um ativo empresarial, inclusive realizando o valluation deles que podem ser inclusos na avaliação de mercado da organização.
Atuação conectada
Em um setor de Marketing, por exemplo, é comum os profissionais compartilharem funções e atividades no dia-a-dia, integrando suas atuações para fazer construções conjuntas. O produtor de conteúdo, o analista de inbound, o profissional de SEO, o designer gráfico, o editor de vídeos, cada um possui atribuições específicas que só competem a si, mas também acabam se complementando.
Assim também ocorre na área de dados. Cientistas, analistas e engenheiros de dados possuem atribuições próprias, mas um se integra à atuação do outro. As suas atuações podem se sobrepor e, dependendo de como a empresa articula sua estratégia de dados, um cientista de dados em um lugar pode fazer coisas relativas a um analista de dados em outra organização ou até mesmo algumas atividades da engenharia, e vice-versa.