Três lições que um cientista de dados aprendeu trabalhando na Amazon

 


amazon.jpg

Após um trabalho de cinco anos na Amazon, Jesse Freeman relatou aspectos elucidativos da empresa, tais como a cultura data-driven, a gestão do conhecimento e como fazer mais com menos.

Jesse Freeman é um cientista de dados que trabalhou na Amazon durante cinco anos. Antes envolvido com desenvolvimento de jogos, ele direcionou sua carreira para a área do machine learning e explicou como a cultura de sua antiga companhia o preparou para essa mudança profissional.

 

Segundo Freeman, suas três principais lições foram: ser data-driven, escrever redações de seis páginas (“6-pagers”) e ser engenhoso. A Amazon tem um conjunto de princípios de liderança que contribuem para sua cultura única e o cientista acredita que são esses princípios que permitiram o crescimento da empresa. A seguir, ele relata como aplicou parte desse conhecimento à sua jornada no machine learning.

 

Ser data-driven

 

Embora muitas empresas afirmem que são data-driven – em português, orientadas pelos dados –, esse conceito é levado realmente à sério na Amazon. Toda reunião de planejamento ou estratégia é realizada com um delicado equilíbrio entre dados históricos, dados ativos e previsões de dados futuros.

 

Por exemplo, a empresa oferece relatórios semanais de negócios, que tentam filtrar grandes quantidades de dados de uma maneira digerível e, assim, permitir correções de curso a qualquer momento. Além disso, a maioria das equipes tem analistas de dados dedicados.

 

Esses analistas criam os relatórios semanais, conectam sistemas de relatórios entre as diferentes unidades de negócios e automatizam a maior quantidade possível de coleta de dados. Tudo isso para que todos tenham uma fotografia do estado da unidade de negócios em que trabalham.

 

Freeman explica que a espinha dorsal do machine learning são os dados. Sem dados úteis, limpos e confiáveis, não há como treinar, testar e validar um modelo preciso. Além do trabalho envolvido na criação do modelo, entender os dados em si é uma habilidade essencial.


christian-wiediger-rymh7EZPqRs-unsplash.jpg

Redações de seis páginas

 

A Amazon é notoriamente conhecida por sua cultura de escrita. A empresa afirma que qualquer funcionário pode sugerir uma ideia ou criar um novo negócio do zero e isso acontece por meio das redações de seis páginas. Elas são documentos detalhados que explicam uma estratégia ou iniciativa por meio de uma narrativa. Não há apresentações de slides nas reuniões da Amazon.

 

Em geral, a primeira metade da reunião é gasta com a leitura do documento e a segunda metade envolve a busca por fragilidades. Para ter sucesso na Amazon, é preciso usar dados para provar um ponto de vista e articular as ideias de maneira que os outros possam entender. Mais do que isso, é preciso criar um documento que qualquer pessoa, presente ou não na reunião, possa compreender – um exemplo forte de gestão do conhecimento.

 

Uma grande parte do universo de Data Science gira ao redor de artigos científicos. Logo, é natural essa importância das redações de seis páginas na Amazon. Pesquisas devem ser documentadas por diversas razões. Entre delas, o trabalho é usualmente feito em equipe. Portanto, é fundamental acompanhar todas as etapas para chegar a uma solução. Além disso, é preciso ser capaz de capturar e compartilhar esse conhecimento com outras pessoas da equipe ou fora da empresa.

 

Uma das habilidades mais importantes que um profissional de machine learning deve ter é ser capaz de comunicar o que está fazendo, como reproduzir e qual é o valor que esse trabalho oferece.


advertising-amazon-amazon-seo-907607.jpg

Ser engenhoso

 

Do lado de fora, a Amazon parece ser uma grande organização com recursos quase ilimitados. Na realidade, os grupos em cada departamento são geralmente pequenos. Tão pequenos que, de fato, às vezes são insuficientes. Espera-se que os grupos funcionem de maneira enxuta e gerenciem recursos limitados adequadamente. Na maioria das vezes, o mesmo profissional acaba assumindo funções variadas.

 

Embora um grupo possa obter mais recursos, um princípio básico da Amazon é fazer mais com menos. Para ter sucesso, é preciso fazer o melhor com o que se tem e ser criativo para alcançar os objetivos finais. Existe até um princípio chamado “viés de ação”, que permite que regras sejam alteradas para que algo seja concluído – desde que seja para o bem da meta final.

 

No trabalho com machine learning, o gerenciamento de recursos desempenha um papel fundamental em qualquer experimento. Uma quantidade de tempo gigantesca é gasta em cada treinamento de dados. Por exemplo, é necessário encontrar maneiras criativas de equilibrar recursos locais e recursos na nuvem. Equipes menores precisam compartilhar recursos e manter custos baixos. É um equilíbrio delicado.

 

Resumidamente

 

Jesse Freeman afirma que uma das razões que o levou do desenvolvimento de jogos para o machine learning foram os desafios diários de Data Science. Por exemplo, como gerenciar vários experimentos ao mesmo tempo, lidar com grandes conjuntos de dados e administrar a carga de trabalho de maneira produtiva.

 

Independente do nível de automatização da sua empresa, esses desafios são comuns a muitas áreas de negócios. Como você poderia incluir a cultura da Amazon – ser data-driven, escrever redações de seis páginas e ser engenhoso – no seu dia a dia?