Um dos grandes atrativos da Data Science é transformar dados corporativos brutos em informações e ativos úteis para tomadas de decisões. Melhor ainda é quando os dados contam as histórias que estão escondidas atrás dos números.
Gráficos, painéis e dashboards são bonitos, mas mesmo com dados bem selecionados pode existir a dificuldade de criar uma narrativa eficaz que impacte clientes, investidores ou o board da própria empresa. É como se os dados fossem um idioma a parte e seja necessário traduzi-los para a língua nativa do ouvinte.
O storytelling é uma habilidade que pode ser desenvolvida pelos profissionais de dados para tornar seu trabalho de melhor absorção para quem não é da área e valorizar o trabalho técnico por trás dos códigos e algoritmos.
Miro Kazakoff, professor do mestrado em Análise de Negócios do MIT Sloan, disse em entrevista ao blog do MIT que:
“Se você deseja que as pessoas tomem as decisões certas com os dados, você deve entrar na cabeça delas da maneira que elas entendam. Ao longo da história humana, a maneira de fazer isso tem sido com as histórias”.
Variação nos números de ticket de suporte, queda nas vendas, por exemplo, não fornecem informações sobre toda a história e podem significar muita coisa. A queda nas vendas pode ser por conta dos impactos da pandemia, ou por causa de um time de vendas com baixa performance ou ainda pela proposta da concorrência. A questão é: qual a história contida atrás disso?
Como construir um storytelling
Essa habilidade envolve um exercício de empatia, de se colocar no lugar de quem está ouvindo e procurar pensar com a cabeça dele: qual informação é importante para ele? Qual problema ele está querendo resolver que esses dados podem ajudar? Se eu tivesse sentado, me ouvindo, e ele estivesse apresentando no meu lugar, o que eu gostaria que ele contasse? Uma dica aqui é focar menos no processo, menos no “como” você ou sua equipe chegou lá, e mais nas respostas que os dados trazem e nas verdades que eles revelam.
É possível pensar em questões como: por que eles deveriam se importar com as suas descobertas? O que os motiva? E principalmente: quais ações você recomenda que sejam tomadas a partir disso, quais os próximos passos e os resultados esperados com estas ações? E estas respostas vão depender de quem estiver te ouvindo.
Por exemplo, o mesmo projeto pode ter apresentações diferentes para o Diretor de Vendas e para o Diretor de Produção. Enquanto Vendas quer saber quais mercados abrir unidades de negócio, o de produção vai desejar saber o quanto ele precisa aumentar a equipe para dar conta da demanda. Mesmos dados, objetivos diferentes, argumentos diferentes na história.
Um cuidado para construir uma boa narrativa em cima de dados é não injetar vieses, opiniões pessoais ou distorcê-los para que contem a história que mais lhe favoreça ou que atenda mais o objetivo ou hipótese do projeto. É necessário imprimir certa neutralidade no assunto, para não distorcer as interpretações. É como um exercício de um jornalista que não pode se envolver emocionalmente e nem deixar suas preferências pessoas influenciarem a notícia que está apresentando. Pense em quando está assistindo uma reportagem: você não espera ver a opinião do repórter, mas que ele apresente os fatos como eles são, certo? Uma apresentação baseado em dados pode seguir o mesmo princípio.
Outra dica importante é: menos é mais. Para contar uma boa história com dados que não se torne pesada e chata, limite seu foco de abordagem em um ou dois pontos-chave. Excesso de informações pode gerar confusão ou dificultar o entendimento do que é essencial. Portanto, procure eliminar informações desnecessárias. Por mais que seja tentador compartilhar muitos insights de uma vez, seu público pode não retê-los e sua história perder o impacto.
Data Visualization
Uma habilidade que agrega muito valor às narrativas é o aspecto visual, que deixa os dados mais visuais e fáceis de serem digeridos. É o que se chama de Data Visualization.
A importância disso se torna enorme na medida em que a grande maioria das expressões concretas do trabalho de dados vem na forma de gráficos e dashboards descritivos. Então, de alguma forma, você precisa contar uma história por meio de barras, linhas, pizzas e outros formatos menos convencionais. Toda decisão que você faz na construção de um desses gráficos pode ajudar a contar uma história mais ou menos interessante.
Para ficar mais claro, vamos tomar como exemplo apenas um gráfico, que vimos em um artigo da Ana Elisa Renault publicado no Medium.
É um gráfico sobre os horários e dias da semana com mais nascimentos de bebês. Mas é confuso, certo? Você provavelmente passou por ele sem entender muito bem o que enxergar nas barras. Ocorre que informações demais concorrem pela nossa atenção e nos distarem dos dados que realmente importam.
Essas são algumas alterações que podem ser realizadas do ponto de vista da visualização de dados para tornar o gráfico mais atrativo.
1. Remova a borda do gráfico, já que não acrescenta nenhum valor informativo.
2. Delete as grades, já que o público não vai tocar fisicamente nos eixos x e y do gráfico para identificar o valor exato que eles representam. Se esse nível de detalhe for muito importante é melhor rotular os pontos específicos;
3. Poupe o uso de rótulos. Utilize-os em casos onde os valores exatos são importantes para a plateia. Caso contrário, remova-os e utilize eixos.
4. Deixe as barras mais finas. As barras devem ser mais largas do que o espaço em branco entre ela para comparar com mais facilidade. O espaço em branco é supérfluo e pode ser reduzido.
5. Use títulos de forma apropriada. Coloque título no gráfico para permitir o entendimento antes de avançar para os dados e diminuir o trabalho de quem vai visualizar e não sabe do que se trata. Se houver uma conclusão que o público deve alcançar, diga em palavras chamativas no título. O óbvio precisa ser dito!
6. Ajuste os textos descritivos. No eixo y é melhor utilizar um título mais específico, como “% do total de nascimentos”, e no eixo x, o texto na diagonal é mais difícil de ler. Podemos abreviar os dias da semana para que eles sejam apresentados horizontalmente. Uma categoria superior (como dia da semana ou final de semana) também pode simplificar o processo de coleta de informações.
7. Deixe a legenda exatamente ao lado dos dados que ela descreve. Isso facilita o trabalho de ter que ficar consultando a legenda antes dos dados.
8. Use cores com moderação. Há tantas cores neste gráfico que nossa atenção é dispersa e acaba ficando difícil focar em qualquer coisa. Dependendo do que queremos que o público tire do gráfico, podemos usar a cor de maneira mais eficaz para concentrar a atenção apenas nessas partes.
Aplicando estas melhorias, vejamos como o gráfico fica:
Agora, podemos ver com mais facilidade que os bebês nascidos em um final de semana têm maior probabilidade de nascer nas primeiras horas do dia (entre meia noite e seis horas), em comparação com os nascimentos nos dias da semana.
Claro que esse conjunto de dados não incluiu o número absoluto de bebês nascidos a cada dia. Idealmente, gostaríamos dessas informações por contexto, mas, para os fins deste exemplo ilustrativo, vamos supor que os números são grandes o suficiente para serem comparados com precisão nos dias da semana.
Ao organizar o gráfico, otimizamos o trabalho do público, que pode focar em decidir quais ações potenciais podem ser necessárias, em vez de tentar descobrir como ler o gráfico.
Este exemplo é relativo a um gráfico, que pode ser apenas uma parte de uma narrativa que os dados podem contar. Porém, serve para ilustrar o poder que a Data Visualization possui e o quanto ela pode influenciar em uma apresentação para que não seja subestimada. Uma boa história se conta com uma boa visualização de dados. E uma boa visualização de dados revela uma boa história atrás de seus dados.