A ética é uma parte fundamental da ciência de dados, e evita que empresas passem por grandes escândalos de vazamentos que marcam a sociedade.
Em uma rápida olhada, pode parecer que ética e ciência de dados não são assuntos com aspectos comuns. Afinal, o primeiro se relaciona ao âmbito social e filosófico, enquanto o segundo trata de engenharia e ciências exatas. Entretanto, é importante assumir que a ética é uma parte essencial em qualquer ramo de atuação, incluindo, é claro, a ciência de dados.
E como aplicar princípios morais à área e como a falta de ética em ciência de dados pode afetar grandes corporações? É isso que você vai entender no artigo a seguir!
A importância da ética em ciência de dados
Atualmente, a ciência de dados está presente nos mais diversos aspectos da sociedade, na gestão de empresas, nas redes sociais, na área médica, no transporte público… Assim, a proteção destes dados é de suma importância, afinal, quando tratados sem a devida ética, podem trazer consequências desastrosas para todos os envolvidos.
No passado, dados protegidos já acabaram se tornando públicos, causando diversos danos às pessoas cujas informações foram disponibilizadas. Podemos facialmente concluir que esses escândalos estão estreitamente ligados à falta de ética e à não adoção de boas práticas para uma computação mais segura. Por isso, é importante que empresas adotem políticas para a segurança de seus sistemas e dos dados, evitando vazamentos.
No Brasil, a ética e a segurança no processamento dos dados vão além das boas práticas, tangem às questões legais. A Lei Geral de Proteção de Dados Pessoais (LGPD), Lei n° 13.709/2018, busca proteger os indivíduos e traz normas para todas as empresas que trabalham com dados, atuando de forma semelhante ao Regulamento Geral de Proteção de Dados (RGPD) vigente na União Europeia.
Por que os cientistas de dados precisam entender a Ética de Dados?
Não apenas cientistas de dados, mas analistas e todos os profissionais que atuam com tecnologia da informação precisam se preocupar com a “ética de dados”. Afinal, são essas pessoas que lidam todos os dias com grandes conjuntos de dados, e é preciso manter esses recursos protegidos e seguros, além de utilizá-los com responsabilidade social.
Além disso, a ética também se mostra fundamental para incorporar valores como justiça e equidade às tecnologias impulsionadas por dados. Em outro artigo, já falamos sobre como sistemas de Inteligência Artificial podem reproduzir discriminações devido aos vieses de seus programadores, confira para entender mais.
Ética e Algoritmos
Algoritmos são naturalmente não neutros. Eles codificam os vieses que os programamos para perceberem – você pode entender um pouco melhor sobre este processo e a reprodução de preconceitos neste artigo sobre Inteligência Artificial e a reprodução de preconceitos e neste outro sobre a subjetividade que causamos aos algoritmos.
Os algoritmos acabam apresentando percalços, como um exemplo que a programadora Kylie Ying traz neste vídeo, em que a Staples Inc. (a maior rede mundial de lojas para escritórios) buscava ultrapassar seus concorrentes, mas o algoritmo se atrapalhou e acabou oferecendo mais ofertas para bairros ricos.
Ying também mostra que os resultados podem induzir ao erro. Na imagem abaixo, é possível perceber que os mesmos dados com diferentes eixos y podem levar a conclusões distintas:
Algumas práticas éticas
Se você deseja ter boas práticas enquanto profissional que trabalha com ciência de dados, podemos citar alguns pontos cruciais para uma atuação pautada na ética:
Tomando decisões
Nunca tome uma decisão sem entrar em contato com o cliente, mesmo que ela seja benéfica ao projeto. Nenhuma escolha pode ser feita em nome dele, salvo quando explicitamente acordado em contrato.
Privacidade e confidencialidade dos dados
Dados pessoais sensíveis são de estrita confidencialidade e é de responsabilidade do cientista de dados protegê-los. Eles só podem ser compartilhados quando houver consentimento, caso contrário, a privacidade deve ser mantida.
Lembrando que, mesmo que um cliente concorde que sua empresa colete, armazene e analise suas informações de identificação pessoal, isso não significa que ele queira que elas sejam tornadas públicas. Isso inclui informações como número de telefone, endereço, nome, documentos de identificação e outros dados básicos.
Assim, é preciso que essas informações fiquem armazenadas em um banco de dados seguro, com todas as medidas de alta segurança, certificando a proteção e privacidade dos indivíduos.
Propriedade dos dados
A ética em ciência de dados assume que o indivíduo tem a propriedade de seus dados. A coleta dessas informações sem o seu consentimento é ilegal e fere a moralidade.
Algumas abordagens para obter essa autorização, são:
-
Acordos escritos;
-
Botões de aceite para termos e condições;
-
Pop-ups para a permissão de cookies.
Boas intenções com dados
Os profissionais devem ser claros quanto às intenções para a coleta e análise de dados. Elas sempre devem ser voltadas para um bom uso, para ações benéficas e que não ferem a moral e a ética.
Transparência
Como citamos anteriormente, os indivíduos são os proprietários dos seus dados, por isso, precisam ter clareza sobre a forma como serão coletadas, mantidas e utilizadas as informações pessoais. As políticas de transparência e documentos que explicam como será feito o tratamento de dados, são boas formas de manter esse processo claro para o usuário.
Exemplos da falta de ética na ciência de dados
Infelizmente, não são poucos os casos em que a ética foi desrespeitada e os dados individuais acabaram se tornando públicos sem o consentimento devido. Abaixo você confere alguns exemplos:
Vazamento de dados do OkCupid
Em 2016, Emil Kirkegaard e Julius Daugbjerg Bjerrekr, compartilharam um conjunto de dados sobre Open Science Framework que incluía informações sobre mais de 70 mil membros do serviço de namoro on-line OkCupid. Os dados incluíam nomes dos usuários (nicknames), idade, religião, gênero e respostas que o site utilizava para descobrir as compatibilidades entre os usuários.
Essas informações foram recolhidas entre novembro de 2014 e março de 2015, mas eram pessoais e anônimas. Kirkegaard e Bjerrekr quase divulgaram as fotos dos usuários, apenas não o fizeram porque esses dados ocupariam muito espaço no disco rígido.
O vazamento fere normas éticas básicas, pois mesmo que os usuários tenham compartilhado as informações no site, isso não indica que seja moral o compartilhamento desses dados.
Violação de dados da Robinhood
Em novembro de 2021, a empresa americana de serviços financeiros, Robinhood, anunciou uma violação de dados que afetou mais de cinco milhões de usuários do aplicativo de negociação. Tratava-se de um caso de roubo de informações causado por problemas de segurança no armazenamento dos dados.
As informações incluíam e-mail, nomes completos, números de telefone e outros dados pessoais.
Um bom exemplo: ciência de dados no combate à Covid-19
O governo sul-coreano utilizou uma metodologia de ciência de dados para controlar os casos de Covid-19 no país. Eles implementaram a análises de surtos em tempo real, melhorando o design do plano preventivo.
Essa análise incorpora dados de sistemas de IoT e IA que sustentam redes reais de cidades inteligentes, bem como dados pessoais fornecidos por pacientes confirmados. Com a análise de Big Data, os pesquisadores acompanham os pacientes, identificam contatos e conseguem montar melhores planos de ação contra a Covid-19.
Um ótimo exemplo de como os dados podem ser usados de forma ética e para um bom propósito.
Em um mundo que utiliza a ciência de dados em tantas áreas da sociedade, a ética se mostra como um importante tópico de discussão. Empresas que trabalham com dados devem seguir preceitos da boa moral para utilizar essas informações, trabalhando, assim, para tomar melhores decisões e contribuir para um futuro melhor.