Conhecido como Data Scraping ou “raspagem de dados”, a técnica consiste na extração de forma automatizada de dados pessoais em páginas da internet e em bases de dados públicos com objetivo de reutilização de tais dados para outras finalidades.
Normalmente os dados coletados são aqueles de identificação do indivíduo, tais como nome, número de contato, endereço, e-mail, entre outros, e na maioria das vezes são utilizados para envio de comunicação de marketing direto para a venda de produtos ou serviços, ou para a criação de um banco de dados vendido posteriormente a terceiros para propósitos completamente desconhecidos.
Entretanto, é indispensável atentarmos para o fato de que ainda estando os dados disponíveis em espaços públicos online, os mesmos são dados pessoais e as empresas que utilizam esta técnica devem cumprir os princípios básicos de proteção de dados.
O art. 7º da Lei Geral de Proteção de Dados, em seu parágrafo terceiro, dispõe que o tratamento de dados pessoais, cujo acesso é público, deve considerar a finalidade, a boa-fé e o interesse público que justificou a disponibilização dos mesmos, dispensando em seu parágrafo quarto o consentimento do titular, desde que resguardados os direitos do mesmo e os princípios previstos na lei.
Portanto, resta evidente que mesmo os dados tornados voluntariamente públicos pelo indivíduo exigem a observância aos princípios norteadores da Lei Geral de Proteção de Dados.
É possível, tratando-se de dados públicos, a utilização da técnica de web scraping, desde que a sua reutilização esteja amparada por uma das bases legais elencadas nos artigos 7º ou 11º do dispositivo legal, além de observar os fundamentos de proteção de dados do artigo 2º e os princípios norteadores do artigo 6º.
Sendo assim, nas hipóteses de extração de dados pessoais de dados públicos para novas finalidades é imprescindível que sejam respeitados os propósitos legítimos e específicos para o novo tratamento e a preservação dos direitos do titular sob pena de se tornarem ilícitos e, consequentemente, aptos a atrair as sanções aplicáveis pela Autoridade Nacional de Proteção de Dados.
Dados públicos não são um cheque em branco, passíveis de serem utilizados ao bel-prazer dos controladores.
O Regulamento de Proteção de Dados da União Europeia, em seu art. 14º, dispõe que quando os dados pessoais não forem obtidos diretamente do titular, o responsável pelo tratamento deverá fornecer ao mesmo as informações relacionadas nos parágrafos 1º ao 5º, incluindo, entre estes, os fins do tratamento a que se destinam bem como a base jurídica para o tratamento.
Nessa linha, a Autoridade Francesa de Proteção de Dados (Commission Nationale de l' Informatique - CNIL) publicou em abril de 2020 orientações acerca da extração de dados pessoais de usuários da web por ferramentas de web scraping.
Na referida orientação, a autoridade recomendou que as empresas antes de executar essas ferramentas devem verificar a natureza e a origem dos dados que serão extraídos, a minimização da coleta de dados, evitando a coleta de informações irrelevantes e excessivas. Salientou expressamente que as empresas que utilizam essa técnica para o envio de marketing direto devem comunicar ao titular na primeira comunicação estabelecida.
A realização de uma avaliação de impacto à proteção de dados também é recomendável em alguns casos como demonstração de uma boa prática por parte do controlador. A elaboração de um contrato entre controlador e fornecedor, estabelecendo as obrigações e responsabilidades de ambos, também se faz necessária.
Entretanto, há outra modalidade de web scraping, que se desenvolve em um ambiente não autorizado, a exemplo das plataformas de redes sociais, as quais expressamente proíbem em seus termos de uso a coleta de dados, configurando-se em uma violação contratual.
Nestes casos, estamos diante de uma atividade claramente ilícita por parte de quem os coletou, tendo em vista a proibição da prática por parte do controlador e sem qualquer finalidade e base legal autorizadora do tratamento de dados.
Ao que parece, o uso de dados públicos através da técnica de scrape, pela qual um software é capaz de baixar informações de um site, removendo-as e formando um novo banco de dados, tem se tornado uma prática comum e preocupante pelo potencial de risco à violação da privacidade e à privacidade dos dados.
Em abril do corrente ano, um aplicativo de mídia social sofreu um vazamento de dados através de um download automatizado de informações públicas dos usuários. A remoção dessas informações aparentemente foi facilitada pelo fato de que o app usou em seu banco de dados numeração sequencial na criação de perfis dos usuários, bastando que os IDs dos usuários fossem copiados através de um acesso a uma API privada do aplicativo.
Uma rede social de trabalhos também foi alvo de vazamento de dados através de “raspagem de dados” e que culminou com a oferta de venda de mais de 700 milhões de usuários em um fórum hacker, tendo o cibercriminoso exibido uma amostra com informações de aproximadamente um milhão de usuários da rede social.
A rede social manifestou-se no sentido de que as investigações pertinentes ainda estão em curso, mas ao que tudo indica não haveria qualquer violação de dados por parte do aplicativo, uma vez que aparentemente a coleta de dados teria ocorrido através da técnica denominada web scraping e os dados copiados seriam informações tornadas públicas pelos usuários.
Impõe-se neste contexto analisar a responsabilidade dos controladores sob a luz da Lei Geral de Proteção de Dados e do Código de Defesa do Consumidor com relação aos eventos mencionados.
Tanto pela ótica do art. 14º do CDC, que estabelece a responsabilidade objetiva pela falha na prestação do serviço do prestador, como pela interpretação dos arts. 44º e 46º da Lei Geral de Proteção de Dados, que dispõem que o tratamento será irregular quando este não fornecer a segurança que o titular espera, sendo os agentes de tratamento responsáveis por adotar e implementar medidas de segurança aptas a proteger os dados pessoais.
Desde a concepção do serviço até a sua execução, a conclusão natural parece apontar para a responsabilização dos controladores por não terem proporcionando as condições de segurança necessárias para impedir a coleta dos dados por meio de ferramentas de automação de extração de informações, mesmo que públicas.
Afinal, usuários das redes sociais não autorizaram a coleta de seus dados pessoais para quaisquer outras finalidades que não as relacionadas ao uso dos respectivos aplicativos.
Fonte: Martha Leal, advogada especialista em Privacidade e Proteção de Dados