Iubenda logo
Crie Agora

Documentação

Tabela de conteúdos

A raspagem da web é legal? O que precisa de saber

A raspagem da Web é um dos métodos mais comuns de recolha de dados, mas a sua legalidade continua a ser um tema muito debatido. Então, a raspagem da web é legal? Embora a resposta não seja tão simples, neste post damos uma vista de olhos ao que é a raspagem da web, as suas implicações legais e as suas melhores práticas. 👀 Vamos mergulhar!

is web scraping legal

O que é a raspagem da web?

Raspagem da Web (ou raspagem de dados): o que é e como funciona

A raspagem da Web implica a extracção de dados de um website, a informação recolhida é então exportada num formato que é mais útil para o utilizador.

Em termos mais técnicos, o raspador utiliza o código/elementos HTML, CSS ou JavaScript de uma página web e extrai todos os dados presentes ou selecciona alguma informação específica de valor. De facto, o raspador da web permite visar informação específica (ou seja, raspar uma página da Amazon para preços mas não para revisões de produtos).

🔍 Em geral, a raspagem da web é feita através de ferramentas dedicadas e automatizadas que funcionam mais rapidamente do que a raspagem manual da web.

Exemplos de raspagem da web

Embora a raspagem da web envolva desenvolvedores, uma vez que pode tornar-se bastante técnica, é uma ferramenta valiosa para investigadores, jornalistas, académicos, e muito mais.

A raspagem da web pode ser utilizada:

  • Estudos de mercado (ou seja, análise de concorrentes sobre dados de produtos de sites de comércio electrónico como a Amazon ou eBay);
  • Monitorização de preços (ou seja, preços de acções)
  • Monitorização de notícias;
  • Recolha de localizadores de lojas, estatísticas desportivas, etc.

A raspagem da web é legal?

A legalidade da raspagem da web

Tal como a maioria das pessoas que investigam este tópico, poderá estar a perguntar-se: será a raspagem de dados legal? Não se entusiasme demasiado, infelizmente, todo o assunto continua a ser uma área cinzenta.

A raspagem da web é geralmente permitida onde:

  • os dados extraídos são dados publicamente disponíveis; e
  • a informação recolhida não é protegida por um login.

Em geral, a raspagem responsável da web requer que você seja cauteloso quanto à aplicação Termos de serviço, dados protegidos por direitos autorais e dados pessoais (pois os dados pessoais são normalmente protegidos por leis de privacidade).

🔍 Veja nosso guia detalhado em o que é considerado informação pessoal através das principais leis de privacidade.

Raspagem de dados ao abrigo das leis de privacidade

As principais leis de privacidade até o momento na UE (o GDPR) ou nos EUA (o CPRA) visam proteger os dados pessoais do usuário e estabelecer uma estrutura para como esses dados podem ser usados.

Não se referem à raspagem da web ou declaram que é ilegal. No entanto, regulam a recolha de dados pessoais pelas empresas e o que podem fazer com eles. Em resumo – porque sim, a lei é muito mais complicada do que isso! – geralmente envolve:

  • receber o consentimento explícito dos titulares dos dados;
  • recolha de dados pessoais apenas para fins específicos;
  • informando os utilizadores sobre que dados são recolhidos, como, e os seus direitos.

🔍 Em resumo, se suas atividades de raspagem na web envolvem a raspagem de informações pessoais, você deve certificar-se de que está em conformidade com as leis de privacidade de dados.

💡 Não tenho certeza de quais leis de privacidade actualmente se aplicam a você?

🚀 Faça este questionário gratuito de 1 minuto para descobrir!

Decisões passadas e casos comuns

Alguns casos dignos de nota em que a raspagem da web é ilegal e de que deve estar ciente incluem indivíduos ou empresas que abusam da raspagem da web e violam os Termos de Serviço ou as normas de direitos de autor.

📌 Acórdão do Tribunal de Recurso da Nona Circunscrição dos EUA – LinkedIn vs. HiQ

O LinkedIn trouxe uma batalha para impedir um concorrente, HiQ, de raspar informações pessoais dos perfis públicos dos usuários do LinkedIn.
Em 2020, a decisão estabeleceu que o CFAA não foi violado já que os dados raspados do LinkedIn eram públicos (não atrás de um muro de senhas).

📌 Clearview AI Fine

A empresa de reconhecimento facial ganhou uma pesada multa por ter raspado milhões de imagens de rostos de pessoas das redes sociais.
Foi declarado que Clearview AI estava processando dados sensíveis sem uma base legal válida. Ler a história completa em nosso blog.

O que precisa de fazer

Como um raspador de web

✅ Tenha cuidado se descarregar dados de um website que requeira o início de sessão, pois isto pode significar que concordou com os Termos de Serviço que podem proibir as actividades de raspagem da web.

✅ Certifique-se de verificar os Termos e Condições do website para garantir que não está a violar o contrato.

✅ Mesmo que sejam dados publicamente disponíveis, certifique-se de que os dados não estão protegidos por direitos de autor. Isto pode incluir artigos, vídeos, desenhos.

✅ Finalmente, e o mais importante, considerar a ética envolvida. Mesmo que uma actividade não seja ilegal, pode causar-lhe danos ou danos à reputação ou a terceiros.

Como proprietário de um website

Para proteger o seu sítio web de ter a sua informação raspada, pode:

🔒 Direitos autorais de seu website e escreva uma copyright clause;

🔒 Deve adicionar restrições de raspagem da web ao documento de Termos e Condições do seu sítio web. Ao fazê-lo, certifique-se de que a linguagem é específica e proíba terceiros de raspar informação e utilizá-la para fins comerciais, por exemplo.

👋 Veja como fazer isso facilmente com as soluções de software iubenda:

🚀 Use iubenda’s Gerador de términos e condições;
🚀 Crie seu documento de Termos e Condições personalizado;
🚀 Selecione nossas cláusulas pré-elaboradas (direitos autorais, etc.) ou crie uma cláusula personalizada;
🚀 Siga nossas instruções para instalar rapidamente o documento em seu website!

Crie seu documento de Termos e Condições e proteja seu website

Comece agora

About us

iubenda

Attorney-level solutions to make your websites and apps compliant with the law across multiple countries and legislations.

www.iubenda.com