Is web scraping legaal? Wat je moet weten

Web scraping is een van de meest gebruikte methoden om gegevens te verzamelen, maar de legaliteit ervan is nog steeds een veelbesproken onderwerp. Is web scraping legaal? Hoewel het antwoord niet zo eenvoudig is, kijken we in deze post naar wat web scraping is, de juridische implicaties en best practices. Laten we erin duiken!

Wat is web scraping?

Web scraping (of dataschrapen): wat het is en hoe het werkt

Bij web scraping worden gegevens van een website gehaald, waarna de verzamelde informatie wordt geëxporteerd in een formaat dat bruikbaarder is voor de gebruiker.

In meer technische termen gebruikt de scraper de HTML-, CSS- of JavaScript-code/elementen van een webpagina en extraheert alle aanwezige gegevens of selecteert enkele specifieke waardevolle gegevens. Met web scraping kun je je zelfs richten op specifieke informatie (bijvoorbeeld een Amazon pagina scrapen voor prijzen, maar niet voor productbeoordelingen).

🔍 Over het algemeen wordt web scraping gedaan via speciale en geautomatiseerde tools die sneller werken dan web scraping handmatig doen.

Voorbeelden van web scraping

Hoewel je bij web scraping ontwikkelaars nodig hebt omdat het nogal technisch kan worden, is het een waardevol hulpmiddel voor onderzoekers, journalisten, academici en meer.

Web scraping kan worden gebruikt voor:

Marktonderzoek (d.w.z. analyse van concurrenten op productgegevens van e-commercesites zoals Amazon of eBay);
Prijsbewaking (d.w.z. aandelenkoersen);
Nieuws volgen;
Winkelzoekers, sportstatistieken, enz. verzamelen.

Is web scraping legaal?

De legaliteit van web scraping

Net als de meeste mensen die onderzoek doen naar dit onderwerp, vraag je je misschien af: is het schrapen van gegevens legaal? Word helaas niet te enthousiast, het hele onderwerp blijft een grijs gebied.

Web scraping is over het algemeen toegestaan waar:

de geëxtraheerde gegevens openbaar toegankelijk zijn; en
de verzamelde informatie wordt niet beschermd door een login.

In het algemeen moet je bij verantwoord web scraping voorzichtig zijn met de toepasselijke Servicevoorwaarden, auteursrechtelijk beschermde gegevens en persoonlijke gegevens (omdat persoonlijke gegevens meestal worden beschermd door privacywetten).

🔍 Bekijk onze gedetailleerde gids over wat in de belangrijkste privacywetten als persoonlijke informatie wordt beschouwd.

Dataschrapen onder privacywetgeving

De belangrijkste privacywetten tot nu toe in de EU (de GDPR) of in de VS (de CPRA) zijn gericht op het beschermen van persoonlijke gegevens van gebruikers en het vaststellen van een kader voor het gebruik van deze gegevens.

Ze verwijzen niet naar web scraping en stellen ook niet dat het illegaal is. Ze reguleren echter het verzamelen van persoonlijke gegevens door bedrijven en wat ze ermee mogen doen. In het kort – want ja, de wet is veel ingewikkelder dan dat! – gaat het meestal om:

uitdrukkelijke toestemming van de betrokkenen;
persoonlijke gegevens alleen voor specifieke doeleinden verzamelen;
gebruikers informeren over welke gegevens worden verzameld, hoe dat gebeurt en wat hun rechten zijn.

🔍 Kortom, als jouw web scraping activiteiten het scrapen van persoonlijke informatie inhouden, moet je ervoor zorgen dat je voldoet aan de privacywetgeving.

💡 Weet je niet zeker welke privacywetgeving eigenlijk op jou van toepassing is?

🚀 Doe deze gratis quiz van 1 minuut om erachter te komen!

Begeleiding garanderen

Hoewel deze richtlijnen afkomstig zijn van de Italiaanse Garante, zijn de suggesties nuttig voor alle landen.

In mei 2024 publiceerde de Garante een leidraad met instructies voor het verdedigen van online gepubliceerde persoonsgegevens door publieke en private entiteiten als gegevensbeheerders tegen web scraping in de context van generatieve AI-training. De Garante stelt een aantal concrete maatregelen voor:

het creëren van gereserveerde gebieden, die alleen toegankelijk zijn na registratie, zodat gegevens niet openbaar beschikbaar zijn;
het opnemen van anti-scraping clausules in de servicevoorwaarden van websites of online platforms;
het monitoren van verkeer naar webpagina’s om abnormale stromen van inkomende en uitgaande gegevens te identificeren (een voorbeeld van een geschikte maatregel is het beperken van netwerkverkeer en het aantal toegangsverzoeken door alleen die van bepaalde IP-adressen te selecteren); en
de implementatie van specifieke maatregelen tegen bots met behulp van bepaalde technologische oplossingen (bijv.: ingrijpen in het robots.txt-bestand; CAPTCHA-controles inbouwen; HTML-markup periodiek aanpassen; inhoud of gegevens ter voorkoming van scraping-activiteiten opnemen in multimedia-items zoals afbeeldingen).

Door het nemen van deze maatregelen, hoewel ze niet uitputtend zijn in methode of resultaat, kunnen beheerders van websites en online platforms de effecten van scraping gericht op het trainen van generatieve kunstmatige intelligentie algoritmen beperken.

Uitspraken uit het verleden en veelvoorkomende gevallen

Enkele opmerkelijke gevallen waarin web scraping illegaal is en waarvan je op de hoogte moet zijn, zijn individuen of bedrijven die misbruik maken van web scraping en de Servicevoorwaarden of auteursrechtnormen schenden.

📌 Uitspraak van het Amerikaanse Ninth Circuit of Appeals Court – LinkedIn vs. HiQ

LinkedIn heeft een rechtszaak aangespannen om een concurrent, HiQ, ervan te weerhouden persoonlijke informatie van de openbare LinkedIn-profielen van gebruikers te schrapen.
In 2020 werd in de uitspraak vastgesteld dat de CFAA niet was geschonden omdat de gegevens die van LinkedIn waren gehaald openbaar waren (niet achter een wachtwoordmuur).

Clearview AI Fijn

Het gezichtsherkenningsbedrijf heeft een zware boete gekregen voor het schrapen van miljoenen foto’s van gezichten van mensen van sociale media.
Er werd verklaard dat Clearview AI gevoelige gegevens verwerkte zonder geldige rechtsgrondslag. Lees het hele verhaal op onze blog.

Dit moet je doen

Als een web scraper

✅ Wees voorzichtig als je gegevens downloadt van een website waarvoor je moet inloggen, want dit kan betekenen dat je hebt ingestemd met servicevoorwaarden die webschrapen kunnen verbieden.

Controleer de algemene voorwaarden van de website om er zeker van te zijn dat je het contract niet schendt.

✅ Zelfs als het openbaar beschikbare gegevens zijn, controleer dan of de gegevens niet beschermd zijn door auteursrechten. Dit kunnen artikelen, video’s en ontwerpen zijn.

✅ Tot slot, en dat is het belangrijkste, moet je nadenken over de ethiek die erbij komt kijken. Zelfs als een activiteit niet illegaal is, kan deze toch schade of reputatieschade toebrengen aan jou of anderen.

Als website-eigenaar

Je kunt je website beschermen tegen het schrapen van informatie:

🔒 Auteursrecht op je website en schrijf een copyrightclausule;

🔒 Voeg beperkingen voor web scraping toe aan de algemene voorwaarden van je website. Als je dat doet, zorg er dan voor dat de taal specifiek is en verbied derden om informatie te schrapen en te gebruiken voor bijvoorbeeld commerciële doeleinden.

👋 Hier lees je hoe je dit eenvoudig kunt doen met iubenda softwareoplossingen:

🚀 Gebruik de Algemene voorwaarden-generator van iubenda;
🚀 Maak je eigen document met algemene voorwaarden;

🚀creëereen aangepaste clausule of selecteer onze vooraf opgestelde clausules, inclusief clausules over inhoudsrechten;

🚀 Voeg eenvoudig een antischraapbepaling toe: Aanvaardbaar gebruik → Gepersonaliseerde clausule voor aanvaardbaar gebruik (lijst met specifieke verklaringen voor aanvaardbaar/verboden gebruik, diepgaand met voorbeelden en verklaringen) → Voeg een lijst toe met beperkingen voor scraping

🚀 Volg onze instructies om het document snel op je website te installeren!

Maak een document met algemene voorwaarden en bescherm je website

About us

Attorney-level solutions to make your websites and apps compliant with the law across multiple countries and legislations.

www.iubenda.com

Heb je nog vragen?

Volg een van onze gratis webinars Stuur ons een e-mail Live chat

Ontdek het compliance-percentage van je site. Kun je 100% halen?

Stroomlijn je compliancetraject

Templates

Wetgevingen

Gidsen

Integraties

Heb je een project in gedachten?

Documentatie