Web scraping is een van de meest gebruikte methoden om gegevens te verzamelen, maar de legaliteit ervan is nog steeds een veelbesproken onderwerp. Is web scraping legaal? Hoewel het antwoord niet zo eenvoudig is, kijken we in deze post naar wat web scraping is, de juridische implicaties en best practices. Laten we erin duiken!
Bij web scraping worden gegevens van een website gehaald, waarna de verzamelde informatie wordt geëxporteerd in een formaat dat bruikbaarder is voor de gebruiker.
In meer technische termen gebruikt de scraper de HTML-, CSS- of JavaScript-code/elementen van een webpagina en extraheert alle aanwezige gegevens of selecteert enkele specifieke waardevolle gegevens. Met web scraping kun je je zelfs richten op specifieke informatie (bijvoorbeeld een Amazon pagina scrapen voor prijzen, maar niet voor productbeoordelingen).
🔍 Over het algemeen wordt web scraping gedaan via speciale en geautomatiseerde tools die sneller werken dan web scraping handmatig doen.
Hoewel je bij web scraping ontwikkelaars nodig hebt omdat het nogal technisch kan worden, is het een waardevol hulpmiddel voor onderzoekers, journalisten, academici en meer.
Web scraping kan worden gebruikt voor:
Net als de meeste mensen die onderzoek doen naar dit onderwerp, vraag je je misschien af: is het schrapen van gegevens legaal? Word helaas niet te enthousiast, het hele onderwerp blijft een grijs gebied.
Web scraping is over het algemeen toegestaan waar:
In het algemeen moet je bij verantwoord web scraping voorzichtig zijn met de toepasselijke Servicevoorwaarden, auteursrechtelijk beschermde gegevens en persoonlijke gegevens (omdat persoonlijke gegevens meestal worden beschermd door privacywetten).
🔍 Bekijk onze gedetailleerde gids over wat in de belangrijkste privacywetten als persoonlijke informatie wordt beschouwd.
De belangrijkste privacywetten tot nu toe in de EU (de GDPR) of in de VS (de CPRA) zijn gericht op het beschermen van persoonlijke gegevens van gebruikers en het vaststellen van een kader voor het gebruik van deze gegevens.
Ze verwijzen niet naar web scraping en stellen ook niet dat het illegaal is. Ze reguleren echter het verzamelen van persoonlijke gegevens door bedrijven en wat ze ermee mogen doen. In het kort – want ja, de wet is veel ingewikkelder dan dat! – gaat het meestal om:
🔍 Kortom, als jouw web scraping activiteiten het scrapen van persoonlijke informatie inhouden, moet je ervoor zorgen dat je voldoet aan de privacywetgeving.
Hoewel deze richtlijnen afkomstig zijn van de Italiaanse Garante, zijn de suggesties nuttig voor alle landen.
In mei 2024 publiceerde de Garante een leidraad met instructies voor het verdedigen van online gepubliceerde persoonsgegevens door publieke en private entiteiten als gegevensbeheerders tegen web scraping in de context van generatieve AI-training. De Garante stelt een aantal concrete maatregelen voor:
Door het nemen van deze maatregelen, hoewel ze niet uitputtend zijn in methode of resultaat, kunnen beheerders van websites en online platforms de effecten van scraping gericht op het trainen van generatieve kunstmatige intelligentie algoritmen beperken.
Enkele opmerkelijke gevallen waarin web scraping illegaal is en waarvan je op de hoogte moet zijn, zijn individuen of bedrijven die misbruik maken van web scraping en de Servicevoorwaarden of auteursrechtnormen schenden.
📌 Uitspraak van het Amerikaanse Ninth Circuit of Appeals Court – LinkedIn vs. HiQ
LinkedIn heeft een rechtszaak aangespannen om een concurrent, HiQ, ervan te weerhouden persoonlijke informatie van de openbare LinkedIn-profielen van gebruikers te schrapen.
In 2020 werd in de uitspraak vastgesteld dat de CFAA niet was geschonden omdat de gegevens die van LinkedIn waren gehaald openbaar waren (niet achter een wachtwoordmuur).
Clearview AI Fijn
Het gezichtsherkenningsbedrijf heeft een zware boete gekregen voor het schrapen van miljoenen foto’s van gezichten van mensen van sociale media.
Er werd verklaard dat Clearview AI gevoelige gegevens verwerkte zonder geldige rechtsgrondslag. Lees het hele verhaal op onze blog.
✅ Wees voorzichtig als je gegevens downloadt van een website waarvoor je moet inloggen, want dit kan betekenen dat je hebt ingestemd met servicevoorwaarden die webschrapen kunnen verbieden.
Controleer de algemene voorwaarden van de website om er zeker van te zijn dat je het contract niet schendt.
✅ Zelfs als het openbaar beschikbare gegevens zijn, controleer dan of de gegevens niet beschermd zijn door auteursrechten. Dit kunnen artikelen, video’s en ontwerpen zijn.
✅ Tot slot, en dat is het belangrijkste, moet je nadenken over de ethiek die erbij komt kijken. Zelfs als een activiteit niet illegaal is, kan deze toch schade of reputatieschade toebrengen aan jou of anderen.
Je kunt je website beschermen tegen het schrapen van informatie:
🔒 Auteursrecht op je website en schrijf een copyrightclausule;
🔒 Voeg beperkingen voor web scraping toe aan de algemene voorwaarden van je website. Als je dat doet, zorg er dan voor dat de taal specifiek is en verbied derden om informatie te schrapen en te gebruiken voor bijvoorbeeld commerciële doeleinden.
👋 Hier lees je hoe je dit eenvoudig kunt doen met iubenda softwareoplossingen:
🚀 Gebruik de Algemene voorwaarden-generator van iubenda;
🚀 Maak je eigen document met algemene voorwaarden;
🚀creëereen aangepaste clausule of selecteer onze vooraf opgestelde clausules, inclusief clausules over inhoudsrechten;
🚀 Voeg eenvoudig een antischraapbepaling toe: Aanvaardbaar gebruik → Gepersonaliseerde clausule voor aanvaardbaar gebruik (lijst met specifieke verklaringen voor aanvaardbaar/verboden gebruik, diepgaand met voorbeelden en verklaringen) → Voeg een lijst toe met beperkingen voor scraping
🚀 Volg onze instructies om het document snel op je website te installeren!
Attorney-level solutions to make your websites and apps compliant with the law across multiple countries and legislations.