Web scraping — mocný, ale právne zložitý nástroj
Automatizovaná extrakcia webových dát je efektívnym spôsobom zbierania obchodných informácií: ceny, informácie o produktoch, kontaktné údaje, verejné oznámenia. Ale európske právne prostredie kladie výrazné obmedzenia na to, čo možno legálne zbierať.
Právny rámec
GDPR: extrakcia osobných údajov z webových stránok je spracovaním osobných údajov — vyžaduje právny základ. Autorské právo: obsah webových stránok podlieha autorskému právu. Podmienky použitia: väčšina webových stránok zakazuje automatizovaný zber dát vo svojich podmienkach použitia.
Legálny web scraping
Legálna extrakcia webových dát sa zameriava na: verejné, non-PII informácie, API rozhrania ponúkané samotnými spoločnosťami, zdroje Open Data a crawling rešpektujúci direktívy robots.txt.