L’affaire très médiatisée hiQ Labs Inc contre LinkedIn Corporation (qui s’est déroulée aux États-Unis) a mis en lumière les questions juridiques très controversées liées au grattage de données.
Nous savons que vous ne voulez pas vous perdre dans le jargon juridique.
Nous avons donc préparé un résumé facile à lire des points les plus importants de cette décision. Le tribunal s'est rangé du côté du grattoir et a établi que le grattage de données publiques ne constitue pas une violation de la CFAA (Computer Fraud and Abuse Act).
Examinons les détails de l'affaire, ainsi que les conséquences considérables qu'elle a laissées.
Le Web Scraping est-il légal ?
Qu'a dit le web scraper lorsqu'on l'a interrogé sur sa stratégie juridique ? "Je plaide le 404e."
Si vous débutez dans la récupération de données, vous êtes probablement préoccupé par la légalité de vos actions.
La bonne nouvelle est que vous n'êtes pas seul. Tous les grattoirs (je pense ?) se sont posé la même question.
La mauvaise nouvelle est que la réponse n’est pas si simple. Comme les rencontres, cela refuse tout simplement d’être simple.
Le Web scraping se situe dans une zone grise et peut être une pratique ambiguë.
Bien sûr, les entreprises veulent préserver leurs données, mais d’un autre côté, si elles sont accessibles au public, pourquoi est-il mal de les collecter ?
Or, quelle est la position de la loi sur ce sujet très controversé ? Examinons le cas le plus médiatisé de hiQ Labs contre LinkedIn pour voir si nous pouvons obtenir des réponses.
Le verdict : la récupération de données n'est pas illégale
En 2022, la Cour d'appel du neuvième circuit a finalement rendu sa décision et s'est rangée du côté de hiQ Labs. Le tribunal a jugé que la suppression de données accessibles au public ne constitue pas une violation de la CFAA, même si cela va à l'encontre des conditions d'utilisation du site Web.
LinkedIn tentait d'empêcher les robots de hiQ de récupérer les données des profils publics de ses utilisateurs. Mais le Neuvième Circuit a été clair : donner à une entreprise le monopole total des données qu'elle ne possède pas (puisqu'elle est autorisée) serait préjudiciable à l'intérêt public.
Un périmètre limité pour le CFAA
En termes beaucoup plus simples, le Neuvième Circuit a établi que les entreprises n’ont pas carte blanche pour décider qui peut collecter et utiliser les données publiques.
Il ne faut pas interpréter la CFAA de manière aussi large, car elle ferait de presque n'importe qui un criminel.
Selon cette décision, la CFAA ne criminalise que l'accès non autorisé à des informations privées et protégées.
En résumé : les sites Web ne peuvent plus utiliser le CFAA pour empêcher la collecte de données non autorisée. Et ils ne peuvent pas non plus utiliser d’outils juridiques contre les scrapers.
Données publiques ou données privées : examen des problèmes de légalité
Les préoccupations juridiques liées au grattage de données se déplacent désormais vers la distinction entre données publiques et privées.
Donc, pour votre commodité, j'ai préparé une courte aide-mémoire que vous devez suivre lorsque vous envisagez de récupérer des données :
- Les données sont-elles disponibles gratuitement ? Vous êtes probablement en sécurité.
- Les données sont-elles disponibles uniquement pour les propriétaires ? Cela pourrait entraîner des problèmes
Facile, non ?
Mais il y a d’autres facteurs que nous devons prendre en compte…
Même si les données récupérées sont accessibles au public, vous devez toujours prendre en compte les contrats, les droits d'auteur et les lois, comme le RGPD si vous êtes dans l'UE.
Il existe également des considérations éthiques au-delà de la simple légalité, comme respecter les instructions du fichier robots.txt et éviter de surcharger les serveurs, pour n'en nommer que quelques-unes. Ce n’est pas parce que quelque chose est « légal » qu’il est immédiatement correct.
Un feu vert pour les Web Scrapers ?
Même si au début vous pensez peut-être que la décision en faveur de hiQ est une victoire pour les web scrapers, cela ne signifie pas que vous avez un ticket ouvert pour le scraping.
Cette affaire restreint l'interprétation de la CFAA et affirme le droit de recueillir des données publiques. Mais il existe d’autres problèmes juridiques liés à la collecte de données que nous devons éviter.
Par exemple, si pour récupérer des données, vous créez un compte utilisateur, vous pouvez avoir des problèmes car vous avez accepté les conditions de service. Même si la CFAA ne s’applique pas, on peut être en rupture de contrat. Quel contrat, demandez-vous ? Eh bien, lorsque vous créez un compte utilisateur sur un site Web, vous devez généralement accepter leurs conditions d'utilisation.
Enfin, LinkedIn a obtenu une injonction permanente, ce qui signifie en anglais qu'il a obtenu de hiQ de renoncer au scraping dans le cadre de l'accord conclu. C’était donc aussi en quelque sorte une victoire pour LinkedIn.
PS : Gardez à l’esprit que la suppression de données protégées par le droit d’auteur, telles que des articles, des vidéos et des images, peut porter atteinte aux droits de propriété intellectuelle, que les données soient ou non accessibles au public.
Implications juridiques du Web Scraping : le résultat final
"Scraper ou ne pas gratter - telle est la question", comme dirait Hamlet - s'il était né en 1998. Blague à part, des cas comme hiQ vs LinkedIn nous aident à obtenir des indications sur la légalité du web scraping.
Il est hautement improbable que la suppression de données publiques vous amène à enfreindre la CFAA.
Cependant, certaines pratiques peuvent entraîner des conséquences juridiques, comme le non-respect des ordonnances de cessation et d'abstention, la violation des accords d'utilisation et même la création de faux comptes.
Le procès LinkedIn contre hiQ, vieux de six ans, est peut-être terminé, mais la guerre contre le grattage de données est toujours en cours. Les entreprises essaieront de protéger leurs données, et nous savons tous à quel point les lobbyistes sont puissants aux États-Unis.
Dans l’UE, cependant, le lobbying n’est peut-être pas un problème aussi grave. Au lieu de cela, pour une raison quelconque, ils ont misé tout sur la confidentialité, et je suis presque sûr que les lois du RGPD pourraient avoir quelque chose à dire sur l'utilisation du web scraping.
Malgré ces défis, nous savons tous que les grattoirs vont gratter.
Clause de non-responsabilité:
A) Pas de conseils juridiques. Cet article a été rédigé à des fins éducatives et de divertissement.
B) Bien que l'affaire hiQ vs LinkedIn ait créé un précédent, elle ne donne pas une liberté illimitée.
C) Les lois sur la protection des données comme le RGPD dans l'UE auront la priorité sur un cas américain.
D) Les lois de votre pays peuvent être totalement différentes de ce qui est mentionné dans ce texte.
E) Je ne suis pas avocat, je n'ai aucune idée de ce que je fais.
Les références:
López de Letona, Javier Torre de Silva et. « Le droit de récupérer des données sur Internet : de l'affaire américaine hiQLabs, Inc. contre LinkedIn Corp. aux affaires de grattage ChatGPT : différences entre le droit américain et le droit européen. Revue mondiale du droit de la vie privée (2024) https://doi.org/10.54648/gplr2024001
Sobel, Benjamin. "HiQ contre LinkedIn, Clearview AI et une nouvelle loi commune du Web Scraping." (2020). https://dx.doi.org/10.2139/ssrn.3581844