备受瞩目的 hiQ Labs Inc 诉 LinkedIn Corporation 案(发生在美国)揭示了备受讨论的数据抓取法律问题。
我们知道您不想迷失于法律术语之中。
因此,我们准备了一份易于阅读的摘要,总结了该判决最重要的几点。法院站在了抓取工具一边,并确定抓取公共数据并不违反 CFAA(计算机欺诈和滥用法案)。
让我们来看看这个案件的具体细节,以及它留下的深远影响。
网页抓取合法吗?
当被问及他的法律策略时,网络爬虫怎么说? “我援引第404号法令。”
如果您是数据抓取方面的新手,您可能会担心自己行为的合法性。
好消息是,你并不孤单。每个爬虫程序(我想是吧?)都有同样的疑问。
坏消息是,答案并不那么简单。就像约会一样,它并不简单。
网络抓取处于灰色地带,并且可能是一种模棱两可的做法。
当然,公司希望保留他们的数据,但另一方面,如果数据是公开的,那么收集它有什么不对呢?
那么,法律对这个备受争议的问题持什么立场呢?让我们深入研究最受关注的 hiQ Labs 诉 LinkedIn 案,看看能否找到一些答案。
结论:抓取数据并不违法
2022 年,第九巡回上诉法院最终作出判决,支持 hiQ Labs。法院认为,抓取公开数据并不构成违反 CFAA,即使这违反了网站的使用条款。
LinkedIn 试图阻止 hiQ 的机器人从其用户的公开资料中抓取数据。但第九巡回上诉法院明确表示:让一家公司完全垄断其不拥有的数据(因为它已获得许可)将损害公众利益。
CFAA 的适用范围有限
用更简单的话来说,第九巡回法院裁定,公司无权自由决定谁可以收集和使用公共数据。
人们不能对《消费者行为评估法》进行如此宽泛的解释,因为这会将几乎所有人视为罪犯。
根据该裁决,CFAA 仅将未经授权访问私人受保护信息定为犯罪。
总而言之:网站不再能使用 CFAA 来防止未经授权的数据收集。他们也不能使用法律工具来对付爬虫。
公共数据与私人数据:审查合法性问题
数据抓取的法律关注点现已转向公共数据和私人数据的区分。
因此,为了您的方便,我准备了一个简短的备忘单,当您计划抓取数据时,您应该遵循它:
- 数据是免费提供的吗?你可能很安全。
- 数据是否仅供业主使用?这可能会带来麻烦
很简单吧?
但是,我们还需要考虑其他一些因素……
即使抓取的数据是公开的,您仍然必须考虑合同、版权和法律,例如如果您在欧盟,则必须考虑 GDPR。
除了合法性之外,还有道德方面的考虑,例如遵守 robots.txt 说明和避免服务器超载等。仅仅因为某件事是“合法的”,并不意味着它就立即正确。
为网络爬虫开绿灯了吗?
尽管一开始你可能认为有利于 hiQ 的裁决对于网络抓取工具来说是一个胜利,但这并不意味着你就拥有了抓取数据的自由。
此案缩小了 CFAA 的解释范围,并确认了收集公共数据的权利。但是,我们还必须避免其他数据抓取法律问题。
例如,如果您为了抓取数据而创建了一个用户帐户,那么您可能会遇到麻烦,因为您已经同意了服务条款。即使 CFAA 不适用,也可能违反合同。您会问,什么合同?好吧,当您在网站上创建用户帐户时,您通常必须同意他们的服务条款。
最后,LinkedIn 获得了一项永久禁令,用英文来说,这意味着它让 hiQ 停止抓取数据,这是他们达成的协议的一部分。所以,这对 LinkedIn 来说也是一种胜利。
附言: 请记住,抓取受版权保护的数据(如文章、视频和图像)可能会侵犯知识产权,无论这些数据是否公开可访问。
网页抓取的法律影响:底线
如果哈姆雷特出生于 1998 年,他就会像哈姆雷特所说的那样:“抓取,还是不抓取——这是个问题”。玩笑归玩笑,hiQ 与 LinkedIn 这样的案例有助于我们获得有关网络抓取合法性的一些指导。
抓取公共数据导致您违反 CFAA 的可能性极小。
然而,有些做法可能会导致法律后果,例如无视停止命令、违反用户协议,甚至创建虚假账户。
持续六年的 LinkedIn 与 hiQ 诉讼案可能已经结束,但数据抓取之战仍在继续。公司将努力保护其数据,我们都知道美国的游说团体有多强大。
然而,在欧盟,游说可能不是什么大问题。相反,无论出于什么原因,他们都全力关注隐私问题,而且我非常肯定,GDPR 法律可能会对网络抓取的使用有所规定。
尽管存在这些挑战,我们都知道抓取工具仍会抓取数据。
免责声明:
A) 并非法律建议。本文仅用于教育和娱乐目的。
B) 虽然 hiQ 与 LinkedIn 案开创了先例,但它并没有给予不受限制的自由。
C) 欧盟的 GDPR 等数据保护法将优先于美国的案件。
D) 您所在国家/地区的法律可能与本文中提到的完全不同。
E) 我不是律师,我不知道自己在做什么。
参考:
López de Letona、Javier Torre de Silva 等。“互联网上数据抓取的权利:从美国 hiQLabs, Inc. 诉 LinkedIn Corp. 案到 ChatGPT 数据抓取案:美国与欧盟法律之间的差异。”《全球隐私法评论》(2024 年) https://doi.org/10.54648/gplr2024001
Sobel,Benjamin。“HiQ 诉 LinkedIn、Clearview AI 以及网络抓取的新普通法。”(2020 年)。 https://dx.doi.org/10.2139/ssrn.3581844