抓取合法性

备受瞩目的 hiQ Labs Inc 诉 LinkedIn Corporation 案(发生在美国)揭示了备受讨论的数据抓取法律问题。

我们知道您不想迷失于法律术语之中。 

因此,我们准备了一份易于阅读的摘要,总结了该判决最重要的几点。法院站在了抓取工具一边,并确定抓取公共数据并不违反 CFAA(计算机欺诈和滥用法案)。

让我们来看看这个案件的具体细节,以及它留下的深远影响。

网页抓取合法吗? 

当被问及他的法律策略时,网络爬虫怎么说? “我援引第404号法令。”

如果您是数据抓取方面的新手,您可能会担心自己行为的合法性。

好消息是,你并不孤单。每个爬虫程序(我想是吧?)都有同样的疑问。 

坏消息是,答案并不那么简单。就像约会一样,它并不简单。

网络抓取处于灰色地带,并且可能是一种模棱两可的做法。

当然,公司希望保留他们的数据,但另一方面,如果数据是公开的,那么收集它有什么不对呢? 

那么,法律对这个备受争议的问题持什么立场呢?让我们深入研究最受关注的 hiQ Labs 诉 LinkedIn 案,看看能否找到一些答案。

结论:抓取数据并不违法

2022 年,第九巡回上诉法院最终作出判决,支持 hiQ Labs。法院认为,抓取公开数据并不构成违反 CFAA,即使这违反了网站的使用条款。

LinkedIn 试图阻止 hiQ 的机器人从其用户的公开资料中抓取数据。但第九巡回上诉法院明确表示:让一家公司完全垄断其不拥有的数据(因为它已获得许可)将损害公众利益。

CFAA 的适用范围有限

用更简单的话来说,第九巡回法院裁定,公司无权自由决定谁可以收集和使用公共数据。 

人们不能对《消费者行为评估法》进行如此宽泛的解释,因为这会将几乎所有人视为罪犯。 

根据该裁决,CFAA 仅将未经授权访问私人受保护信息定为犯罪。 

总而言之:网站不再能使用 CFAA 来防止未经授权的数据收集。他们也不能使用法律工具来对付爬虫。  

公共数据与私人数据:审查合法性问题

数据抓取的法律关注点现已转向公共数据和私人数据的区分。 

因此,为了您的方便,我准备了一个简短的备忘单,当您计划抓取数据时,您应该遵循它:

  • 数据是免费提供的吗?你可能很安全。
  • 数据是否仅供业主使用?这可能会带来麻烦

很简单吧?

但是,我们还需要考虑其他一些因素……

即使抓取的数据是公开的,您仍然必须考虑合同、版权和法律,例如如果您在欧盟,则必须考虑 GDPR。

除了合法性之外,还有道德方面的考虑,例如遵守 robots.txt 说明和避免服务器超载等。仅仅因为某件事是“合法的”,并不意味着它就立即正确。 

为网络爬虫开绿灯了吗?

尽管一开始你可能认为有利于 hiQ 的裁决对于网络抓取工具来说是一个胜利,但这并不意味着你就拥有了抓取数据的自由。

此案缩小了 CFAA 的解释范围,并确认了收集公共数据的权利。但是,我们还必须避免其他数据抓取法律问题。

例如,如果您为了抓取数据而创建了一个用户帐户,那么您可能会遇到麻烦,因为您已经同意了服务条款。即使 CFAA 不适用,也可能违反合同。您会问,什么合同?好吧,当您在网站上创建用户帐户时,您通常必须同意他们的服务条款。 

最后,LinkedIn 获得了一项永久禁令,用英文来说,这意味着它让 hiQ 停止抓取数据,这是他们达成的协议的一部分。所以,这对 LinkedIn 来说也是一种胜利。 

附言: 请记住,抓取受版权保护的数据(如文章、视频和图像)可能会侵犯知识产权,无论这些数据是否公开可访问。

网页抓取的法律影响:底线

如果哈姆雷特出生于 1998 年,他就会像哈姆雷特所说的那样:“抓取,还是不抓取——这是个问题”。玩笑归玩笑,hiQ 与 LinkedIn 这样的案例有助于我们获得有关网络抓取合法性的一些指导。

抓取公共数据导致您违反 CFAA 的可能性极小。 

然而,有些做法可能会导致法律后果,例如无视停止命令、违反用户协议,甚至创建虚假账户。

持续六年的 LinkedIn 与 hiQ 诉讼案可能已经结束,但数据抓取之战仍在继续。公司将努力保护其数据,我们都知道美国的游说团体有多强大。

然而,在欧盟,游说可能不是什么大问题。相反,无论出于什么原因,他们都全力关注隐私问题,而且我非常肯定,GDPR 法律可能会对网络抓取的使用有所规定。

尽管存在这些挑战,我们都知道抓取工具仍会抓取数据。

免责声明:
A) 并非法律建议。本文仅用于教育和娱乐目的。
B) 虽然 hiQ 与 LinkedIn 案开创了先例,但它并没有给予不受限制的自由。
C) 欧盟的 GDPR 等数据保护法将优先于美国的案件。
D) 您所在国家/地区的法律可能与本文中提到的完全不同。
E) 我不是律师,我不知道自己在做什么。



参考:

López de Letona、Javier Torre de Silva 等。“互联网上数据抓取的权利:从美国 hiQLabs, Inc. 诉 LinkedIn Corp. 案到 ChatGPT 数据抓取案:美国与欧盟法律之间的差异。”《全球隐私法评论》(2024 年) https://doi.org/10.54648/gplr2024001

Sobel,Benjamin。“HiQ 诉 LinkedIn、Clearview AI 以及网络抓取的新普通法。”(2020 年)。 https://dx.doi.org/10.2139/ssrn.3581844

亚历山大·施密特

Alexander Schmidt 是一名软件工程师,他坚信要更聪明地工作,而不是更努力地工作。凭借 12 年处理自动化和网络数据提取以进行分析和研究的经验,他以有趣且易于阅读的方式为企业提供实用技巧和宝贵见解,帮助其他人最大限度地提高其代理解决方案的价值和性能。当他不调整设置或为中小企业提供咨询时,您会发现 Alexander 正在研究最新的技术新闻和 AI 进步。

选择并购买代理

选择类型、位置和数量,即时查看价格。

选择并购买代理