hiQ Labs Inc 対 LinkedIn Corporation (米国で起こった) の注目を集めた訴訟は、よく議論されるデータスクレイピングの法的問題に光を当てました。
法律用語に惑わされたくないのは分かっています。
そこで、この判決の最も重要な点をわかりやすくまとめました。裁判所はスクレイパーの側に立って、公開データのスクレイピングは CFAA (コンピューター詐欺および不正使用防止法) に違反しないと判断しました。
この事件の詳細と、それが残した広範囲にわたる影響について見てみましょう。
Web スクレイピングは合法ですか?
ウェブスクレイパーは、法的戦略について尋ねられたとき何と答えましたか? 「私は第404連隊を弁護します。」
データのスクレイピングを初めて行う場合は、自分の行為の合法性について懸念するかもしれません。
幸いなことに、あなたは一人ではありません。すべてのスクレーパー(だと思います)が同じ疑問を抱いています。
残念なことに、答えはそれほど単純ではありません。デートと同じように、それは単純にはいかないのです。
Web スクレイピングはグレーゾーンに属し、曖昧な行為となる可能性があります。
もちろん、企業はデータを保存したいと考えていますが、一方で、データが公開されている場合、それを集めることがなぜ悪いのでしょうか?
さて、この盛んに議論されている問題に対する法律の立場はどうなっているのでしょうか? 最も注目を集めた hiQ Labs 対 LinkedIn の訴訟を詳しく調べて、答えが得られるか見てみましょう。
判決: データのスクレイピングは違法ではない
2022年、第9巡回控訴裁判所はついに判決を下し、hiQ Labsの側に立った。裁判所は、公開されているデータをスクレイピングすることは、たとえウェブサイトの利用規約に違反していたとしても、CFAA違反には当たらないと判断した。
LinkedIn は、hiQ のボットがユーザーの公開プロフィールからデータを取得するのを阻止しようとしていた。しかし、第 9 巡回区控訴裁判所は、企業が所有していないデータ (ライセンスに基づいて) の完全な独占権を企業に与えることは、公共の利益に有害であると明言した。
CFAA の限定された範囲
もっと簡単に言えば、第9巡回区控訴裁判所は、企業が誰が公共データを収集し、使用できるかに関して自由に決定することはできないと定めた。
CFAA をあまり広く解釈してはいけません。そうすると、ほとんど誰でも犯罪者になってしまうからです。
この判決によれば、CFAA は個人の保護された情報への不正アクセスのみを犯罪とみなす。
まとめると、ウェブサイトは CFAA を使用して不正なデータ収集を防ぐことができなくなり、スクレイパーに対して法的手段を講じることもできなくなります。
公開データと非公開データ: 合法性に関する懸念の検討
データスクレイピングに関する法的懸念は、現在、公開データと非公開データの区別へと移行しています。
そこで、データのスクレイピングを計画しているときに従うべき、簡単なチートシートを用意しました。
- データは自由に利用できますか? おそらく安全です。
- データは所有者だけが利用できるのか?これは問題を引き起こす可能性がある
簡単ですよね?
しかし、考慮しなければならない他の要素がいくつかあります…
スクレイピングされたデータが公開されている場合でも、EU にいる場合は契約、著作権、GDPR などの法律を考慮する必要があります。
また、合法性以外にも、robots.txt の指示を尊重することやサーバーの過負荷を避けることなど、倫理的な考慮事項もあります。何かが「合法」だからといって、それが直ちに正しいとは限りません。
Web スクレイパーに青信号?
最初は、hiQ を支持する判決は Web スクレイパーの勝利だと思うかもしれませんが、それはスクレイピングの自由が与えられることを意味するものではありません。
この訴訟は、CFAA の解釈を狭め、公的データを収集する権利を認めるものです。しかし、データスクレイピングに関して回避しなければならない法的問題は他にもあります。
たとえば、データをスクレイピングするためにユーザー アカウントを作成すると、利用規約に同意したことになるため、問題が発生する可能性があります。CFAA が適用されない場合でも、契約違反になる可能性があります。どのような契約かとお尋ねですか? そうですね、Web サイトでユーザー アカウントを作成する場合、通常はその利用規約に同意する必要があります。
最後に、LinkedIn は恒久的な差し止め命令を獲得しました。これは、合意の一環として hiQ にスクレイピングをやめさせたことを意味します。つまり、これは LinkedIn にとっても勝利だったと言えます。
追伸: 記事、ビデオ、画像などの著作権で保護されたデータをスクレイピングすると、そのデータが一般に公開されているかどうかに関係なく、知的財産権を侵害する可能性があることに留意してください。
ウェブスクレイピングの法的影響: 結論
1998 年に生まれたハムレットが言うように、「スクレイピングするか、しないか、それが問題だ」。冗談はさておき、hiQ 対 LinkedIn のようなケースは、Web スクレイピングの合法性に関する指針を得るのに役立ちます。
公開データをスクレイピングすることで CFAA に違反する可能性はほとんどありません。
ただし、停止命令を無視したり、ユーザー契約に違反したり、偽のアカウントを作成したりするなど、一部の行為は法的措置につながる可能性があります。
6年続いたLinkedIn対hiQの訴訟は終わったかもしれないが、データスクレイピングとの戦いはまだ続いている。企業はデータを保護しようとするだろうし、米国でロビイストがいかに強力であるかは誰もが知っている。
しかし、EU では、ロビー活動はそれほど大きな問題ではないかもしれません。その代わりに、何らかの理由でプライバシーに全力を注いでおり、GDPR 法が Web スクレイピングの使用について何らかの影響を与える可能性は十分あります。
こうした課題にもかかわらず、スクレイパーはスクレイピングを行うことは誰もが知っています。
免責事項:
A) 法的助言ではありません。この投稿は教育および娯楽目的で書かれています。
B) hiQ対LinkedInの訴訟は前例となったが、無制限の自由を与えるものではない。
C) EU の GDPR のようなデータ保護法は、アメリカの訴訟よりも優先されます。
D) あなたの国の法律は、このテキストに記載されているものとはまったく異なる可能性があります。
E) 私は弁護士じゃないから、何をやっているのか全く分からない。
参考文献:
ロペス・デ・レトナ、ハビエル・トーレ・デ・シルバ共著「インターネット上のデータスクレイピングの権利:米国のhiQLabs, Inc.対LinkedIn Corp.の訴訟からChatGPTスクレイピング訴訟まで:米国法とEU法の相違点」Global Privacy Law Review(2024年) https://doi.org/10.54648/gplr2024001
ソベル、ベンジャミン。「HiQ対LinkedIn、Clearview AI、そしてWebスクレイピングの新しい常識」(2020年)。 https://dx.doi.org/10.2139/ssrn.3581844