Cạo tính hợp pháp

Vụ việc nổi bật giữa hiQ Labs Inc và LinkedIn Corporation (diễn ra ở Hoa Kỳ) đã làm sáng tỏ các vấn đề pháp lý về thu thập dữ liệu được thảo luận nhiều.

Chúng tôi biết bạn không muốn bị lạc trong thuật ngữ pháp lý. 

Vì vậy, chúng tôi đã chuẩn bị một bản tóm tắt dễ đọc về những điểm quan trọng nhất của quyết định này. Tòa án đứng về phía người thu thập dữ liệu và xác định rằng việc thu thập dữ liệu công cộng không vi phạm CFAA (Đạo luật lạm dụng và gian lận máy tính).

Hãy cùng nhìn vào chi tiết cụ thể của vụ việc cũng như những hậu quả sâu rộng mà nó để lại.

Quét web có hợp pháp không? 

Người quét web đã nói gì khi được hỏi về chiến lược pháp lý của mình? “Tôi cầu xin điều 404.”

Nếu bạn là người mới làm quen với việc thu thập dữ liệu, bạn có thể lo ngại về tính hợp pháp của hành động của mình.

Tin tốt là bạn không đơn độc. Mọi người cạo (tôi nghĩ vậy?) đều thắc mắc như vậy. 

Tin xấu là câu trả lời không đơn giản như vậy. Giống như hẹn hò, nó không hề đơn giản.

Quét web rơi vào vùng xám và nó có thể là một thực tiễn không rõ ràng.

Tất nhiên, các công ty muốn bảo vệ dữ liệu của họ, nhưng mặt khác, nếu nó được công khai thì tại sao việc thu thập dữ liệu lại là sai? 

Bây giờ, quan điểm của pháp luật về vấn đề gây nhiều tranh cãi này như thế nào? Hãy cùng đi sâu vào trường hợp nổi bật nhất giữa hiQ Labs và LinkedIn để xem liệu chúng ta có thể nhận được câu trả lời hay không.

Phán quyết: Việc thu thập dữ liệu không phải là bất hợp pháp

Vào năm 2022, Tòa phúc thẩm khu vực thứ chín cuối cùng đã đưa ra quyết định và đứng về phía hiQ Labs. Tòa án cho rằng việc thu thập dữ liệu có sẵn công khai không vi phạm CFAA, ngay cả khi điều đó trái với các điều khoản sử dụng của trang web.

LinkedIn đang cố gắng ngăn chặn các bot của hiQ lấy dữ liệu từ hồ sơ công khai của người dùng. Nhưng Tòa án thứ chín đã nói rõ: việc trao cho một công ty độc quyền hoàn toàn về dữ liệu mà công ty đó không sở hữu (vì nó đã được cấp phép) sẽ gây bất lợi cho lợi ích công cộng.

Phạm vi hạn chế của CFAA

Nói một cách đơn giản hơn nhiều, Tòa án thứ chín đã xác định rằng các công ty không có quyền tự do quyết định ai có thể thu thập và sử dụng dữ liệu công cộng. 

Người ta không được giải thích CFAA quá rộng rãi vì nó sẽ khiến hầu hết mọi người trở thành tội phạm. 

Theo phán quyết, CFAA chỉ hình sự hóa việc truy cập trái phép vào thông tin riêng tư, được bảo vệ. 

Tóm lại: các trang web không còn có thể sử dụng CFAA để ngăn chặn việc thu thập dữ liệu trái phép. Và họ không thể sử dụng các công cụ pháp lý để chống lại những kẻ phá hoại.  

Dữ liệu công khai và riêng tư: Kiểm tra các mối quan tâm về tính pháp lý

Các mối lo ngại pháp lý về cạo dữ liệu giờ đây chuyển sang sự phân biệt giữa dữ liệu công-tư. 

Vì vậy, để thuận tiện cho bạn, tôi đã chuẩn bị một bảng ghi chú ngắn mà bạn nên làm theo khi định thu thập dữ liệu:

  • Dữ liệu có sẵn miễn phí không? Có lẽ bạn đã an toàn.
  • Dữ liệu chỉ có sẵn cho chủ sở hữu? Điều này có thể dẫn tới rắc rối

Dễ dàng phải không?

Tuy nhiên, có một số yếu tố khác mà chúng ta phải xem xét…

Ngay cả khi dữ liệu đã thu thập được hiển thị công khai, bạn vẫn phải tính đến các hợp đồng, bản quyền và luật pháp, chẳng hạn như GDPR nếu bạn ở Liên minh Châu Âu.

Ngoài ra còn có những cân nhắc về mặt đạo đức ngoài tính pháp lý như tôn trọng hướng dẫn của robots.txt và tránh làm quá tải máy chủ, v.v. Chỉ vì điều gì đó “hợp pháp” không có nghĩa là nó đúng ngay lập tức. 

Bật đèn xanh cho người quét web?

Mặc dù ban đầu bạn có thể nghĩ rằng phán quyết ủng hộ hiQ là một chiến thắng cho những kẻ phá hoại web, nhưng điều đó không có nghĩa là bạn có cơ hội để cào.

Trường hợp này thu hẹp cách giải thích của CFAA và khẳng định quyền thu thập dữ liệu công cộng. Tuy nhiên, có những vấn đề pháp lý về cạo dữ liệu khác mà chúng tôi phải tránh.

Ví dụ: nếu để thu thập dữ liệu, bạn tạo một tài khoản người dùng thì bạn có thể gặp rắc rối vì đã đồng ý với các điều khoản dịch vụ. Ngay cả khi CFAA không áp dụng, người ta vẫn có thể vi phạm hợp đồng. Bạn hỏi hợp đồng gì? Chà, khi bạn tạo tài khoản người dùng trên một trang web, bạn thường phải đồng ý với các điều khoản dịch vụ của họ. 

Cuối cùng, LinkedIn đã nhận được lệnh cấm vĩnh viễn, trong tiếng Anh có nghĩa là HiQ phải ngừng thu thập thông tin như một phần của thỏa thuận mà họ đã đạt được. Vì vậy, đây cũng là một chiến thắng cho LinkedIn. 

Tái bút: Hãy nhớ rằng việc loại bỏ dữ liệu có bản quyền, như bài viết, video và hình ảnh, có thể vi phạm quyền sở hữu trí tuệ, bất kể dữ liệu đó có được truy cập công khai hay không.

Ý nghĩa pháp lý của việc quét web: Điểm mấu chốt

“Cạo hay không cạo – đó là câu hỏi” như Hamlet sẽ nói – nếu anh ấy sinh năm 1998. Bỏ chuyện cười sang một bên, những trường hợp như hiQ vs LinkedIn giúp chúng tôi có được một số hướng dẫn về tính hợp pháp của việc cạo web.

Rất khó có khả năng việc thu thập dữ liệu công khai sẽ khiến bạn vi phạm CFAA. 

Tuy nhiên, một số hành vi có thể khiến bạn phải chịu hậu quả pháp lý, chẳng hạn như coi thường lệnh ngừng và hủy, vi phạm thỏa thuận người dùng và thậm chí tạo tài khoản giả.

Vụ kiện LinkedIn và hiQ kéo dài sáu năm có thể đã kết thúc, nhưng cuộc chiến thu thập dữ liệu vẫn đang tiếp diễn. Các công ty sẽ cố gắng bảo vệ dữ liệu của họ và tất cả chúng ta đều biết các nhà vận động hành lang ở Mỹ mạnh mẽ như thế nào.

Tuy nhiên, ở EU, vận động hành lang có thể không phải là vấn đề lớn. Thay vào đó, vì bất kỳ lý do gì, họ đã tập trung toàn lực vào quyền riêng tư và tôi khá chắc chắn rằng luật GDPR có thể có điều gì đó để nói về việc sử dụng tính năng quét web.

Bất chấp những thách thức này, tất cả chúng ta đều biết máy cạp sẽ cạo.

Tuyên bố từ chối trách nhiệm:
A) Không phải tư vấn pháp lý. Bài viết này được viết cho mục đích giáo dục và giải trí.
B) Mặc dù trường hợp hiQ vs LinkedIn đặt ra tiền lệ nhưng nó không mang lại sự tự do không hạn chế.
C) Luật bảo vệ dữ liệu như GDPR ở EU sẽ được ưu tiên hơn trường hợp của Mỹ.
D) Luật pháp ở nước bạn có thể khác hoàn toàn với những gì được đề cập trong văn bản này.
E) Tôi không phải là luật sư, tôi không biết mình đang làm gì.



Người giới thiệu:

López de Letona, Javier Torre de Silva y. “Quyền thu thập dữ liệu trên Internet: Từ Vụ việc hiQLabs, Inc. của Hoa Kỳ kiện LinkedIn Corp. đến Vụ việc thu thập dữ liệu ChatGPT: Sự khác biệt giữa luật pháp Hoa Kỳ và EU.” Đánh giá luật quyền riêng tư toàn cầu (2024) https://doi.org/10.54648/gplr2024001

Sobel, Benjamin. “HiQ v. LinkedIn, Clearview AI và Luật phổ biến mới về quét web.” (2020). https://dx.doi.org/10.2139/ssrn.3581844

Alexander Schmidt

Alexander Schmidt là một kỹ sư phần mềm tin tưởng vào việc làm việc thông minh hơn chứ không phải chăm chỉ hơn. Với 12 năm kinh nghiệm xử lý vấn đề tự động hóa và trích xuất dữ liệu web để phân tích và nghiên cứu, anh trao quyền cho các doanh nghiệp bằng những mẹo thực tế và thông tin chi tiết có giá trị được cung cấp theo cách thú vị và dễ đọc để giúp người khác tối đa hóa giá trị và hiệu suất của các giải pháp proxy của họ. Khi anh ấy không điều chỉnh quá trình thiết lập hoặc tư vấn cho SMB, bạn có thể thấy Alexander đang tìm hiểu những tin tức công nghệ mới nhất và những tiến bộ về AI.

Chọn và mua proxy

Chọn loại, vị trí và số lượng để xem giá tức thì.

Chọn và mua proxy