กรณีที่มีชื่อเสียงของ hiQ Labs Inc กับ LinkedIn Corporation (ที่เกิดขึ้นในสหรัฐอเมริกา) ให้ความกระจ่างเกี่ยวกับประเด็นทางกฎหมายที่มีการกล่าวถึงกันมาก
เรารู้ว่าคุณไม่ต้องการที่จะหลงทางในทางกฎหมาย
ดังนั้นเราจึงได้เตรียมบทสรุปที่อ่านง่ายเกี่ยวกับประเด็นที่สำคัญที่สุดของการตัดสินใจครั้งนี้ ศาลเข้าข้างผู้ขูดและกำหนดว่าการคัดลอกข้อมูลสาธารณะไม่ถือเป็นการละเมิด CFAA (พระราชบัญญัติการฉ้อโกงและการใช้คอมพิวเตอร์ในทางที่ผิด)
เรามาดูข้อมูลเฉพาะของคดีนี้ และผลที่ตามมาที่ตามมาอย่างมากมาย
การขูดเว็บถูกกฎหมายหรือไม่?
ผู้ขูดเว็บพูดอะไรเมื่อถูกถามเกี่ยวกับกลยุทธ์ทางกฎหมายของเขา “ฉันขอร้องคนที่ 404”
หากคุณยังใหม่ต่อการขูดข้อมูล คุณอาจกังวลเกี่ยวกับความถูกต้องตามกฎหมายของการกระทำของคุณ
ข่าวดีก็คือว่าคุณไม่ได้อยู่คนเดียว มีดโกนทุกคน (ฉันคิดว่า?) ต่างก็สงสัยเหมือนกัน
ข่าวร้ายก็คือคำตอบนั้นไม่ง่ายนัก เช่นเดียวกับการออกเดท มันก็ไม่ง่ายเลย
การขูดเว็บตกอยู่ในพื้นที่สีเทา และอาจเป็นแนวทางปฏิบัติที่ไม่ชัดเจน
แน่นอนว่าบริษัทต่างๆ ต้องการรักษาข้อมูลของตนไว้ แต่ในทางกลับกัน หากข้อมูลดังกล่าวเปิดเผยต่อสาธารณะ ทำไมการรวบรวมข้อมูลจึงผิด
ทีนี้ จุดยืนของกฎหมายในเรื่องที่มีการถกเถียงกันมากนี้คืออะไร? เรามาเจาะลึกกรณีโปรไฟล์สูงสุดของ hiQ Labs กับ LinkedIn เพื่อดูว่าเราจะได้คำตอบบ้างไหม
คำตัดสิน: การขูดข้อมูลไม่ใช่เรื่องผิดกฎหมาย
ในปี 2022 ศาลอุทธรณ์รอบที่ 9 ได้ตัดสินใจและเข้าข้าง hiQ Labs ในที่สุด ศาลถือว่าการคัดลอกข้อมูลที่เปิดเผยต่อสาธารณะไม่ถือว่าเป็นการละเมิด CFAA แม้ว่าจะขัดต่อข้อกำหนดการใช้งานของเว็บไซต์ก็ตาม
LinkedIn พยายามป้องกันไม่ให้บอทของ hiQ คัดลอกข้อมูลจากโปรไฟล์สาธารณะของผู้ใช้ แต่วงจรที่เก้านั้นชัดเจน: การให้บริษัทผูกขาดข้อมูลโดยสมบูรณ์โดยที่บริษัทไม่ได้เป็นเจ้าของ (ตามที่ได้รับอนุญาต) จะเป็นอันตรายต่อผลประโยชน์สาธารณะ
ขอบเขตที่จำกัดสำหรับ CFAA
พูดง่ายๆ ก็คือ Ninth Circuit กำหนดไว้ว่าบริษัทต่างๆ ไม่มีสิทธิ์ควบคุมว่าใครสามารถรวบรวมและใช้ข้อมูลสาธารณะได้
เราจะต้องไม่ตีความ CFAA อย่างกว้างๆ เพราะจะทำให้เกือบทุกคนกลายเป็นอาชญากร
ภายใต้การพิจารณาคดี CFAA กำหนดให้เฉพาะการเข้าถึงข้อมูลส่วนตัวที่ได้รับการคุ้มครองโดยไม่ได้รับอนุญาตเท่านั้น
โดยสรุป: เว็บไซต์ไม่สามารถใช้ CFAA เพื่อป้องกันการเก็บรวบรวมข้อมูลโดยไม่ได้รับอนุญาตได้อีกต่อไป และพวกเขาไม่สามารถใช้เครื่องมือทางกฎหมายกับเครื่องขูดได้
ข้อมูลสาธารณะและข้อมูลส่วนตัว: การตรวจสอบข้อกังวลด้านกฎหมาย
ข้อกังวลทางกฎหมายในการขูดข้อมูลได้เปลี่ยนไปสู่ความแตกต่างระหว่างข้อมูลส่วนตัวและสาธารณะ
ดังนั้น เพื่อความสะดวกของคุณ ฉันจึงได้เตรียมเอกสารสรุปสั้นๆ ที่คุณควรปฏิบัติตามเมื่อคุณวางแผนที่จะขูดข้อมูล:
- ข้อมูลมีให้ใช้อย่างอิสระหรือไม่? คุณอาจจะปลอดภัย
- ข้อมูลนี้มีให้เฉพาะเจ้าของเท่านั้นใช่ไหม สิ่งนี้อาจนำไปสู่ปัญหา
ง่ายใช่มั้ย?
แต่มีปัจจัยอื่น ๆ ที่เราต้องพิจารณา...
แม้ว่าข้อมูลที่คัดลอกมาจะเปิดเผยต่อสาธารณะ แต่คุณยังคงต้องคำนึงถึงสัญญา ลิขสิทธิ์ และกฎหมาย เช่น GDPR หากคุณอยู่ในสหภาพยุโรป
นอกจากนี้ยังมีการพิจารณาด้านจริยธรรมที่นอกเหนือไปจากความถูกต้องตามกฎหมาย เช่น การเคารพคำสั่งของ robots.txt และการหลีกเลี่ยงการใช้เซิร์ฟเวอร์มากเกินไป เป็นต้น เพียงเพราะว่าบางสิ่ง "ถูกกฎหมาย" ไม่ได้ทำให้ถูกต้องทันที
ไฟเขียวสำหรับผู้ขูดเว็บใช่ไหม
แม้ว่าในตอนแรกคุณอาจคิดว่าคำตัดสินที่สนับสนุน hiQ นั้นเป็นข้อดีสำหรับผู้ขูดเว็บ แต่ก็ไม่ได้หมายความว่าคุณจะมีโอกาสในการขูด
กรณีนี้ทำให้การตีความของ CFAA แคบลง และยืนยันสิทธิ์ในการรวบรวมข้อมูลสาธารณะ แต่มีข้อมูลอื่นๆ ที่ทำลายปัญหาทางกฎหมายที่เราต้องหลีกเลี่ยง
ตัวอย่างเช่น หากคุณสร้างบัญชีผู้ใช้ในการคัดลอกข้อมูล คุณอาจประสบปัญหาได้เนื่องจากคุณได้ยอมรับข้อกำหนดในการให้บริการ แม้ว่า CFAA จะไม่มีผลบังคับใช้ แต่ก็อาจถือเป็นการละเมิดสัญญาได้ คุณถามสัญญาอะไร? เมื่อคุณสร้างบัญชีผู้ใช้บนเว็บไซต์ คุณมักจะต้องยอมรับข้อกำหนดในการให้บริการของพวกเขา
สุดท้าย LinkedIn ได้รับคำสั่งห้ามถาวร ซึ่งในภาษาอังกฤษหมายความว่า hiQ ต้องยกเลิกการคัดลอกซึ่งเป็นส่วนหนึ่งของข้อตกลงที่พวกเขาบรรลุ ดังนั้น มันก็เป็นชัยชนะของ LinkedIn เช่นกัน
ป.ล.: โปรดทราบว่าการคัดลอกข้อมูลที่มีลิขสิทธิ์ เช่น บทความ วิดีโอ และรูปภาพ อาจเป็นการละเมิดสิทธิ์ในทรัพย์สินทางปัญญา ไม่ว่าข้อมูลจะเข้าถึงได้แบบสาธารณะหรือไม่ก็ตาม
ผลกระทบทางกฎหมายของการขูดเว็บ: บรรทัดล่าง
“การขูดหรือไม่ขูด – นั่นคือคำถาม” อย่างที่ Hamlet พูด – ถ้าเขาเกิดในปี 1998 นอกจากเรื่องตลกแล้ว กรณีอย่าง hiQ กับ LinkedIn ยังช่วยให้เราได้รับคำแนะนำเกี่ยวกับความถูกต้องตามกฎหมายของการขูดเว็บ
เป็นไปได้อย่างยิ่งที่การคัดลอกข้อมูลสาธารณะจะทำให้คุณละเมิด CFAA
อย่างไรก็ตาม แนวทางปฏิบัติบางอย่างอาจนำคุณไปสู่ผลกระทบทางกฎหมาย เช่น การเพิกเฉยต่อคำสั่งหยุดและเลิกใช้ การละเมิดข้อตกลงของผู้ใช้ และแม้แต่การสร้างบัญชีปลอม
คดี LinkedIn vs hiQ อายุหกปีอาจจบลงแล้ว แต่สงครามกับการขูดข้อมูลยังคงดำเนินอยู่ บริษัทต่างๆ จะพยายามปกป้องข้อมูลของตน และเราทุกคนก็รู้ดีว่าผู้ทำการแนะนำชักชวนสมาชิกรัฐสภามีอำนาจมากเพียงใดในสหรัฐอเมริกา
อย่างไรก็ตาม ในสหภาพยุโรป การล็อบบี้อาจไม่เป็นปัญหาใหญ่นัก ไม่ว่าด้วยเหตุผลใดก็ตาม พวกเขากลับให้ความสำคัญกับความเป็นส่วนตัว และฉันค่อนข้างมั่นใจว่ากฎหมาย GDPR อาจมีบางอย่างที่จะกล่าวถึงการใช้การขูดเว็บ
แม้จะมีความท้าทายเหล่านี้ แต่เราทุกคนก็รู้ดีว่าเครื่องขูดจะต้องถูกขูดอย่างแน่นอน
ข้อสงวนสิทธิ์:
ก) ไม่ใช่คำแนะนำทางกฎหมาย โพสต์นี้เขียนขึ้นเพื่อการศึกษาและความบันเทิง
B) แม้ว่ากรณี hiQ กับ LinkedIn จะเป็นแบบอย่าง แต่ก็ไม่ได้ให้เสรีภาพที่ไม่จำกัด
C) กฎหมายคุ้มครองข้อมูล เช่น GDPR ในสหภาพยุโรปจะมีความสำคัญมากกว่ากรณีของสหรัฐอเมริกา
D) กฎหมายในประเทศของคุณอาจแตกต่างไปจากที่กล่าวไว้ในข้อความนี้อย่างสิ้นเชิง
E) ฉันไม่ใช่ทนายความ ฉันไม่รู้ว่ากำลังทำอะไรอยู่
อ้างอิง:
โลเปซ เด เลโตน่า, ฮาเวียร์ ตอร์เร เดอ ซิลวา “สิทธิ์ในการขูดข้อมูลบนอินเทอร์เน็ต: จาก US Case hiQLabs, Inc. v. LinkedIn Corp. ไปจนถึง ChatGPT Scraping Cases: ความแตกต่างระหว่างกฎหมายของสหรัฐอเมริกาและสหภาพยุโรป” การทบทวนกฎหมายความเป็นส่วนตัวทั่วโลก (2024) https://doi.org/10.54648/gplr2024001
โซเบล, เบนจามิน. “HiQ v. LinkedIn, Clearview AI และกฎทั่วไปใหม่ของ Web Scraping” (2020). https://dx.doi.org/10.2139/ssrn.3581844