스크래핑 합법성

hiQ Labs Inc와 LinkedIn Corporation(미국에서 발생)의 세간의 이목을 끄는 사건은 많이 논의된 데이터 스크래핑 법적 문제를 조명했습니다.

우리는 당신이 법률 용어에서 길을 잃기를 원하지 않는다는 것을 알고 있습니다. 

그래서 이번 결정의 가장 중요한 사항을 읽기 쉽게 요약하여 준비했습니다. 법원은 스크레이퍼의 편을 들었고 공개 데이터를 스크래핑하는 것이 CFAA(컴퓨터 사기 및 남용법)를 위반하지 않는다는 점을 확인했습니다.

사건의 구체적인 내용과 사건이 남긴 광범위한 결과를 살펴보겠습니다.

웹 스크래핑은 합법적인가요? 

웹스크래퍼는 자신의 법적 전략에 대해 물었을 때 뭐라고 말했습니까? “404호에 호소합니다.”

데이터 스크랩을 처음 접하는 경우 작업의 합법성에 대해 우려할 가능성이 높습니다.

좋은 소식은 당신이 혼자가 아니라는 것입니다. 모든 스크레이퍼(제 생각에는?)도 같은 생각을 했을 것입니다. 

나쁜 소식은 대답이 그렇게 간단하지 않다는 것입니다. 데이트와 마찬가지로 단순함을 거부합니다.

웹 스크래핑은 회색 영역에 속하며 모호한 관행이 될 수 있습니다.

물론 기업은 데이터를 보존하고 싶지만, 공개적으로 이용 가능한 데이터라면 수집하는 것이 왜 잘못된 걸까요? 

그렇다면 이 많은 논란이 되고 있는 문제에 대한 법의 입장은 무엇입니까? hiQ Labs와 LinkedIn의 가장 유명한 사례를 살펴보고 답변을 얻을 수 있는지 살펴보겠습니다.

판결: 데이터 스크래핑은 불법이 아닙니다

2022년 제9순회항소법원은 마침내 결정을 내려 hiQ Labs의 편을 들었습니다. 법원은 공개적으로 이용 가능한 데이터를 스크랩하는 것이 웹사이트 이용 약관에 위배되더라도 CFAA 위반에 해당하지 않는다고 판결했습니다.

LinkedIn은 hiQ의 봇이 사용자의 공개 프로필에서 데이터를 스크랩하는 것을 방지하려고 시도했습니다. 그러나 제9순회법원은 회사가 소유하지 않은(라이선스에 따라) 데이터에 대한 완전한 독점권을 회사에 부여하는 것은 공익에 해로울 것이라는 점은 분명했습니다.

CFAA의 제한된 범위

훨씬 더 간단하게 말하면, 제9순회법원은 기업이 공공 데이터를 수집하고 사용할 수 있는 사람을 자유롭게 통제할 수 없다는 점을 확립했습니다. 

CFAA를 너무 광범위하게 해석해서는 안 됩니다. 그렇게 하면 거의 모든 사람을 범죄자로 만들 수 있기 때문입니다. 

판결에 따라 CFAA는 보호되는 개인 정보에 대한 무단 접근만을 범죄로 규정합니다. 

요약하자면, 웹사이트는 더 이상 무단 데이터 수집을 방지하기 위해 CFAA를 사용할 수 없습니다. 그리고 그들은 스크레이퍼에 대해 법적 도구를 사용할 수 없습니다.  

공개 데이터와 비공개 데이터: 합법성 문제 조사

데이터 스크래핑에 대한 법적 우려는 이제 공공-개인 데이터 간의 구별로 옮겨가고 있습니다. 

그래서 귀하의 편의를 위해 데이터 스크랩을 계획할 때 따라야 할 짧은 치트 시트를 준비했습니다.

  • 데이터를 자유롭게 이용할 수 있나요? 당신은 아마 안전할 것입니다.
  • 데이터는 소유자만 사용할 수 있나요? 이로 인해 문제가 발생할 수 있습니다.

쉽지요?

그러나 우리가 고려해야 할 몇 가지 다른 요소가 있습니다…

스크랩된 데이터가 공개적으로 사용 가능하더라도 EU에 거주하는 경우 GDPR과 같은 계약, 저작권 및 법률을 고려해야 합니다.

몇 가지 예를 들면 robots.txt 지침을 존중하고 서버 과부하를 방지하는 등 적법성 외에도 윤리적 고려 사항도 있습니다. 어떤 것이 "합법적"이라고 해서 그것이 즉시 옳은 것은 아닙니다. 

웹 스크레이퍼에 대한 청신호?

처음에는 hiQ에 유리한 판결이 웹 스크레이퍼의 승리라고 생각할 수도 있지만 이것이 스크래핑에 대한 기회가 열려 있다는 의미는 아닙니다.

이 사건은 CFAA의 해석을 좁히고 공공 데이터를 수집할 권리를 확인합니다. 그러나 우리가 피해야 할 다른 데이터 스크랩 법적 문제가 있습니다.

예를 들어, 데이터 스크랩을 위해 사용자 계정을 생성했다면 서비스 약관에 동의했기 때문에 문제가 발생할 수 있습니다. CFAA가 적용되지 않더라도 계약 위반이 될 수 있습니다. 무슨 계약이냐고요? 글쎄, 웹사이트에서 사용자 계정을 만들 때 일반적으로 해당 서비스 약관에 동의해야 합니다. 

마지막으로 LinkedIn은 영구 금지 명령을 받았습니다. 이는 hiQ가 도달한 합의의 일부로 스크래핑을 중단하라는 의미입니다. 따라서 이는 LinkedIn에게도 승리였습니다. 

추신: 기사, 비디오, 이미지 등 저작권이 있는 데이터를 스크랩하는 것은 해당 데이터가 공개적으로 접근 가능한지 여부에 관계없이 지적 재산권을 침해할 수 있다는 점에 유의하세요.

웹 스크래핑의 법적 의미: 결론

Hamlet이 1998년에 태어났다면 "스크래핑하느냐 마느냐, 그것이 문제로다"라고 말했습니다. 농담은 제쳐두고, hiQ와 LinkedIn과 같은 사례는 웹 스크래핑의 합법성에 대한 지침을 얻는 데 도움이 됩니다.

공개 데이터를 스크랩하면 CFAA를 위반하게 될 가능성은 거의 없습니다. 

그러나 일부 관행은 정지 명령 무시, 사용자 계약 위반, 심지어 가짜 계정 생성과 같은 법적 영향을 미칠 수 있습니다.

6년 동안 이어진 LinkedIn과 hiQ의 소송은 끝났지만 데이터 스크래핑 전쟁은 여전히 진행 중입니다. 기업은 데이터를 보호하려고 노력할 것이며, 우리 모두는 미국에서 로비스트가 얼마나 강력한지 알고 있습니다.

그러나 EU에서는 로비가 큰 문제가 되지 않을 수도 있습니다. 그 대신 어떤 이유에서든 그들은 개인 정보 보호에 올인했으며 GDPR 법률이 웹 스크래핑 사용에 관해 언급할 내용이 있을 것이라고 확신합니다.

이러한 어려움에도 불구하고 우리 모두는 스크레이퍼가 긁힐 것이라는 것을 알고 있습니다.

부인 성명:
A) 법적 조언이 아닙니다. 본 포스팅은 교육 및 오락의 목적으로 작성되었습니다.
B) hiQ 대 LinkedIn 사례가 선례를 세웠지만 무제한의 자유를 제공하지는 않습니다.
C) EU의 GDPR과 같은 데이터 보호법은 미국 사례보다 우선합니다.
D) 해당 국가의 법률은 이 텍스트에 언급된 내용과 완전히 다를 수 있습니다.
E) 저는 변호사가 아니기 때문에 제가 무슨 일을 하고 있는지 전혀 모릅니다.



참고자료:

로페스 데 레토나, 하비에르 토레 데 실바 y. "인터넷에서 데이터를 스크랩할 권리: 미국 사례 hiQLabs, Inc. v. LinkedIn Corp.부터 ChatGPT 스크랩 사례까지: 미국과 EU 법률의 차이점." 글로벌 개인정보 보호법 검토(2024) https://doi.org/10.54648/gplr2024001

소벨, 벤자민. "HiQ v. LinkedIn, Clearview AI 및 웹 스크래핑의 새로운 공통법." (2020). https://dx.doi.org/10.2139/ssrn.3581844

알렉산더 슈미트

Alexander Schmidt는 더 열심히 일하는 것이 아니라 더 똑똑하게 일하는 것을 믿는 소프트웨어 엔지니어입니다. 분석 및 연구를 위한 자동화 및 웹 데이터 추출을 다루는 12년의 경험을 바탕으로 그는 다른 사람들이 프록시 솔루션의 가치와 성능을 극대화할 수 있도록 재미있고 읽기 쉬운 방식으로 전달되는 실용적인 팁과 귀중한 통찰력을 기업에 제공합니다. Alexander가 설정을 조정하거나 중소기업을 위한 컨설팅을 하지 않을 때는 최신 기술 뉴스와 AI 발전에 대해 관심을 갖고 있는 것을 볼 수 있습니다.

프록시 선택 및 구매

유형, 위치, 수량을 선택하면 가격을 즉시 확인할 수 있습니다.

프록시 선택 및 구매