크롤링 법적 문제 | 데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보 108 개의 자세한 답변

당신은 주제를 찾고 있습니까 “크롤링 법적 문제 – 데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보“? 다음 카테고리의 웹사이트 ppa.maxfit.vn 에서 귀하의 모든 질문에 답변해 드립니다: https://ppa.maxfit.vn/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 SHIN \u0026 KIM법무법인 세종 이(가) 작성한 기사에는 조회수 899회 및 좋아요 24개 개의 좋아요가 있습니다.

크롤링을 금지하는 법적 근거로 기존에는 저작권 침해와 부정경쟁방지법상 일반 부정경쟁행위(그 밖에 타인의 상당한 투자나 노력으로 만들어진 성과 등을 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 자신의 영업을 위하여 무단으로 사용함으로써 타인의 경제적 이익을 침해하는 행위)가 사용 …

크롤링 법적 문제 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보 – 크롤링 법적 문제 주제에 대한 세부정보를 참조하세요

법무법인(유) 세종은 본투글로벌센터와 함께 스타트업 뿐만 아니라 창업 생태계 내에 있는 모든 분들을 위해, 유용한 법률정보를 담은 온라인 세미나를 진행합니다.
법무법인(유) 세종은 판교사무소를 설치, 운영하고 있으며, 기업법무, M\u0026A, 공정거래, IP 등 다양한 분야의 변호사들이 근무하면서 법률자문을 제공하고 있습니다.
*송봉주 변호사의 주된 업무분야는 제조물책임 관련 소송 및 분쟁, 지적재산권(특허, 실용신안, 상표, 저작권) 관련 소송 및 자문, 영업비밀 관련 업무, 언론 대응 업무, 기업 관련 형사 자문 및 송무 분야입니다. 삼성전자 등 국내 대기업 및 중소기업을 대리한 다양한 지적재산권 분쟁을 성공적으로 수행하였고, 한국에서 가장 유명한 저작권 분쟁인 MBC드라마 선덕여왕 사건을 승소로 이끈 바 있습니다. 한양대학교 대학원 및 미국 UCLA 로스쿨에서 지적재산권을 전공하기도 하였습니다.
송봉주 변호사 프로필 보기- https://www.shinkim.com/kor/member/view/377

크롤링 법적 문제 주제에 대한 자세한 내용은 여기를 참조하세요.

무단 크롤링의 법적 문제 – 브런치

크롤링은 현행법상 금지되어 있는 것은 아니나, 무단으로 크롤링을 실행하는 경우 저작권법과 부정경쟁방지법 위반 행위에 해당할 수 있어 주의가 …

+ 여기에 표시

Source: brunch.co.kr

Date Published: 8/27/2022

View: 2080

[민후의 기·꼭·법]크롤링의 위법성은? – 이데일리

이에 크롤링(소프트웨어를 이용해 유용한 정보를 찾아 수집하는 방식) … 크롤링 행위에서 문제되는 대표적인 두 가지 법적 문제를 살펴보려 한다.

+ 여기를 클릭

Source: www.edaily.co.kr

Date Published: 4/18/2021

View: 1110

[크롤링] 크롤링의 법적 문제 – nunu company

누누 컴퍼니 내부에서 네트워크가 아닌 다른 주제의 포스팅을 원하여 새로운 주제를 선정하는 중입니다. · 이번 포스팅에서는 크롤링의 법적 문제에 대해 …

+ 여기에 자세히 보기

Source: nunucompany.tistory.com

Date Published: 3/10/2021

View: 3254

크롤링 법적 문제 질문 – OKKY

크롤링 법적 문제 질문. 회사에서 외주를 받아서 A사이트를 크롤링 하고 있습니다. robots.txt에 Disallow: / 되어있지만… 뭐 하라니까 합니다ㅜㅜ.

+ 여기에 더 보기

Source: okky.kr

Date Published: 6/8/2021

View: 6706

공개데이터 크롤링, 합법과 불법의 경계는? – NEPLA 네플라

데이터 소유를 강화하는 법률로는 부정경쟁방지법 또는 저작권법 등이 존재한다. 현재 상황을 볼 때 공공데이터의 경우 공유를 강화하는 체계, 민간데이터 …

+ 더 읽기

Source: www.nepla.net

Date Published: 5/28/2022

View: 3834

크롤링 관련 최근 대법원 판결과 그 시사점 – 법무법인 세종

시장에 존재하는 이러한 상반된 시각으로 인해 크롤링에 관한 법적 분쟁 … 이 문제가 되었는데 API 서버 접근에 대한 특별한 보호조치가 없었던 점, …

+ 여기에 더 보기

Source: www.shinkim.com

Date Published: 4/26/2021

View: 8504

대법원 “웹사이트 무단 크롤링은 불법” – 비즈니스워치

잡코리아, 사람인 상대 9년 소송전서 승소 크롤링(데이터 수집) 법적 기준 정립. 웹사이트 콘텐츠를 긁어오는 ‘크롤링’을 이용해 확보한 콘텐츠를 …

+ 여기에 자세히 보기

Source: news.bizwatch.co.kr

Date Published: 11/16/2022

View: 6719

무단 크롤링으로 야놀자 정보 빼간 여기어때 법알못 판례 읽기 …

보통의 경우라면 큰 문제가 없겠지만 ‘크롤링 프로그램’으로 정보를 통째로 … 게티이미지뱅크 사람인HR도 경쟁사 채용 정보 무단 복제해 법적 공방

+ 여기에 자세히 보기

Source: magazine.hankyung.com

Date Published: 1/12/2022

View: 3891

누구도 알려주지 않는 크롤링의 함정 – SlideShare

잡코리아와 사람인의 법적 분쟁 2. 잡코리아는 기분이 너무 나쁨. 잡코리아와 사람인의 법적 분쟁 3. 문제는 사람인의 크롤러는 잡. 잡코리아 …

+ 더 읽기

Source: www.slideshare.net

Date Published: 7/20/2022

View: 8904

주제와 관련된 이미지 크롤링 법적 문제

주제와 관련된 더 많은 사진을 참조하십시오 데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보
데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보

주제에 대한 기사 평가 크롤링 법적 문제

  • Author: SHIN \u0026 KIM법무법인 세종
  • Views: 조회수 899회
  • Likes: 좋아요 24개
  • Date Published: 2021. 11. 23.
  • Video Url link: https://www.youtube.com/watch?v=ciLOLRGydCg

크롤링, 최근 개정된 부정경쟁방지법이 바라보는 시각

[2022.04.28.]

크롤링에 대해서는 종래 저작권 침해와 부정경쟁방지법상 일반 부정경쟁행위를 주장하는 경우가 많았습니다. 그런데 2022. 4. 20.부터 부정경쟁행위에 새로 편입되는 데이터 부정사용행위가 불특정 다수에게 제공되는 데이터를 그 규제 대상에서 제외함에 따라 크롤링에 대해 일반 부정경쟁행위 주장을 계속하여 유지할 수 있을지가 문제될 것으로 보입니다

1. 크롤링이란?

크롤링(crawling)이란 크롤러(crawler) 혹은 스파이더(spider)로 알려진 프로그램을 통해 거미줄과 같이 뻗어 나간 웹(web) 페이지의 정보를 수집하는 기법을 말합니다. 크롤(crawl)은 거미 등의 곤충이 걷는 동작을 지칭하는 단어인데, 프로그램이 인터넷에 존재하는 수많은 웹 페이지들을 돌아다니는 특징을 잘 표현할 수 있어 크롤링이라는 용어가 사용되고 있습니다. 한편 최근에는 로봇을 이용해 웹 페이지의 정보를 통째로(bulk) 복사해 가는 것을 크롤링이라고 부르기도 합니다.

크롤링은 대개 웹 페이지상에 공개된 정보를 수집하기 때문에, 역설계(reverse engineering)가 허용되는 것처럼 크롤링 역시 문제 없다고 생각하는 경우가 많습니다. 그런데 최근 데이터의 중요성이 한층 강조되면서 공개된 데이터라 하더라도 데이터를 공개한 사람의 의도와 다르게 사용하는 행위는 데이터 보유자의 수집, 편집, 배열 등에 투자된 노력에 무임승차(free ride)하는 행위라는 주장이 설득력 있게 제기되고 있습니다. 물론 데이터의 독점은 소비자들의 후생에 저해되는 행위이기에 위법한 방법을 사용하지 않은 크롤링은 허용하는 것이 옳다는 주장도 만만치 않습니다.

2. 크롤링에 대한 기존 법적 논의

크롤링을 금지하는 법적 근거로 기존에는 저작권 침해와 부정경쟁방지법상 일반 부정경쟁행위(그 밖에 타인의 상당한 투자나 노력으로 만들어진 성과 등을 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 자신의 영업을 위하여 무단으로 사용함으로써 타인의 경제적 이익을 침해하는 행위)가 사용되었습니다.

인터넷 백과사전인 위키(wiki)와 관련하여, 피고(엔하위키미러)가 원고(엔하위키)의 게시물 전부를 미러링(mirroring) 방식으로 복제한 사건(서울고등법원 2016. 12. 15. 선고 2015나2074198 판결, 대법원에서 심리불속행으로 확정)에서 법원은 원고가 데이터베이스의 제작 또는 그 소재의 갱신·검증 또는 보충에 인적 또는 물적으로 상당한 투자를 한 데이터베이스제작자에 해당하고, 피고는 원고의 사이트를 미러링하는 방법으로 원고 사이트에 관한 복제권, 전송권을 침해하였다고 하면서 피고의 원고 저작권 침해를 인정하였습니다.

또한 피고(사람인)가 크롤링 방식으로 원고(잡코리아)의 웹 사이트에 게재된 채용정보를 그대로 복제하여 피고 웹사이트에 이를 게재한 사건(서울고등법원 2017. 4. 6. 선고 2016나2019365 판결, 대법원에서 심리불속행으로 확정)에서 법원은 역시 원고가 데이터베이스제작자임을 전제로 피고의 행위가 저작권법상 데이터베이스제작자의 권리(복제권 등)를 침해하였다고 인정하였습니다.

위 두 사건에서 원고들은 부정경쟁방지법상 일반 부정경쟁행위도 주장하였으나, 일반 부정경쟁행위의 보충성으로 인해 법원은 저작권 침해를 인정하는 이상 따로 일반 부정경쟁행위가 성립하는지를 판단하지는 않았습니다.

최근 현재 진행중이거나 종료된 크롤링 사건(야놀자/여기어때 사건, 네이버/다윈중개 사건, 스마트스코어 사건)에서도 이와 유사하게 저작권 침해가 주위적으로, 일반 부정경쟁행위가 보충적으로 주장되고 있거나 되었습니다.

3. 최근 편입된 부정경쟁행위인 데이터 부정사용행위 규정으로 인한 기존 논의의 변경 가능성

2022. 4. 20. 시행된 ‘데이터 산업진흥 및 이용촉진에 관한 기본법’(‘데이터 기본법’)은 데이터생산자가 인적 또는 물적으로 상당한 투자와 노력으로 생성한 경제적 가치를 가지는 데이터(‘데이터자산’)는 보호되어야 한다고 선언한 후(동법 제12조 제1항), 누구든지 이러한 데이터자산을 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 무단 취득·사용·공개하거나 이를 타인에게 제공하는 행위, 정당한 권한 없이 데이터자산에 적용한 기술적 보호조치를 회피·제거 또는 변경하는 행위 등 데이터자산을 부정하게 사용하여 데이터생산자의 경제적 이익을 침해하여서는 아니 된다고 규정하면서도(동법 제12조 제2항), 구체적인 데이터자산의 부정사용 등 행위에 관한 사항은 부정경쟁방지법에서 정한 바에 따른다고 규정하고 있습니다(동법 제12조 제3항).

이러한 데이터 기본법의 위임에 따라 제정된 부정경쟁방지법상 데이터 부정사용행위는 해당 부정경쟁행위에 의해 보호되는 데이터의 범위를 데이터 기본법의 경우보다 좁히고 있습니다. 즉 개정 부정경쟁방지법 제2조 제1호 카목은 부정경쟁방지법에 의해 보호되는 데이터를 “데이터 기본법 제2조 제1호에 따른 데이터 중 업(業)으로서 특정인 또는 특정 다수에게 제공되는 것으로, 전자적 방법으로 상당량 축적ㆍ관리되고 있으며, 비밀로서 관리되고 있지 아니한 기술상 또는 영업상의 정보”에 한정하고 있습니다. 또한 규율하는 행위도 접근권한 없는 자의 부정취득 등의 행위, 접근권한 있는 자의 부정한 목적 사용 등의 행위, 데이터 보호를 위한 기술적 보호조치 무력화로 데이터 기본법의 ‘누구든지 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 무단 취득·사용·공개’하는 행위보다 그 범위가 축소되어 있습니다.

따라서 특정인 또는 특정 다수가 아니라 불특정 다수에게 제공되는 데이터는 최근 부정경쟁방지법에 편입된 데이터 부정사용행위의 보호객체가 아니며, 불특정 다수에게 공개된 정보를 긁어 모으는 방법으로 빅데이터를 수집하는 일반적인 크롤링에 대해서도 최근 편입된 데이터 부정사용행위를 적용할 수 없습니다. 이처럼 불특정 다수에게 제공되는 데이터에 대해 부정경쟁행위의 적용을 배제한 것은 4차 산업혁명 시대에 데이터 산업 발전을 위해서는 데이터의 이용·유통이 활성화될 필요성이 있기 때문이라고 설명되고 있습니다.

문제는 이러한 최근 편입된 데이터 부정사용행위 규정으로 인해 크롤링에 대해 일반 부정경쟁행위를 주장하던 관행이 변경될 수 있을지 여부입니다. 현행 부정경쟁방지법 제2조 제1호 타목의 일반 부정경쟁행위는 다른 부정경쟁행위에 대한 보충적 일반행위로 보는 것이 일반적이고, 하급심 판결이기는 하나 법원도 “특별한 사정이 없는 이상 (가) 내지 (자)목에서 정하고 있는 행위유형에는 해당하나 위 각 목에서 정하고 있는 부정경쟁행위로 인정되기 위한 요건을 갖추지 못한 행위에 대하여는 (차)목에 의한 부정경쟁행위[주: 현행 (타)목의 일반 부정경쟁행위]로 함부로 의율하여서는 아니 된다”고 판시하고 있으므로(서울중앙지방법원 2014. 8. 28. 선고 2013가합552431 판결, 확정), 전형적인 부정경쟁행위인 데이터 부정사용행위에 의해 보호되지 않는 불특정 다수에게 공개된 정보 내지는 데이터를 일반 부정경쟁행위에 의하여 보호받기는 쉽지 않을 것으로 보입니다.

과거 문제된 크롤링은 모든 정보를 미러링 하는 형태로 위법성이 두드러졌으나, 현재 문제되는 크롤링은 일부 정보만을 선택적으로 수집, 사용하는 형태로 진화하였고, 그러한 크롤링의 목적과 관련하여서도 소비자들의 후생 내지는 빅데이터 독점의 폐해를 지적, 강조하고 있다는 점에서 더욱 그러합니다.

이광욱 변호사 ([email protected])

임철근 변호사 ([email protected])

이근우 변호사 ([email protected])

무단 크롤링의 법적 문제



크롤링 및 스크래핑은 많은 기업들이 데이터를 확보하기 위해 활용하는 방식이며, 이용자로서는 여러 곳에 흩어진 정보를 한번에 열람할 수 있어 편리한 기술입니다. 크롤링은 현행법상 금지되어 있는 것은 아니나, 무단으로 크롤링을 실행하는 경우 저작권법과 부정경쟁방지법 위반 행위 에 해당할 수 있어 주의가 필요 합니다.

사람인 & 잡코리아 사례

인터넷취업 웹사이트 사람인은 같은 인터넷 취업 웹사이트인 잡코리아에 기재된 채용정보를 크롤링하여 자신의 웹사이트에 게시하였습니다. 이에 잡코리아(이하 원고)가 사람인(이하 피고)을 상대로 제기한 저작권침해금지 등 청구 소송에서 1심은 원고 웹사이트의 HTML 소스 중 화면에 나타나는 텍스트 부분은 채용 관련 정보로서 저작권법의 보호대상이 아니며 , HTML 소스가 나타내는 화면 역시 창작성이 없어 저작물로 보기 어렵다고 판단 하였습니다(서울중앙지방법원 2016. 2. 17. 선고 2015가합517982 판결 참조).

그러나 동시에 ① 위 HTML 소스는 원고가 마케팅 및 개발 비용 등을 지출하여 원고 웹사이트에 게재할 채용정보를 개별 구인업체들로부터 수집하고, 수집한 정보를 원고 웹사이트의 양식에 맞게 새롭게 작성한 것으로 원 고가 상당한 투자와 노력을 통해 얻은 것 인 점, ② 원고는 선별적으로 크롤링을 허용하고 있는데, 피고는 IP를 인위적으로 분산하여 원고가 크롤링을 불허한 페이지까지 무분별하게 크롤링한 점 등에 비추어 원고의 행위가 부정경쟁방지법 제2조 제1호 차목(현 카목)의 부정경쟁행위에 해당한다고 보았습니다.

쌍방 항소하여 이어진 항소심에서 원고는 저작권법상 데이터베이스제작자로서의 권리를 주장하였고, 데이터베이스는 프로그램저작물과는 달리 창작성을 요건으로 하지 않는 바, 법원은 여러 구인업체의 채용정보를 체계적으로 배열·수록한 원고 웹사이트가 데이터베이스에 해당하며, 그 제작과 소재의 갱신·검증에 인적 또는 물적으로 상당한 투자를 한 원고는 데이터베이스제작자에 해당한다고 보았습니다(서울고등법원 2017. 4. 6. 선고 2016나2019365 판결 참조).

야놀자 & 여기어때 사례

최근 숙박업소 정보 제공 업체 야놀자가 여기어때를 상대로 낸 권리침해금지 소송에서도 법원은 야놀자가 상당한 비용과 시간을 들여서 수집·분류·갱신한 숙박업소 정보를 여기어때가 무단으로 복제한 것은, 공정한 상거래 관행이나 경쟁질서에 반하는 방법으로 야놀자의 경제적 이익을 침해 한 것이라 보았습니다(서울중앙지방법원 2018가합508729 판결 참조).

즉 인터넷 홈페이지에 게시된 상대방의 저작물을 그대로 복사하여 사용하는 것이 저작권법에 위반되는 무단 복제·배포 행위임은 물론이고, 상대방의 창작성이 들어간 저작물이 아니라 하더라도 상대방이 상당한 비용과 시간을 들여 구축한 데이터베이스에 해당하는 경우에는, 이를 무단으로 크롤링하는 것이 저작권법 위반 행위일 뿐 아니라 부정경쟁방지법 위반 행위에도 해당할 수 있습니다.

막대한 양의 정보를 일정한 기준에 따라 선별 및 배열하는 데에도 적지 않은 노력이 들어가는 것을 고려하면, 상대방이 상당한 투자와 노력을 들여 구축한 데이터베이스를 그대로 가져다 사용하는 행위에 제한을 가한 법원의 판단은 타당한 것으로 생각됩니다.

MISSION 박진우 변호사

[민후의 기·꼭·법]크롤링의 위법성은?

[법무법인 민후 원준성 변호사] ‘정보의 바다’인 인터넷에서 필요한 데이터를 일일이 선별해 내는 일은 많은 시간과 노력이 필요하다. 이에 크롤링(소프트웨어를 이용해 유용한 정보를 찾아 수집하는 방식)을 통해 필요한 데이터를 수집하는 경우가 심심치 않게 존재한다.그런데 최근 크롤링 행위자에 대한 민·형사상 책임이 인정되는 법원의 판례들이 속속 등장하고 있다. 얼핏 결과만을 봐서는 크롤링 행위는 위법한 행위로서 금지되는 것으로 보인다.실상은 그렇지 않다. 크롤링 행위 그 자체는 위법하지도 적법하지도 않은 무색투명한 개념이다. 우리 형법 어디에도 ’크롤링죄‘를 두고 있지 않다는 점을 명심해야 한다.문제되는 것은 크롤링 행위가 우리 형법이 보호하고 있는 다른 법익을 침해하여 별개의 죄를 구성하는 경우이다. 요리의 도구로서 식칼을 구입하는 행위는 위법하지 않지만 살인의 도구로서 구입하는 행위는 살인예비죄로서 위법한 행위가 될 수 있는 것과 같다.크롤링 행위에서 문제되는 대표적인 두 가지 법적 문제를 살펴보려 한다.하나는 정보통신망법 제48조 제1항 위반 문제이고, 또 다른 하나는 저작권법 제93조 제1항 침해 문제이이다.먼저 정보통신망법에 대하여 살펴보도록 하겠다. 정보통신망법은 ‘정당한 접근권한 없이 또는 허용된 접근권한을 넘어 정보통신망에 침입’하는 행위를 금지하고 있다. 여기서 접근권한의 부여는 서비스제공자가 하므로, 크롤러가 서비스제공자로부터 받은 ’접근권한의 유무‘가 본조 위반을 가름 짓는다.한편 크롤러들이 쉽게 접할 수 있는 ‘로봇배제표준’을 두고 개발자간 의견이 나뉘기도 했다. 로봇배제표준이란 사이트 관리자가 크롤링 가능 및 범위에 관한 내용들을 기재한 ‘robots.txt’ 파일을 웹 사이트의 최상단에 등록해 놓으면, 구글 크롤러가 해당 웹 사이트를 크롤링 할 경우 미리 그 내용을 확인해 허용된 정보만을 크롤링 하기로 한 일종의 구글의 약속이다.따라서 서비스제공자가 robot.txt 파일을 등록해 놓은 경우, 그 문서의 목적과 내용이 크롤러에게 접근 가능 범위를 명시적으로 안내해 주는 내용의 문서라는 점에서, 이는 크롤러의 접근권한을 확인할 수 있는 유용한 근거가 될 수 있다.다만, 이는 robot.txt가 등록돼 있는 경우의 판단에 한정됨을 유의해야 한다. 혹자는 robot.txt가 등록돼 있지 않다는 사실을 들어, 크롤링을 모두 허용한 것 아니냐고 주장할지도 모른다.로봇배제표준은 강제력 없는 구글 크롤러의 권고에 불과하다. 서비스 제공자가 반드시 robot.txt를 등록해야 하는 것은 아니며 그럴 의무도 없다.두 번째는 데이터베이스제작자의 권리 침해 문제이다. 크롤링의 최종 목적은 데이터의 수집에 있다. 낱개의 개별 정보를 일일이 수집하는 것에 많은 시간과 비용이 투입되기 때문에, 수집과 저장의 과정을 알고리즘화 한 프로그램으로 하여금 자동적으로 그리고 효율적으로 데이터를 수집하게 하려 하기 위함이다.수집하는 것이 낱개의 데이터인 경우라면 큰 문제가 발생하지 않는다(물론 정보통신망 침입의 문제는 별개이다). 그러나 크롤링의 목적을 고려하면, 가장 탐나는 크롤링 대상은 이미 타인이 수집해 체계화 헤 정렬한 데이터의 뭉치, 즉 데이터베이스일 것이다.데이터베이스의 재산적 가치는 사뭇 다르다. 멀리 갈 것 없이 크롤링 행위의 목적만 보더라도 이를 쉽게 알 수 있다. 비효율성을 극복하고 수집, 정리, 체계화를 통해 구축한 데이터베이스를 수집하는 것이 크롤링의 목적임을 고려하면 데이터베이스에 재산적 가치가 존재한다 것과 같은 의미로 볼 수 있다.우리 저작권법 역시 데이터베이스제작자의 권리를 명시적으로 보호하고 있다. 데이터 수집, 정리, 체계화, 관리 등에 투입된 상당한 비용과 노력 자체를 권리로써 보호해 주기 위한 것이다.그렇다면 크롤링을 계획하는 경우 그 데이터 수집행위가 이미 타인이 인적·물적 투자로 제작·관리하고 있는 데이터베이스 전부 혹은 상당한 부분을 복제하는 것은 아닌지를 신중히 검토해야 할 것이다.이렇듯 크롤링 행위는 그 자체가 언제나 위법한 것이 아니라, 그 행위가 형법이 금지하는 위법행위를 구성하는 경우에 한해 위법한 것이다. 구체적인 사안을 꼼꼼히 대입해 위법성을 판단해 적법하고 효율적인 업무를 누릴 수 있도록 준비해야 할 것이다.

[크롤링] 크롤링의 법적 문제

Why So Serious? Just For Fun. No Fun No Gain

누누 컴퍼니 내부에서 네트워크가 아닌 다른 주제의 포스팅을 원하여 새로운 주제를 선정하는 중입니다. 아마 데이터 베이스나 크롤링에 관련된 주제로 정해질 것 같습니다. 네트워크에 대한 나머지 내용들은 제 블로그를 열게 되면 이어서 포스팅하거나 추후에 다시 포스팅하도록 하겠습니다.

이번 포스팅에서는 크롤링의 법적 문제에 대해 이야기해볼까 합니다. 4차 산업혁명 시대가 되면서 데이터의 가치는 더욱 높아졌습니다. 데이터를 이용하면 소비자의 행동을 분석하거나 시장 변동을 예측해내는 것도 가능하며 영상을 실시간으로 인식하여 사람을 구별하는 것도 가능합니다. 그 외에도 데이터를 이용한 사례들은 기술의 발전에 따라 무궁무진해지고 있습니다.

데이터의 가치가 높아지며 함께 대두한 문제는 데이터의 불균형이었습니다. 기존에 존재하는 기업들은 이미 많은 양의 데이터를 확보한 상태였고, 신생 기업들은 데이터를 모으는데 어려움을 겪고 있었습니다. 데이터의 빈익빈 부익부 현상은 기업의 성장에도 직결되는 문제가 되었고, 신생 기업들은 기성 기업들을 빠르게 따라잡기 위해서 크롤링을 시도하게 된 것입니다.

데이터의 빈익빈 부익부 현상을 줄인다는 허울 좋은 목적이 있지만 크롤링은 불법입니다. 실제로 사람인은 크롤러를 통한 자동 게재 시스템을 통해 잡코리아의 채용정보를 복제하여 게시하였고, 2008년 잡코리아에서는 이를 문제 삼아 소송을 제기하게 되었습니다. 10년의 공방 끝에 2018년 대법원에서는 크롤링이 위법 행위임을 선고하였습니다.

크롤링은 경쟁사의 컨텐츠를 가져와 활용하는 부분도 문제가 되지만 트래픽의 관점에서도 문제를 발생시킵니다. 사이트에 있는 대량의 정보를 크롤링하기 위해 지속적으로 빠르게 서버를 긁어내게 되면 마치 디도스 공격 같은 효과를 내게 됩니다. 또한 트래픽의 과다는 서버를 운영하는 회사의 막대한 부담금으로 작용하게 됩니다.

그렇다면 모든 부분의 크롤링은 불가능할까. 그렇지 않습니다. 각 웹사이트는 robots.txt라는 파일을 이용하여 검색엔진이 크롤링을 하지 않길 바라는 부분을 표시하고 액세스 권한도 알려줍니다. robots.txt는 검색로봇에게 사이트 및 웹페이지를 수집할 수 있도록 허용하거나 제한하는 국제 권고안입니다. robots.txt 파일은 항상 사이트의 루트 디렉터리에 위치해야 하며 로봇 배제 표준을 따르는 일반 텍스트 파일로 작성해야 합니다. 하단에 첨부한 네이버의 글을 보면 robots.txt 규칙 예제를 참고할 수 있습니다.

아무리 robots.txt에 액세스를 허용하고 있더라도 개인정보와 관련되어 있다면 문제가 발생할 수도 있습니다. 결론적으로 크롤링을 할 때는 아래와 같은 것들을 신경 써야 한다고 전문가들이 이야기합니다.

1. 스크랩하는 컨텐츠에 지적재산권이 있는지

2. 크롤링 하는 행동이 사이트에 큰 부담을 주지 않는지

3. 크롤러가 사이트의 이용 방침을 위반하지 않는지

4. 크롤러가 사용자의 민감한 정보를 가져오지 않는지

5. 가져온 컨텐츠를 적합한 사용 표준 하에 사용하는지

추후에 글의 주제가 크롤링으로 선정되게 된다면 크롤링용 전용 사이트를 직접 제작하여 예제를 올려드릴 예정입니다. 읽어주셔서 감사합니다.

크롤링 법적 문제 질문

회사에서 외주를 받아서 A사이트를 크롤링 하고 있습니다.

robots.txt에 Disallow: / 되어있지만… 뭐 하라니까 합니다ㅜㅜ

보통 50 ~ 80초 사이에 한번씩 요청을 보내고있고요

혹시 크롤러 개발을 완료했을때 크롤링 때문에 의뢰자와 A사이트가 법적 분쟁이 생겼을때

그걸 개발한 저나 제 회사에 피해가 갈수 있을까요?

크롤링 관련 최근 대법원 판결과 그 시사점

대법원은 지난 달 숙박업소 정보제공 서비스 업체의 데이터베이스 크롤링에 관한 형사 사건에서 피고인들에 대해 무죄를 선고한 원심의 판단을 인용하는 판결을 선고하였습니다(대법원 2022. 5. 12. 선고 2021도1533 판결, 이하 “대상판결”). 대상판결은 온라인 플랫폼 기반의 O2O(Online to Offline) 서비스 분야의 경쟁 과정에서 널리 행해지고 있는 크롤링 관행에 관한 사업자들의 법적 리스크 판단에 중요한 시사점을 제공합니다. 저희 법무법인 세종 IP그룹은 본 뉴스레터를 통해 대상판결의 의의 및 크롤링 분쟁에 대비하여 사업자들이 유의할 사항을 정리하였습니다.

[크롤링의 의의 및 법적 쟁점]

크롤링(crawling) 또는 웹크롤링(web crawling)이란 로봇 프로그램을 이용하여 웹사이트에서 기계적인 방법으로 정보를 수집하는 행위를 의미하며, 일반적으로 특정 URL에 접근하여 HTML 코드상의 태그를 따라가며 웹페이지를 수집, 인덱싱하는 방법으로 수행됩니다. 오늘날 웹 또는 앱을 통해 온라인으로 정보나 콘텐츠를 제공하는 사업방식은 보편화되었습니다. 따라서 온라인상에 공개된 정보를 크롤링을 활용해 수집하고 참조하는 것은 온라인 경쟁환경에서 불가피한 것으로 볼 여지가 있습니다. 그러나 다른 한편으로, 온라인 서비스에서 제공되는 정보를 수집하고 관리하기 위해서는 인적·물적 투자가 요구되므로, 그러한 투자의 결과물을 경쟁업체가 대량으로 복제하여 활용하는 ‘무단편승’ 행위를 제재해야 한다는 시각도 존재합니다.

시장에 존재하는 이러한 상반된 시각으로 인해 크롤링에 관한 법적 분쟁의 가능성은 상존한다고 할 수 있는데, 대상판결 선고 이전의 대표적인 크롤링 사건인 엔하위키미러 사건1과 사람인 사건2에서 확인되듯이 크롤링 분쟁에서는 통상 저작권법 제93조의 데이터베이스제작자의 권리를 침해한다는 주장과 「부정경쟁방지 및 영업비밀보호에 관한 법률」(이하 “부정경쟁방지법”) 제2조 제1호 (파)목3의 타인의 상당한 노력이나 투자로 만들어진 성과 등을 무단으로 사용하는 행위라는 주장이 함께 제기됩니다. 이에 더해, 최근에는 크롤링 행위가 「정보통신망 이용촉진 및 정보보호 등에 관한 법률」(이하 “정보통신망법”) 제48조 제1항의 정보통신망 침입행위에 해당한다는 주장이 제기되는 경우도 늘고 있습니다. 저작권법 위반 및 정보통신망법 위반의 경우 형사처벌 대상이 되므로 형사사건이 진행되는 경우도 빈번하지만, 부정경쟁방지법 제2조 제1호 (파)목 위반의 경우 형사처벌 대상에서 제외되어 있으므로 민사소송의 청구원인으로만 활용되고 있는 실정입니다.

[대상판결의 검토]

1. 사실관계 및 사건의 경과

피고인 회사와 피해자 회사는 숙박업소 정보제공 서비스를 운영하는 경쟁 사업자들로서, 피해자 회사는 모바일 앱에서 API 서버에 정보를 호출하여 숙박업소에 관한 정보를 내려받아 이용자에게 제공하는 방식으로 서비스를 제공했습니다. 피고인 회사는 ‘패킷캡쳐’ 분석을 통해 만든 크롤링 프로그램으로 피해자 회사의 API 서버에 주기적으로 접근해 피해자 회사에서 제공하는 숙박업소 정보를 복제했습니다. 피고인 회사의 크롤링 프로그램은, 피해자 회사의 앱이 이용자 위치로부터 7~30km 범위에서 숙박업소를 검색하도록 설정된 것과는 달리 특정 위도/경도를 중심으로 반경 1,000km 내의 숙박업소 정보를 불러오는 방식으로 위 API 서버로부터 정보를 수집하였습니다.

피해자 회사의 고소에 따라, 피고인 회사와 그 임직원인 피고인들에 대해 정보통신망법 위반죄(정보통신망침해등), 저작권법 위반죄(데이터베이스제작자 권리 침해), 형법상의 컴퓨터등장애업무방해죄에 관한 공소가 제기되었고, 제1심 법원은 위 각 범죄사실에 대해 모두 유죄를 선고하였습니다.4 그러나 항소심에서 서울고등법원은 위 범죄사실 모두에 대해 무죄를 선고하였고,5 상고심인 대상판결에서 대법원은 원심판결에 수긍하면서 피고인들의 무죄를 확정하였습니다.6

2. 대상판결의 요지

대상판결은 위 3가지 범죄사실에 관해 각각 다음과 같이 판시하였습니다.

정보통신망법 위반죄(정보통신망침해등) 에 관해서는, 정보통신방법 제48조 제1항에 따른 접근권한의 유무 또는 범위는 서비스제공자가 부여한 접근권한을 기준으로 판단해야 한다는 기존 판례를 인용하면서, 서비스제공자가 접근권한을 제한하고 있는지 여부는 보호조치나 이용약관 등 객관적으로 드러난 여러 사정을 종합적으로 고려하여야 한다는 기준을 설시한 뒤, 다음과 같은 사정을 들어 피해자 회사가 접근권한을 제한하지 않았으므로 정보통신망 ‘침입’을 인정할 수 없다고 판단하였습니다. 즉, (i) 피해자 회사의 API 서버 URL이나 명령구문은 누구라도 통상적인 ‘패킷캡쳐’ 프로그램 등을 통해 쉽게 알아낼 수 있는 정보이며, 피해자 회사 API 서버로의 접근을 막는 별도의 보호조치가 없었고, (ii) 피해자 회사의 이용약관상 제한은 피고인들과 같은 비회원에게 적용된다고 보기 어렵고 규정 내용도 접근권한 자체를 제한하는 것으로 볼 수 없다는 것이었습니다.7

저작권법 위반죄(데이터베이스제작자 권리 침해) 에 관해서는, 데이터베이스의 상당한 부분의 복제등(저작권법 제93조 제1항)에 관한 판단은 양적인 측면뿐 아니라 질적인 측면도 함께 고려되어야 하며 이때 질적으로 상당한 부분인지 여부는 복제된 부분의 개별 소재 자체의 가치나 그 생산에 대한 투자가 아니라 그 제작, 갱신·검증 또는 보충에 대한 상당한 투자 여부를 기준으로 제반사정에 비추어 판단해야 한다는 기준을 제시하고, 상당한 부분의 복제등으로 간주되는 반복적이거나 체계적인 복제등(저작권법 제93조 제2항 단서)에 관해서는 “결국 상당한 부분의 복제등을 한 것과 같은 결과를 발생하게 한 경우에 한하여 인정함이 타당하다”고 판시 하면서, 다음과 같은 사정을 들어 피고인들의 행위가 저작권법 제93조 제1항 및 제2항 단서 위반에 해당하지 않는다고 보았습니다. (i) 피고인들이 수집한 정보들은 피해자 회사의 숙박업소 데이터베이스의 일부에 해당한다는 점, (ii) 위 정보들은 이미 상당히 알려진 정보로서 그 수집에 상당한 비용이나 노력이 들었을 것으로 보이지 않거나 이미 공개되어 있고, 데이터베이스의 갱신 등에 관한 자료가 없다는 점, (iii) 피고인들의 행위가 피해자 회사의 데이터베이스의 통상적인 이용과 충돌하거나 피해자 회사의 이익을 부당하게 해치는 경우에 해당한다고 보기 어렵다는 점이 그것입니다.8

형법상의 컴퓨터등장애업무방해죄 에 관해서는, 동 범죄가 성립하려면 가해행위의 결과 정보처리에 장애가 현실적으로 발생하여야 한다는 기존 판례 입장을 재확인한 뒤, 검사가 제출한 증거들로부터 피고인들이 정보처리장치에 부정한 명령을 입력하여 장애가 발생하게 하였다고 보기 어렵다는 이유로 동 범죄의 성립을 부정하였습니다.9

3. 관련 민사 판결과의 관계 및 대상판결의 시사점

한편, 대상판결의 원심판결이 선고된 뒤에, 피해자 회사가 피고인 회사를 상대로 제기한 민사소송에서 제1심 판결이 선고되었습니다.10 위 민사 사건에서는 구 부정경쟁방지법 제2조 제1호 (카)목 위반과 데이터베이스제작자 권리 침해가 선택적 청구원인으로 주장되었는데, 제1심 법원은 부정경쟁행위 주장에 관해서만 판단하여 불법행위를 인정하고 원고의 청구를 (일부)인용하였습니다. 민사 판결에서 두 선택적 청구원인 중 부정경쟁행위 주장에 관해서만 판단한 것은, 민사 사건 제1심 계속 중에 다른 청구원인인 데이터베이스제작자의 권리 침해에 대해 형사 사건 항소심 판결에서 무죄가 선고되었기 때문인 것으로 생각됩니다. 전술한 바와 같이 구 부정경쟁방지법 제2조 제1호 (카)목 위반에 대해서는 형사처벌 규정이 없어 대상판결에서는 저작권법이나 정보통신망법 등 위반에 대해서만 판단하였는바, 구 부정경쟁방지법 제2조 제1호 (카)목 위반의 구성요건은 저작권법이나 정보통신망법 등 위반의 구성요건과 다르기 때문에 민사 사건에서 피고인 회사의 책임을 인정한 것이 형사 판결의 결론과 모순된다고 볼 수는 없습니다.

다만, 위와 같은 형사 판결과 민사 판결의 적용법조의 차이로부터 크롤링 분쟁에 관한 시사점을 얻을 수 있습니다. 앞서 언급했듯이 크롤링 관련 민사소송에서는 통상 저작권법상 데이터베이스제작자 권리 침해와, 부정경쟁방지법 제2조 제1호 (파)목의 부정경쟁행위가 선택적 청구원인으로 함께 주장되며, 법원은 원고 청구를 인용할 경우 대체로 데이터베이스제작자 권리 침해 주장을 중심으로 청구원인을 판단해 왔습니다.11 이러한 태도는 저작권법에 대한 부정경쟁방지법의 보충적 지위 및 위 일반조항의 보충성을 고려한 것으로 보입니다. 크롤링 사건에서 법원은 기계적 정보 수집이라는 크롤링의 속성을 고려하여 ‘데이터베이스의 상당한 부분의 복제등’(저작권법 제93조 제1항)을 직접 인정하기보다 상당한 부분의 복제로 간주되는 ‘반복적이거나 체계적인 복제등’(저작권법 제93조 제2항 단서)에 해당함을 인정한 경우가 많았습니다.12 그러나 대상판결에서는 이처럼 크롤링 사건에서 중심적 역할을 하는 ‘반복적이거나 체계적인 복제등’에 관해 “상당한 부분의 복제등을 한 것과 같은 결과를 발생하게 한 경우에 한하여 인정”하여야 한다고 하여 해당 요건이 보다 엄격하게 해석되어야 한다는 입장을 제시 했고, 이러한 판시는 향후 민사 사건에서의 법원의 판단에도 영향을 미칠 것으로 예상됩니다.13 즉, 민사상 불법행위 인정에 관한 법원의 판단에 있어서, 데이터베이스제작자 권리 침해 여부가 중심이 되었던 기존 경향에 비해 부정경쟁방지법 제2조 제1호 (파)목의 역할이 더 부각될 것으로 예상됩니다. 이에 따라 크롤링 분쟁의 당사자가 되는 기업들로서는 어느 쪽이든 부정경쟁방지법상 성과 도용 행위에 관한 주장·증명에 소홀하지 않도록 유의할 필요가 있겠습니다.

한편, 대상판결에서 당해 사건의 피고인들에 대해 무죄로 판단한 것을 크롤링 행위 전반에 대해 법원이 관대한 태도로 전환하였다거나, 형사 판결과 민사 판결 간의 본질적 차이로 일반화하는 과도한 확대해석 또한 경계할 필요가 있습니다. 대상판결에서 정보통신망법 위반죄와 저작권법 위반죄에 관한 무죄 판결의 기초가 되었던 사실관계에는 나름의 특수성이 있기 때문입니다. 이 사건에서는 (i) 웹사이트에의 접근이 아닌 백엔드(back-end)의 API 서버에의 접근이 문제가 되었는데 API 서버 접근에 대한 특별한 보호조치가 없었던 점, (ii) 크롤링을 통해 수집된 정보가 데이터베이스를 구성하는 50여개 항목 중 3 내지 8개로 양적 상당성을 인정하기 어려운 수준이었고, (iii) 그 정보들이 대부분 이용자들에게 공개된 것이거나 쉽게 수집할 수 있는 것이어서 질적 상당성 역시 인정하기 어려웠으며, (iv) 약관상 크롤링 제한의 내용이 모호했고 피고인들이 약관의 적용을 받는 회원이 아니었다는 점 등의 사정이 무죄 판단을 뒷받침했습니다. 이러한 대상판결의 사실관계 면의 특수성은, 웹사이트에서 검색 등을 통해 제공되는 체계화된 정보들이 데이터베이스로 평가될 수 있고 크롤링된 정보의 분량이나 비율 혹은 크롤링의 빈도가 상당한 경우, 웹사이트에 크롤링 금지 문구가 있거나 약관에 명시적 제한이 존재하는 경우, 유료로 제공되는 정보를 회원 ID를 이용해 기계적으로 수집하여 영리적으로 활용하였으나 그것이 약관에 위반되는 경우 등에는 대상판결과 다른 결론이 내려질 수 있음 을 시사합니다.14

[크롤링 분쟁에 대비하여 유의할 사항]

대상판결은 크롤링 사안의 데이터베이스제작자 권리 침해 판단에 있어 중심적 위치를 차지하는 저작권법 제93조 제2항 단서 요건에 관한 엄격한 판단 기준을 제시했다는 점에서 크롤링 분쟁에 관한 법원의 입장에 영향을 미칠 것으로 기대됩니다. 이는 정보통신망법 제48조 제1항의 서비스제공자의 접근권한 제한에 관한 판단의 기준으로 “보호조치나 이용약관 등”의 객관적인 사정을 고려해야 한다는 판시와 더불어, 향후 크롤링 관련 민사 분쟁에서 부정경쟁방지법 제2조 제1호 (파)목과 정보통신망법 위반에 따른 불법행위 주장의 위상을 부각시킬 것으로 예상됩니다. 아울러, 대상판결의 특수한 사실관계에도 주목할 필요가 있음을 앞서 살펴보았습니다.

이러한 대상판결의 판시와 사실관계를 고려할 때, 온라인 서비스 제공사업자들이 크롤링 분쟁에 대비하여 유의할 사항들을 정리해 보면 다음과 같습니다.

온라인 서비스 제공사업자는 웹사이트나 데이터베이스가 보관된 서버에의 접근을 제한하기 위한 보안조치를 마련함으로써(예: 접속 허가 계정 관리, 암호화 등) 제3자의 크롤링 행위가 정보통신망 침입이나 데이터베이스제작자 권리 침해로 판단될 가능성을 높일 수 있습니다.

웹페이지에 크롤링 금지 경고문구를 기재하고, 이용약관에 크롤링 행위를 금지하는 취지를 명확하게 기재한다면 크롤링 행위의 위법성이 인정될 가능성을 높일 수 있습니다. 15

일부 크롤링 분쟁 사건에서는 크롤링된 웹사이트와 크롤링한 사업자의 웹사이트에서 공통의 오류나 특이한 표현방식이 광범위하게 발견된다는 점이 데이터베이스의 상당한 부분의 복제 혹은 반복적·체계적 복제 사실을 인정하는 근거가 되었습니다. 16 이와 같은 이른바 ‘워터마크(watermark)’ 정보(자연적인/인위적인 오류 혹은 비일반적인 표현방식)를 데이터베이스 소재에 삽입해 두면 크롤링 분쟁에서 크롤링 행위의 증거로 사용될 수 있습니다.

이와 같은 이른바 ‘워터마크(watermark)’ 정보(자연적인/인위적인 오류 혹은 비일반적인 표현방식)를 데이터베이스 소재에 삽입해 두면 크롤링 분쟁에서 크롤링 행위의 증거로 사용될 수 있습니다. 다수의 하급심 판결에서 데이터베이스제작자가 ‘수작업’으로 정보를 수집 또는 분류하고 갱신·검증을 위해 지속적으로 현장을 방문하여 확인하는 등의 인적 투자를 한 것이 데이터베이스제작자의 권리 침해를 인정하는 중요한 사정이 되었습니다. 17 데이터베이스 구축 과정에서 이와 같은 인적 투입요소에 관한 구체적인 기록 혹은 증빙자료를 많이 확보해 둔다면 크롤링 분쟁에서 권리 침해 인정 가능성을 높일 수 있습니다. 18

데이터베이스 구축 과정에서 이와 같은 인적 투입요소에 관한 구체적인 기록 혹은 증빙자료를 많이 확보해 둔다면 크롤링 분쟁에서 권리 침해 인정 가능성을 높일 수 있습니다. 웹사이트에 회원 ID를 이용해 접근하는 경우 해당 웹사이트의 이용약관에서 크롤링을 금지하는지 여부, 크롤링할 정보가 누구에게나 공개된 것으로서 쉽게 수집할 수 있는 것인지 혹은 유료회원 등 제한적인 범위에서만 제공되는 것인지 여부는 크롤링 행위에 따른 법적 판단에 중요한 고려요소가 되므로 위와 같은 사항을 사전에 점검하는 것이 바람직할 것입니다.

1 서울중앙지방법원 2015. 11. 27. 선고 2014가합44470 판결(제1심); 서울고등법원 2016. 12. 15. 선고 2015나2074198 판결(항소심); 대법원 2017. 4. 13. 선고 2017다204315 판결(상고심).

2 서울중앙지방법원 2016. 2. 17. 선고 2015가합517982 판결(제1심); 서울고등법원 2017. 4. 6. 선고 2016나2019365 판결(항소심); 대법원 2017. 8. 24. 선고 2017다224395 판결(상고심).

3 2021. 12. 7. 법률 제18548호로 개정되어 2022. 4. 20. 시행된 개정 부정경쟁방지법상의 조항을 따른 것으로, 위 개정법 전의 구법상 조항은 동조 동호 (카)목입니다.

4 서울중앙지방법원 2020. 2. 11. 선고 2019고단1777 판결.

5 서울고등법원 2021. 1. 13. 선고 2020노611 판결.

6 대법원 2022. 5. 12. 선고 2021도1533 판결.

7 원심판결에서는 위와 같은 사정 외에, 피고인들이 크롤링해간 정보들이 피해자 회사가 숙박 영업 예약을 위해 이용자들에게 공개한 정보이고, 달리 피고인들이 피해자 회사의 API 서버에 접근하여 비공개 정보를 취득한 사정은 발견되지 않는다는 점도 추가로 설시하였습니다.

8 원심이 인용한 사실관계에 따르면, 피해자 회사의 데이터베이스에 포함된 50여개 숙박업소 정보 항목 중 피고인들이 크롤링한 항목은 적게는 3개, 많게는 8개였고, 이들 정보는 ‘업체명’, ‘주소’, ‘지역’ 등 피해자 회사가 이용자들에게 공개한 정보였습니다.

9 이와 관련된 원심의 구체적인 판단을 살펴보면, 피고인들의 크롤링 프로그램이 API 서버의 명령구문에 1,000km의 거리 정보를 입력한 것은 ‘주어진 명령구문에 대응하는 숙박업소 정보를 반환하는’ API 서버의 본래 목적에 따른 정보 호출이므로 ‘허위의 정보 또는 부정한 명령의 입력’으로 볼 수 없다는 점, 크롤링 행위 기간 중 피해자 회사의 API 서버에서 일부 접속 장애가 발생한 사실은 인정되나 이는 공휴일 등 특정 일자의 자연 이용자 증가에 따른 것이었을 가능성을 배제할 수 없다는 점 등을 들어 가해행위의 결과 현실적인 정보처리 장애의 발생을 부정하였습니다.

10 서울중앙지방법원 2021. 8. 19. 선고 2018가합508729 판결.

11 크롤링에 관한 대표적 사건인 ‘엔하위키미러 사건’과 ‘사람인 사건’의 항소심 판결을 비롯하여, 데이터베이스제작자 권리 침해와 부정경쟁방지법상 성과 도용 행위가 청구원인으로 함께 주장된 사건에서 선고된 최근 다수의 하급심 판결이 이러한 구조를 취하고 있습니다. 서울고등법원 2021. 8. 19. 선고 2020나2036862 판결; 서울중앙지방법원 2020. 7. 9. 선고 2018가합528464 판결; 서울고등법원 2021. 12. 9. 선고 2020나2042706 판결 등 참조.

12 김현숙, “크롤링을 이용한 공개데이터의 수집·활용의 법적 쟁점에 대한 비판적 검토”, 「강원법학」 제61권(2020), 237면 참조.

13 대상판결의 관련 민사 제1심 판결에서 데이터베이스제작자 권리 침해가 아닌 구 부정경쟁방지법 제2조 제1호 (카)목에 관한 청구원인만을 판단한 것이 대표적인 예입니다.

14 참고로, 하급심 판결이긴 하나 최근의 형사 판결인 서울남부지방법원 2021. 9. 8. 선고 2021고단588 판결에서는, 회원 계정을 이용해 두 피해자 회사의 구인정보 웹사이트에 각각 3만여 회 접속해 해당 웹사이트에 게재된 이력서 정보들을 상당한 양 수집했고, 이용약관에서 회원이 검색한 이력서 정보의 사용목적의 제한 및 무단 복제·재배포 금지의 내용이 명시되어 있던 사안에서, 정보통신망법 위반죄(정보통신망침입) 및 저작권법 위반죄(데이터베이스제작자 권리 침해)의 공소사실 모두에 대해 유죄로 판단한 점을 참고할 수 있습니다.

15 서울중앙지방법원 2020. 7. 9. 선고 2018가합528464 판결은 원고 웹사이트에 자신의 동의 없이 재배포, 무단전재 및 크롤링을 할 수 없다고 안내한 점을 데이터베이스제작자 권리 침해의 인정 근거 중 하나로 적시하였으며, 서울남부지방법원 2021. 9. 8. 선고 2021고단588 판결에서는 피해자 회사의 회원 약관에서 검색 서비스를 직용채용 및 채용중개 또는 구인 구직 이외의 목적으로 사용해서는 안 되고, 서비스를 이용하여 얻은 정보를 피해자 회사의 사전 동의 없이 복제·재배포할 수 없다는 점 등을 명시하고 있는 점을 정보통신망법 위반죄의 유죄 인정의 근거로 언급하였습니다.

16 서울중앙지방법원 2020. 9. 18. 선고 2018가합524486 판결 참조. 또한, 크롤링의 증거가 발견되지 않았음에도 데이터베이스제작자 권리 침해가 인정된 서울고등법원 2021. 12. 9. 선고 2020나2042706 판결에서도, 특이한 주소 정보 표시나 오기, 오류, 정보 누락, 정확한 정보를 확인할 수 없어 임의로 기재한 내용 등의 공통점이 양 데이터베이스에서 광범위하게 발견된다는 사실 인정을 바탕으로 데이터베이스의 상당한 부분의 복제 사실을 인정하였습니다.

17 서울중앙지방법원 2020. 9. 18. 선고 2018가합524486 판결 참조. 또한, 크롤링 사안은 아니지만 서울고등법원 2021. 12. 9. 선고 2020나2042706 판결 참조.

18 서울중앙지방법원 2021. 8. 19. 선고 2018가합508729 판결 참조.

대법원 “웹사이트 무단 크롤링은 불법”

웹사이트 콘텐츠를 긁어오는 ‘크롤링’을 이용해 확보한 콘텐츠를 자신의 영업에 무단 사용하는 것은 데이터베이스(DB)권 침해 행위라는 대법원 판단이 나왔다. 이는 온라인 웹사이트를 운영하는 사업자 사이에서 광범위하게 이용되는 크롤링에 대한 법적 판단의 기준을 세웠다는 점에서 주목된다.

27일 업계에 따르면 최근 대법원은 온라인 채용정보제공 관련 경쟁 사업자인 잡코리아와 사람인 사이에서 9년간 이어진 ‘웹사이트 콘텐츠 무단 크롤링’ 관련 소송에 대해 이같이 판시했다.

앞서 서울고등법원은 지난 4월 잡코리아(원고)가 경쟁 업체인 사람인HR(피고·이하 사람인)을 상대로 제기한 ‘웹사이트 HTML 소스코드 무단 복제 등 금지청구 소송’에서 원고의 손을 들어준 바 있다.

이에 사람인은 서울고법 판단에 불복해 법무법인 세종을 대리인으로 선임하고 대법원에 상고했다. 이와 관련 사람인은 원심이 조정조항의 해석에 관한 대법원 판례를 위반하고 관련 법리를 오해했다고 항변했으며, DB 제작자의 인정 요건에 관한 법리를 오해했다고 주장했다. 그러나 대법원은 이같은 주장을 받아들이지 않았다.

양사의 분쟁은 9년 여 전인 지난 2008년 사람인이 잡코리아에 등록된 기업 채용공고를 무단 크롤링해 게재한 것이 발단이 됐다. 사람인은 채용공고 무단 복제를 인정하고 재발 방지를 약속했지만 지켜지지 않았다는 설명이다.

잡코리아는 지난 2010년 사람인을 상대로 법원에 채용정보 복제 금지 가처분을 신청했고, 지난 2011년 서울중앙지방법원은 사람인이 잡코리아의 채용정보를 무단으로 게재하지 말라고 강제조정 결정을 내렸다.

이에 따라 사람인이 재발 방지를 약속하는 등 사건이 일단락되는 듯 했으나, 이후에도 사람인은 검색로봇을 이용해 같은 방식으로 채용정보를 무단 복제해 자신들의 웹사이트에 게재했다.

이에 잡코리아는 법무법인 민후를 대리인으로 선임, 사람인을 상대로 저작권 침해금지 청구소송을 제기했다. 사람인은 법무법인 광장을 대리인으로 선임해 공방을 이어갔다.

이 과정에서 민후는 사람인이 채용정보를 지속적으로 무단수집해서 자신의 이익을 위해 사용한 점과 몰래 크롤링을 하는 것을 숨기기 위해 가상사설망(VPN)을 사용한 점 등을 밝혔다. 그러면서 사람인의 행위는 단순한 조정조서 위반을 넘어 부정경쟁방지법 위반에 해당한다고 주장했다.

공방 끝에 서울중앙지법 민사11부(재판장 김기영 부장판사)는 사람인에 채용정보 396건을 폐기하고 잡코리아에 1건당 50만원씩 총 1억9800만원을 지급하라고 판결하고, 사람인의 행위가 부정경쟁행위에 해당함도 인정했다. 사람인은 1심 판결에 불복해 대리인을 김앤장 법률사무소로 교체하고 항소했다.

특히 항소심에서 법무법인 민후가 DB권 침해를 새로 추가해 주장하면서 9년의 분쟁은 끝이 보이기 시작했다.

‘무단 크롤링’으로 야놀자 정보 빼간 여기어때 [법알못 판례 읽기]

민사에선 “야놀자에 10억원 배상하라”

형사에선 1심 유죄→항소심 무죄로 뒤집혀

게티이미지뱅크

여기어때, 야놀자 정보 ‘크롤링’

“여기어때, 10억원 배상하라”

형사 재판에선 1‧2심 판결 엇갈려

게티이미지뱅크

사람인HR도 경쟁사 채용 정보 무단 복제해 법적 공방

경쟁 기업이 인터넷에 공개적으로 올린 정보를 활용했다는 것만으로 문제가 될까. 보통의 경우라면 큰 문제가 없겠지만 ‘크롤링 프로그램’으로 정보를 통째로 긁어 왔다면 얘기가 달라진다. 웹 크롤링은 컴퓨터 프로그램이 웹을 돌아다니며 필요한 정보를 수집하는 작업을 뜻한다.최근 법원이 크롤링 프로그램을 활용한 사업자의 손해 배상 책임을 인정하는 사례가 잇따르고 있어 주의가 요구된다. ‘크롤링 프로그램 활용은 상대방이 공들여 쌓은 정보를 통째로 훔쳐 가는 부당한 행위’라는 것이다. 사안에 따라선 정보통신망법 위반 혐의로 형사 처분까지 받을 수 있다.최근 서울중앙지법 민사합의63-2부(부장판사 박태일‧이민수‧이태웅)는 야놀자가 여기어때를 상대로 낸 권리침해금지 소송 1심에서 “야놀자에 10억원을 지급하라”며 원고 일부 승소 판결을 내렸다.재판부에 따르면 여기어때는 2015년부터 경쟁 회사인 야놀자의 모바일 애플리케이션(앱)이나 PC용 웹페이지에 접속해 제휴 숙박 업소 목록, 주소 정보, 가격 정보를 확인하고 내부적으로 공유했다. 해당 자료가 영업에 필요하다는 이유에서다.그런데 2016년 1월부터 정보를 취득하는 방식을 바꿨다. 수기로 일일이 정보를 취합하는 대신 크롤링 프로그램을 사용하기 시작한 것이다. 여기어때 측은 크롤링 프로그램에 마치 정상적인 모바일 앱 이용자가 이용하는 것처럼 위장해 숙박 업소 정보를 불러오는 기능을 탑재했다.일반적인 앱 이용자들은 7~30km 범위 내의 숙박 업소만 검색할 수 있지만 이 프로그램을 통해선 반경 1000km 내에 있는 숙박 업소의 정보를 모두 확인할 수 있다. 여기어때는 이 프로그램을 통해 야놀자의 제휴 숙박 업소 업체명, 주소, 방 이름, 원래 금액, 할인 금액, 입실 시간, 퇴실 시간, 날짜 등을 복제했다.특히 2016년 8월부터 야놀자의 ‘마이룸’ 서비스와 유사한 서비스를 개시할지 여부를 검토하기 위해 이 프로그램에 마이룸의 판매 개수를 확인할 수 있는 기능을 추가한 것으로 조사됐다.여기어때가 이처럼 기능이 개선된 크롤링 프로그램을 이용해 야놀자의 API(Application Programming Interface) 서버에 접근하던 중 야놀자는 이 프로그램 이용으로 인한 대량 호출 신호를 감지하게 된다.야놀자가 여기어때가 이용하는 아마존웹서비스(AWS) 클라우드 서버의 IP 주소를 차단하자 여기어때 측은 서버의 전원을 차단했다가 다시 켜는 방식으로 IP 주소를 변경했다. 여기어때는 2016년 10월까지 이 같은 방식으로 야놀자의 정보를 복제한 것으로 밝혀졌다. 야놀자는 2016년 여기어때를 수사 당국에 고소했고 2018년 민사 소송도 제기했다.1심 재판부는 “피고(여기어때)의 대표이사를 비롯한 임직원들은 크롤링 프로그램을 개발, 이용해 제휴 숙박 업소의 정보를 수집하고 이를 영업을 위해 사용함으로써 원고(야놀자)의 정보를 공정한 상거래 관행이나 경쟁 질서에 반하는 방법으로 무단으로 사용했고, 그 결과 원고의 경제적 이익을 침해했다”고 판단했다. 야놀자의 행위가 민법상 불법 행위인 부당 경쟁 행위에 해당한다는 것이다.여기어때 측은 “크롤링 등을 통한 정보 수집은 매우 일반적으로 당연히 이뤄지는 것이고 정당한 행위”라고 주장했다.하지만 재판부는 여기어때 측이 1시간마다 크롤링을 할 때 야놀자의 서버를 쓰는 것은 발각될 위험이 있다고 보고 크롤링 프로그램을 AWS 클라우드로 이전 조치했다는 점에 주목했다. 여기어때 측 임직원들이 크롤링 프로그램을 사용한 것이 드러나면 문제가 된다는 점을 잘 알고 있었다는 것이다.재판부는 “제휴 숙박 업소의 정보는 별다른 가치가 없다”는 여기어때 측의 주장도 받아들이지 않았다. 별도의 프로그램까지 개발하고 대표이사를 포함한 임직원들이 조직적으로 장기간에 걸쳐 반복해 무단 복제 행위를 했다는 점 등을 들었다.또 “피고는 구체적이고 다양한 방식으로 제휴 숙박 업소의 정보를 가공‧분석해 원고의 영업 전략과 현황을 파악하고 이를 참고해 영업 전략을 수립했다”고 판시했다.재판부는 야놀자의 손해액을 10억원으로 책정했다. 재판부는 “야놀자가 2016년 한 해에 영업부서 인건비만으로 26억원이 넘는 금액을 투여한 점, 여기어때가 손해 배상을 위한 노력을 기울이지 않고 있는 점 등을 종합했다”고 설명했다. 야놀자의 숙박 업소 정보를 복제‧반포‧전송‧양도‧판매‧보관하는 것도 금지한다고 판결했다.심명섭 전 위드이노베이션 대표 등 여기어때 관계자들은 정보통신망법 위반 등 혐의로 기소돼 형사 재판도 받고 있다. 심 전 대표를 비롯한 여기어때 전‧현직 임직원들은 1심에서 유죄 판결을 받았지만 2021년 1월 항소심 재판부는 1심을 깨고 무죄를 선고했다.1심 재판을 맡은 서울중앙지법 형사5단독 신민석 판사는 2020년 2월 정보통신망 이용촉진 및 정보보호 등에 관한 법률 위반(정보통신망침해등), 저작권법 위반, 컴퓨터 등 장애 업무 방해 혐의로 기소된 심 전 대표에게 징역 1년 6개월과 집행 유예 2년을 선고했다.재판부는 “크롤링 프로그램이 검색 엔진 등에 널리 사용되고 있고 정보화 시대에 유용한 역할을 하고 있지만, 이를 통해 타인의 정보통신망을 무단으로 침입하는 불법 행위까지 정당화되는 것은 아니다”고 판단했다. 또 “피고인들이 접속 과정에서 복제한 정보가 모바일 앱을 통해서도 얻을 수 있는 것이었는지 여부는 침입 여부에 영향을 미치지 않는다”고 봤다.그러나 항소심을 맡은 서울중앙지법 형사항소5-1부(부장판사 최병률‧유석동‧이관형)는 다르게 판단했다. 야놀자 측이 앱이나 API 서버 접속을 금지하는 조치를 취하지 않았다는 점에 주목했다.재판부는 “피고인들이 크롤링을 통해 가져간 정보들은 피해자 회사가 자신의 숙박 예약 영업을 위해 이용자들에게 공개한 정보”라며 “(크롤링 등을 통하지 않고) 앱을 통하더라도 다소 번거롭긴 하지만 크롤링한 것과 같은 종류와 양의 정보들을 가져올 수 있는 것으로 보인다”고 판단했다.재판부는 저작권법 위반‧컴퓨터 등 장애 업무 방해 혐의에 대해서도 무죄로 판단했다. 여기어때 관계자들은 현재 대법원의 최종 판단을 기다리고 있다.크롤링 프로그램 사용과 관련해 앞서 진행된 주요 법정 싸움으로는 채용 정보 업체 잡코리아와 사람인HR의 분쟁이 있다. 사람인이 잡코리아의 정보를 크롤링해 웹페이지에 그대로 게재하면서 법적 공방이 벌어진 것이다.양측 간 법정 싸움은 2008년 시작됐다. 당시 사람인은 잡코리아에 등록된 기업의 채용 공고를 크롤링해 게재했다. 사람인이 채용 공고를 무단으로 복제했다는 점을 인정하고 재발 방지를 약속했지만 지켜지지 않았다.잡코리아는 2010년 사람인을 상대로 법원에 채용 정보 복제 금지 가처분 신청을 냈다. 서울중앙지법은 2011년 사람인이 잡코리아의 채용 정보를 무단 게재하지 말라는 결정을 내렸다.하지만 법원 결정 이후에도 사람인은 검색 로봇을 활용해 잡코리아의 웹사이트 내용 수백여 건을 복제해 갔다. 잡코리아는 사람인을 상대로 “무단으로 복제한 채용 정보 1건당 50만원씩 배상하라”며 저작권 침해 금지 청구 소송을 냈다.1심 재판부는 사람인에 무단 복제한 채용 정보 396건을 폐기하고 잡코리아에 건당 50만원씩 1억9800만원을 지급하라고 판결했다. 사람인이 1심 판결에 불복해 항소하자 잡코리아는 “사람인이 저작권법상 데이터베이스권을 침해했다”고 맞섰다. 잡코리아의 채용 정보 웹사이트가 인적‧물적 투자를 토대로 구축된 데이터베이스에 해당한다는 것이다.2심 재판부는 잡코리아 측의 주장을 받아들여 사람인에 데이터베이스권 침해로 인한 손해 배상금 2억5000만원과 간접 강제금 등을 합해 4억5000만원을 지급하라고 판결했다. 사람인이 상고했지만 대법원이 심리불속행 기각 결정을 내리며 판결은 최종 확정됐다.이후 잡코리아는 사람인을 상대로 추가 소송을 제기했다. 그러자 사람인이 2018년 소송 합의금으로 잡코리아에 120억원을 지급하며 10년에 걸친 법적 분쟁은 일단락됐다. 사람인 측은 결국 과거에 복제한 채용 정보도 모두 폐기하게 됐다.최한종 한국경제 기자 [email protected]

누구도 알려주지 않는 크롤링의 함정

Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are Seth Stephens-Davidowitz

(3.5/5)

Free

키워드에 대한 정보 크롤링 법적 문제

다음은 Bing에서 크롤링 법적 문제 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보

  • 동영상
  • 공유
  • 카메라폰
  • 동영상폰
  • 무료
  • 올리기

데이터 #수집 #겁난다고?! #크롤링 #논란! #핵심 #이슈와 #반드시 #점검해야 #할 #5가지🖐 ##크롤링 ##플랫폼사업 ##크롤링불법기준 ##크롤링상업적이용 ##데이터정보


YouTube에서 크롤링 법적 문제 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 데이터 수집 겁난다고?! 크롤링 논란! 핵심 이슈와 반드시 점검해야 할 5가지🖐 #크롤링 #플랫폼사업 #크롤링불법기준 #크롤링상업적이용 #데이터정보 | 크롤링 법적 문제, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

Leave a Comment