당신은 주제를 찾고 있습니까 “빅 데이터 장단점 – 빅 데이터 3분 요약“? 다음 카테고리의 웹사이트 ppa.maxfit.vn 에서 귀하의 모든 질문에 답변해 드립니다: https://ppa.maxfit.vn/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 연합뉴스경제TV 이(가) 작성한 기사에는 조회수 101,628회 및 좋아요 688개 개의 좋아요가 있습니다.
빅 데이터 장단점 주제에 대한 동영상 보기
여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!
d여기에서 빅 데이터 3분 요약 – 빅 데이터 장단점 주제에 대한 세부정보를 참조하세요
질병통제예방센터보다 더욱 빠르게 독감을 예측할 수 있다면 어떨까요? 구글의 엔지니어였던 제러미 긴즈버그는 구글 빅데이터에서 높은 상관관계를 지닌 데이터를 찾았습니다. 사람들이 구글 검색창에 감기 관련 증상을 검색하는 빈도를 파악하면 독감 발병률을 상당히 정확하게 측정할 수 있다는 사실을 알아낸 거죠. 구글은 그 이후 독감 트렌드 서비스를 제공, 질병통제예방센터보다 2주 정도 더 빨리 독감의 확산경로를 예측해 냈습니다. 바로 여기에 빅데이터가 사용됩니다. 여기저기서 너무도 많이 들리는 말 빅데이터, 도대체 빅데이터란 무엇일까요?
포털에서 빅데이터를 검색하면 ‘기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 데이터’ 라는 정의가 나옵니다. 1분 동안 구글에서는 200만 건의 검색, 유튜브에서는 72시간의 비디오, 트위터에서는 27만 건의 트윗이 생성된다고 하는데요, 컴퓨터나 스마트폰 사용의 증가로 디지털 환경이 조성되면서 사용되는 정보의 양과 규모가 엄청나게 증가했다는 것을 알 수 있죠.
그러나 빅데이터를 단순히 크다와 데이터의 합성어로만 볼 순 없을 것 같습니다. 과학전문지 네이처는 ‘향후 10년 안에 세상을 바꿀 가장 중요한 기술’로 빅데이터를 선정했고, 미국의 시장조사기관 가트너는 미국 경쟁력을 좌우하는 21세기 원유라고 표현하기도 했는데요. 그 방대한 데이터들을 모으고 분석하다 보면 상관관계에 있는 예측도 가능하다는 뜻입니다. 대량의 비정형 데이터에 담긴 사람들의 생각과 필요를 읽어낸다면 실로 그 힘이 엄청나게 커지는 것이죠.
날씨에 따라 먹고 싶은 음식이 달랐던 경험은 누구에게나 있을 듯 한데요, 국내 대표 베이커리 전문 매장은 5년간 169개 지역의 일별 매출과 기상자료를 통계기법으로 지수화한 ‘날씨 판매지수’를 활용했는데요, 판매량을 예측하고 주문량을 조절할 수 있어 판매할 제품이 없어 발생하는 손실인 찬스 로스를 방지할 수 있게 됐고, 영업이익은 더욱 늘었다고 합니다. 또 서울시는 심야시간 강남과 홍대 등 일부 지역에서 통화량이 급증한다는 사실을 깨닫고 데이터 30억 건을 분석해 심야에 사람들이 많이 이용할 수 있는 적절한 노선을 찾아 올빼미 버스라는 성공적인 프로젝트를 실행시켰죠.
“정보를 가진 자가 권력을 가진자이다” 이는 미래학자 앨빈 토플러가 한 말인데요, 만약 지금 앨빈 토플러가 살아 있다면 “정보를 분석하는 능력을 가진 자가 권력을 가진 자다”라고 이야기 하지 않을까 싶네요. 인터넷만 켜면 수많은 정보에 접근할 수 있는 지금, 누구나 가진 구슬을 갖는 사람이 아니라 그 구슬을 꿰어 보배를 만드는 사람이 진정한 권력자가 되겠죠. 빅데이터는 세상을 뒤바꿀 만병통치약이 아니라 의미 있는 일을 위한 도구의 하나라는 사실을 꼭 기억해야겠습니다.
빅 데이터 장단점 주제에 대한 자세한 내용은 여기를 참조하세요.
빅데이터 분석과 장단점 그리고 활용사례 – 네이버 블로그
빅데이터는 각종 센서와 인터넷의 발달로 데이터가 늘어나면서 나타났습니다. . 컴퓨터 및 처리기술이 발달 …
Source: m.blog.naver.com
Date Published: 5/18/2021
View: 298
빅데이터(BigData) 8부 – 빅데이터의 장, 단점은 무엇일까?
빅데이터의 단점 · * 개인정보 · * 미래 예측 · * 수집한 데이터의 신뢰도 · * 분석 결과의 상관관계와 인과관계 · * 원인의 부재 · * 결과 수치에 치중하게 …
Source: broccoli45.tistory.com
Date Published: 3/14/2021
View: 1834
2022년 빅데이터 활용 사례 10가지, 업계별 추천한다
빅데이터 활용의 또 다른 장점은 기존 제품과 서비스, 바이어와 공급자, 소비자의 취향에 대한 정보를 수집하고 …
Source: www.finereport.com
Date Published: 2/17/2022
View: 2127
빅데이터의 장점 – Prezi
가까운 미래예측 · 의사결정의 정확도를 높일 수 있습니다. · 빅데이터 기반 범죄예측기술 · 가까운 미래를 예측하고 새로운 기회를 창출할 수 있습니다. · 고객에 관한 통찰력 …
Source: prezi.com
Date Published: 10/19/2021
View: 4859
빅데이터에 대해서 당신이 알아야 할 것들
빅데이터의 장점과 의의 … 빅데이터는 우리 생활 곳곳에서 점점 더 중요한 역할을 하고 있습니다. 과학자들은 기후 변화, 지진, 전염병 유행 등을 예측하기 위해 데이터를 …
Source: www.infineon.com
Date Published: 3/25/2021
View: 87
빅데이터장단점 – 빅데이터의 대한 지식정보
그래서 오늘은 빅데이터 기술의 장단점과 빅데이터 기사에 대해 알아보도록하겠습니다. 기사는 네이터 이데일리의 뉴스기사로 9월 10일자의 기사입니다.
Source: itbank.tistory.com
Date Published: 11/27/2022
View: 5646
빅데이터란 무엇인가, 그리고 빅데이터를 이용해야 하는 이유는?
빅데이터가 주는 혜택이란, 우리에게 느껴지지는 않지만 마음속으로만 바랐던 편의성을 기업과 정부에서 제공하는 것이다. 카드 활용 사례나 개인 신용 평가에서 빅데이터 …
Source: www.gbckl.kr:2017
Date Published: 12/23/2022
View: 2498
빅데이터의 활용 현황, 문제점과 대책 – 한국경제연구원
물론 빅데이터가 장밋빛 미래만을 제시하지는 않는다. 가장 큰 문제점은 개인정보침해다. 얼마 전 금융회사의 고객정보가 대규모로 유출되어 사회적인 …
Source: www.keri.org
Date Published: 10/21/2022
View: 968
[NIE]내 모든 것이 기록되는 세상, 빅데이터 – 전북일보
매일경제 2021년 4월 21일, 21세기 원유 ‘빅데이터’ 미래 예측 도구로 … <읽기자료1> 을 읽고, 빅데이터 활용의 장단점에 대해 정리해 봅시다.
Source: www.jjan.kr
Date Published: 11/9/2022
View: 5091
우리나라의 빅데이터 활용과 문제점들
이러한 빅데이터 활용은 소비자에게 최적의 서비스를 제공한다는 점에서 소비자와 기업간의 간극을 줄여주고, 선택에 낭비되는 시간을 줄여주는 장점 …
Source: www.koreaittimes.com
Date Published: 6/27/2021
View: 1515
주제와 관련된 이미지 빅 데이터 장단점
주제와 관련된 더 많은 사진을 참조하십시오 빅 데이터 3분 요약. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.
주제에 대한 기사 평가 빅 데이터 장단점
- Author: 연합뉴스경제TV
- Views: 조회수 101,628회
- Likes: 좋아요 688개
- Date Published: 2019. 9. 1.
- Video Url link: https://www.youtube.com/watch?v=l2RBzee3Ag4
빅데이터 분석과 장단점 그리고 활용사례
컴퓨터 및 처리기술이 발달함에 따라 디지털 환경에서 생성되는
빅데이터와 이 데이터를 기반으로 분석할 경우 질병이나 사회현상의 변화에 관한
새로운 시각이나 법칙을 발견할 가능성이 커졌습니다.
빅데이터는 초대용량의 데이터 양(volume), 다양한 형태(variety), 빠른 생성 속도(velocity)라는 뜻에서
3V라고도 불리며, 여기에 네 번째 특징으로 가치(value)를 더해 4V라고 정의하기도 합니다.
빅데이터에서 가치가 중요 특징으로 등장한 것은 엄청난 규모뿐만 아니라 빅데이터의
대부분은 비정형적인 텍스트와 이미지 등으로 이루어져 있고,
이러한 빅데이터들은 시간이 지나면서 매우 빠르게 전파하며 변함에 따라
그 전체를 파악하고 일정한 패턴을 발견하면서 가치 창출의 중요성이 강조되었기 때문입니다.
빅데이터(BigData) 8부 – 빅데이터의 장, 단점은 무엇일까?
반응형
지금까지는 빅데이터가 나온 이유와 개념 등에 대해 알아보았다.
앞 선 글 내용을 다 보았다면 빅데이터라는 것을 단순히 큰 데이터, 많은 데이터만을 뜻하는 것이 아니라는 것을 알게 되었을 것이다.
빅데이터 분석이라고도 많이 말하지만 빅데이터라는 단어 내에는 결국 많은 데이터를 기반으로 특정 결과를 이끌어내는 프로세스라는 의미를 내포하고 있다. 이 특정 결과를 위해서는 적절한 기준과 분석 기법이 주어져야하는 것은 당연하다.
적절한 기준과 분석 기법은 누가 정할까…? 바로 사람이다.
오늘은 빅데이터라는 것도 결국 다루는 사람이 중요하다는 것을 빅데이터가 가지는 장단점을 통해 알아보려고 한다.
빅데이터의 장점
* 미래 예측
여러분에게 특정 데이터가 많으면 무엇부터 할 것인가? 필자는 통계를 내고 그 통계를 기반으로 한 예측을 할 것이다. 정말 단순하지만 인간은 기본적으로 자신이 쌓은 경험이나 지식들을 바탕으로 예측한다.
출처 : http://www.ecumenian.com/news/articleView.html?idxno=18703
‘물 묻은 손으로는 전자제품을 만지지 않는다.’, ‘여자친구의 나 살찐 것 같지 않아?’라는 대답에는 끝까지 ‘아니다’라고 대답한다. 등 이런 행동들은 결코 그냥 나온 것이 아니라 여러분의 경험과 지식에서 나온 것들이다.
즉, 빅데이터는 미래를 예측할 수 있다.
* 환경 개선
빅데이터를 이용하면 예측도 할 수 있지만 문제도 파악할 수 있다.
필자가 이렇게 블로그를 사용하고 있지만 방문객 수가 많지 않다. 왜 그런지 파악하기 위해 수 많은 웹 페이지를 돌아다니던 중 ‘태그’의 중요성을 알게 되었다.
블랙위키 : 키워드 통계 및 분석 사이트
즉, 인기있는 태그를 사용해야 블로그의 노출률을 높일 수 있다는 것을 깨달은 것이다. 그래서 태그를 쓸 때 고민하게 되었고 지금은 전보다는 훨씬 많은 방문자 수를 보유하게 되었다.
이렇게 필자의 블로그 관련 자료를 찾다보니 태그의 사용률을 분석해 주는 사이트들도 많이 있다는 것을 알게 되었다.
이처럼 빅데이터는 문제를 발견하고 그 문제를 해결해하는데 아주 유용하게 사용된다.
빅데이터의 단점
* 개인정보
이 빅데이터 붐으로 인해 무분별하게 개인정보를 수집하는 상황이 발생하게 되었다. 극단적인 예로 2020년 12월에 오픈한 ‘이루다’라는 서비스가 있다. 챗봇으로 큰 인기를 끌었지만 사생활 침해 등의 문제로 현재 서비스가 중단된 상태이다.
이루다 챗봇 / 출처 : https://biz.chosun.com/site/data/html_dir/2021/01/08/2021010801256.html
* 미래 예측
정말 빅데이터의 예측을 믿을 수 있을까? 당연히 믿을 수 없다.
기상 데이터만을 다루는 기상청만 봐도 100% 정확도를 보장하지 못한다.
출처 : https://www.hankookilbo.com/News/Read/A2020072214140001639
하물며 현실, 인터넷 상에 떠도는 데이터를 모아서 분석한다면 그 정확도는 훨씬 떨어질 수밖에 없다.
* 수집한 데이터의 신뢰도
출처 : http://www.yes24.com/Product/Goods/61188198
‘모두 거짓말을 한다.’라는 책을 보면 현장에서 실시한 설문조사의 데이터는 신뢰도가 매우 낮다는 내용이 나온다. 사람은 누구나 다른 사람에 잘 보이고 싶어 하는 심리가 있기 때문에 무의식적으로 좋게 설문은 한다고 한다.
* 분석 결과의 상관관계와 인과관계
빅데이터를 통해 결과를 도출했다고 하자. 그러면 이 결과는 과연 우리는 상관관계와 인과관계의 구분을 정확히 할 수 있을까?
아래는 나무위키에서 가져온 예시이다. 한 번 읽어보자.
출처 : https://bit.ly/2Tlx4s5
한 연구자가 아이스크림 판매량의 연중 증감 추이를 확인했다. 그리고 연중 익사 사망자의 증감 추이를 함께 놓고 두 변인 간의 상관분석을 시행해 보았다. 결과는 놀라웠다. 무서울 정도로 명백한 상관관계가 나타나고 있었다. 아이스크림 판매량이 급증하는 동안, 익사 사망자 수도 함께 증가하고 있었으며, 판매량이 감소하는 동안 익사 사망자 수도 감소하고 있었던 것이었다.
연구자는 몸서리를 치면서 다음과 같은 결론을 내렸다. “익사 사망자의 증감은 아이스크림이 그 원인이다.”
폭력적인 영상을 본 어린이는 폭력적인 사람으로 변하게 될까? 물론 그럴 수도 있겠지만, 폭력적인 것을 원래 좋아하기 때문에 폭력적인 영상을 보는 건 아닐까? 자살을 부추기는 음악을 반복해서 듣게 되면 멀쩡한 사람도 자살하게 될까? 그렇다고 섣불리 판단하기 전에, 애초에 우울증과 스트레스, 약물 남용으로 고통받던 사람이 자살을 부추기는 음악에 빠져드는 건 아니었을까? 종교적 교리가 멀쩡한 사람을 반지성적, 반 계몽적으로 만들까? 아니면 거꾸로, 종교 의례나 공동체적 결속이 무지한 사람들에게 더 호소력을 갖고 있는 건 아닐까?
위 예시를 읽었다면 꼭 나무위키 상관관계와 인과관계를 보고 오자.
* 원인의 부재
데이터 분석을 통해 나온 데이터로 원인을 파악하기는 힘들다. 예를 들어 ‘카페 고객들이 점심시간에는 아이스 아메리카노를 많이 주문한다.’는 결과를 얻었다고 하자. 과연 그 이유는 무엇일까? 여러분은 알 수 있는가?
출처 : https://www.cuinsight.com/big-dataanalytics-the-curse-of-the-black-box.html
결과만 중요할 때도 있지만 반드시 그 원인을 알아야 할 때도 있다.
단순한 예로 기업에서 빅데이터를 활용 결과 직원들의 회사 만족도가 낮았으며 ‘쉼터 개설’, ‘어린이집 개설’ 등의 요구가 많았다고 하자. 그래서 회사에서는 쉼터와 어린이집 개설 등 많은 돈을 투자했다. 하지만 직원들의 만족도는 전혀 높아지지 않았다.
위와 같은 경우 직원들의 만족도가 변하지 않은 원인을 정확히 파악해야 한다. 하지만 통계로는 그 원인을 알 수 없다.
* 결과 수치에 치중하게 된다.
숫자와 결과에만 현혹되어 제대로된 판단을 하지 못할 수 있다.
‘일을 잘한다는 것’, ‘뉴타입의 시대’ 라는 책에는 아래와 같이 설명한다.
출처 : http://www.yes24.com/
현재 시대는 변했다. 과거에는 많은 문제, 적은 해결 방법으로 인해 문제 해결에만 집중했지만 지금은 한 문제에 대한 해결법이 너무 많이 존재한다. 그래서 문제의 발견이 중요하다. 이런 문제 발견에서는 단순 수치를 통한 미래 예측이 중요한 것이 아니라 미래 구상이 중요하다.
필자의 사견
빅데이터는 우리에게 큰 편의를 줄 수 있지만 완벽한 것은 아니다. 이 역시 단점이 확실하다는 것을 잊어서는 안 된다. 위와 같은 빅데이터의 장단점을 보면 우리에게 사람이 중요하다는 것을 말해주고 있는 것 같다는 생각이 든다. 빅데이터에서 가장 중요한 것은 이를 다루는 사람이다. 상상해 보자. 빅데이터를 다루는 사람이 잘못된 기준을 가졌다면…? 잘못된 분석 기법을 사용했다면…? 예측된 그 미래는 어떨지.
반응형
2022년 빅데이터 활용 사례 10가지, 업계별 추천한다-FineReport
빅데이터는 위키피디아에 따르면 일반적인 데이터 관리 및 처리 소프트웨어에서 다루기 어려울 정도로 거대하고 복잡한 데이터의 집합을 나타내는 용어입니다. 빅데이터 활용에 의해, 새로운 발견이 되어 안고 있는 과제의 해결과 업무 운영의 효율화가 기대되므로, 기업이나 조직의 일하는 방식을 완전히 바꾸어 여러 가지 업계에 혁명을 일으켰다고 말할 수 있습니다.
이 문장에서는 업계별로 빅데이터 활용 사례를 해설함으로써 그 장점과 빅데이터를 분석하여 활용 방법을 알려드리고자 합니다.
참고: 본문에서 나타내는 빅데이터 활용사례 Demo플랫폼은 FineReport(파인리포트)로 제작한 것입니다. 필요하시면 다운로드하여 빅데이터 데모를 만들어 보세요.
1.업계별 빅데이터 활용 사례 10가지
빅데이터 활용사례 ① 제조업
제조업에서는 데이터가 ERP나 MES, CMMS등의 수많은 시스템에 산재해, 데이터를 단일적으로 이용할 수 없기 때문에, 공장의 가동 상황을 전반적으로 파악하는 것이 어렵습니다. 기업에서 빅데이터 분석의 첫걸음은 바로 데이터를 통합하여 관리해야 하는 것입니다. 빅데이터의 잘 활용으로 제조 프로세스를 개선할 수 있을 뿐만 아니라 생산성 향상 및 품질 안정 등에 도움이 됩니다.
빅데이터 활용 장면:
설비예지보전: 센서 데이터의 가시화를 통하여 공장전체, 라인별 설비 의 운전상황, 고장이 많은 설비의 파악, 설비 문제를 조기 발견 가능합니다.
의 운전상황, 고장이 많은 설비의 파악, 설비 문제를 조기 발견 가능합니다. 예실관리: 당초 계획에 대하여 실적이나 목표와 실적과의 차이를 인식하여 원인을 철저히 분석하여 차기부터 개선할 수 있습니다.
제품 트래킹: 빅데이터를 분석하여 바코드 스캐너와 무선장비를 이용하여 원자재 조달에서 생산, 소비 또는 폐기에 이르기까지 추적할 수 있습니다.
출처:FineReport
FineReport는 Hadoop Hive, SPARK등과 같은 빅데이터 플랫폼 및 광범위한 데이터 소스를 지원합니다. 서로 다른 데이터베이스 및 테이블에서의 데이터 추출을 지원하고 ERP / OA / MES 및 기타 비즈니스 시스템의 데이터를 단일 플랫폼으로 쉽게 통합할 수 있는 비즈니스 인텔리전스 소프트웨어입니다.
체험판 무료로 알아보기
현재 파인리포트(FineReport)는 기간과 기능의 제한이 없는 개인 사용자용 라이선스를 공식홈페이지에서 무료로 배포하고 있습니다.
빅데이터 활용사례 ② 의료업
매일 대량 복잡한 비구조화 데이터를 생성하는 의료업은 빅데이터 기술을 통해 의료정보 활용의 폭과 가능성이 넓어집니다.
빅데이터 활용 장면:
이 데이터 분석 사례는 유행병의 발생을 예측하고 그 영향을 최소화하기 위해 어떤 예방책을 강구할지를 결정하는 데 도움이 됩니다. 엑셀 수백만 명의 환자로부터 수집된 엑셀 데이터나 다른 데이터를 사용하여 근거에 따른 진단을 하므로 치료비를 절감합니다. 웨어러블 디바이스를 사용하면 빅데이터가 환자의 건강상태를 감시하고 의사에게 보고할 수 있습니다.
코로나 현황 대시보드
출처: FineReport
빅데이터를 분석하여 코로나 대시보드를 제작하는 포로세스에 대한 관심이 있으신분 다음 자료를 참고하세요 🙂
빅데이터 활용 사례③ 은행업
은행업에서는, 빅데이터가 오랜 세월 활용되어 이미 경쟁 전략상 빠뜨릴 수 없는 것이 되었습니다. 현금 회수부터 재무 관리까지 빅 데이터는 은행 모든 업무의 효율을 높입니다. 은행업의 빅데이터 애플리케이션은 고객의 수고를 덜어주고 수익을 창출합니다.
데이터 분석 활용 장면:
클라우드 컴퓨팅으로 리스크 계산 데이터 처리에 드는 비용을 절감하고 리스크 관리의 효율을 향상시킵니다. 고객 데이터 수집, 분석을 통해 보다 개개인에 맞는 개별 서비스를 제공합니다. 클러스터링+어소시에이션의 데이터 분석 기법을 사용하여 지점 장소 선정 등 중요한 결정의 정확도를 높입니다.
출처: FineReport
체험판 무료로 알아보기
현재 파인리포트(FineReport)는 기간과 기능의 제한이 없는 개인 사용자용 라이선스를 공식홈페이지에서 무료로 배포하고 있습니다.
빅데이터 활용 사례 ④소매업
빅데이터는 시장과 고객 관심 분석을 통해 소매업 발전에 좋은 기회를 제공합니다. 다양한 시장 정보를 수집해, 빅데이터의 해석을 기초로, 고객 만족도를 판단하거나 신제품 개발에 도움이 되거나 투입 시기를 계산하는 등 광범위하게 활용됩니다.
빅데이터 사례 활용 장면:
운용을 통한 결합 판매 데이터, 고객가구 데이터 등 빅데이터는 패턴별로 세분화해 고객을 분류하고 각 부분에 대해 최적의 마케팅을 합니다.예측 분석에 힘입어 상품을 높이다공급과 수요 예측의 정확도는 받아들일 수 없는 상품을 시장에 내놓는 것을 피합니다.히트 상품과 데드 셀러 분석을 하다상품의 재고 범위를 정하여, 재고 보유 비용의 영향을 최소한으로 억제합니다.
출처: FineReport
빅데이터 활용 사례 ⑤ EC업계
EC사이트는 인터넷상에서 고객에게 상품이나 서비스를 판매함으로써 이익을 획득하므로, 고객과 상품이 EC사이트 운영에 있어서의 가장 중요한 요소라고 생각할 수 있습니다.EC 업계에서 빅데이터는 데이터 분석 및 마이닝을 통해 법칙을 도출하여 기업에 지속적인 경쟁 우위를 가져옵니다.
빅데이터 활용 장면:
유입원과 사이트 내의 고객 행동 데이터를 조합하여 효과가 있는 집객 채널과 판매 활동을 판별합니다.구매 데이터, 경쟁사 가격, 상품 원가 등의 데이터에 따라 상품의 베스트 프라이스를 결정합니다.고객의 취향과 과거의 행동 패턴에 따라 그 고객에게 최적의 상품만을 추천합니다.
더 많은 데이터 정보가 필요하신가요? 지금 바로 전문 컨설턴트에게 물어보세요!
빅데이터 활용 사례⑥ 교육업
교육업계에서는 학습이나 교육현장에 대한 다양한 데이터가 축적되고 있습니다. 학습 이력이나 행동 이력 등의 빅데이터 수집, 시각화 분석을 통해 학습 평가 및 각종 예측, 성적과 학습 행위 사이의 관계를 명확하게 할 수 있습니다. 많은 나라에서 학교와 대학에서 빅데이터를 사용합니다.
데이터 분석 활용 장면:
역사 데이터를 개별적으로 학습하다학생들은 학생 전체의 결과를 개선하기 위하여, 개별화된 과정과 방안을 제정합니다. 실시간 모니터링을 통한 수업 시청과자가 얼마나 큰 이점이 있는지,과정 자료를 수정합니다. 학생의 학력 데이터에 근거하여 공부하다이력 데이터의 분석, 각 학생의 진보, 장단점, 취미 등을 이해하여, 장래 학생에게 적합한 직업을 판단합니다.
빅데이터 활용 사례 ⑦ 여행업
여행 업계는 주로 고객의 관광지에 대한 흥미와 그 행동 특징을 바탕으로 비즈니스를 전개합니다. 현재, 대리점보다 Web 서비스를 사용하는 경향이 있습니다. 빅데이터는 인터넷을 통해 전 세계 관광지와 관광객의 정보를 수집하여 여행 수요를 예측하는데 큰 도움을 줍니다.
빅데이터를 분석하여 볼 만한 사례 :
입소문과 고객의 검색 키워드를 분석하여 관광지의 인기도를 평가합니다. 항공사는 여행 중인 승객과 그 수하물의 데이터에 따라 효과적으로 계획하고 그에 따라 서비스를 제공합니다. 지리적 위치, 교통 및 날씨 정보를 바탕으로 특정 고객에게 적합한 섭외와 혜택을 전송합니다.
빅데이터 활용 사례 ⑧ 정부
어느 나라 정부든 매일 국민, 경제성장, 에너지 자원, 교통 등에 관한 다양한 기록과 데이터베이스를 추적해야 합니다.이러한 데이터의 적절한 조사와 분석은, 정부의 나날의 업무를 지원합니다.
빅데이터 분석 사례 :
주의해야 할 영역을 특정하여 정치 프로그램 상에서의 신속한 의사 결정을 실현합니다. 실업, 테러리즘, 에너지 자원 탐사 등 국가적 과제를 극복합니다. 행정이 보유한 지리공간정보와 방재정보 등 공공데이터를 2차 이용하기 쉬운 형태로 민간에 개방하여 비즈니스 이용을 촉진합니다.
빅데이터 활용 사례 ⑨ 농업
농업은 경험과 직감에 의지하는 부분이 많았습니다만, 농사일에 빅데이터를 구사해, 디지털 기술을 도입하면, 예측이나 생산성 향상, 생산 현장의 가시화를 가능하게 합니다.
활용 장면:
센서에서 얻은 기온일조량우량농작 데이터를 분석하여 생산 계획부터 수확출하까지 모두 볼 수 있게 합니다. 기상 데이터 등 각종 빅데이터에 따른 리스크 예측, 사전대책 실현합니다. 농가의 각종 기술·판단 기록·데이터화를 진행하고, 그 기술을 신농자 등에게 공유합니다.
빅데이터 활용사례 ⑩ 음식업
경쟁이 치열해지는 음식업계에서는 시장 지위를 유지하기 위해 데이터 드리븐의 경영 전략을 설정하는 기업이 늘고 있습니다. 과거 레스토랑은 고객의 내점을 기다리기만 한 상태였지만, 음식점 정보를 빅데이터화하면 방문객 수를 예상할 수 있어 재방문 고객을 늘리기 위한 서비스와 판촉활동을 조정할 수 있습니다.
빅데이터 활용 장면:
근처에서 음식점을 찾는 사람의 스마트폰 등에 최적의 타이밍에 효과적으로 광고를 냅니다. 센서로 매장 내에서의 행동을 데이터화하여 현장의 운영 상태를 대폭 개선합니다. 과거의 히트 상품을 분석하거나 보다 정확한 내점 예측, 매출 예측에 따라 생산자가 출하 조정할 수 있습니다.
2. 빅데이터 활용 에는 어떤 장점이 있습니까?
업계에 따라 빅데이터 활용 방법과 효과가 다르지만 기본적으로는 다음 3가지 점을 확인할 수 있습니다.
2.1. 데이터 분석 사례 : 현황 정확히 파악한다
과거에는 기업은 사람의 느낌과 경험에 의지해, 비즈니스의 상태를 파악하는 일이 많았습니다. 빅데이터 활용 으로 다양한 데이터의 수집 및 저장은 쉬워지고 데이터 분석이 가능합니다. 현황 파악에 필요한 정보를 데이터 분석 및 가시화 툴로 알기 쉬운 보고서로 전환하면 경영층이 조직 전체의 경영상황을, 현장직원이 특정 업무의 진척상황을 알게 됩니다.
2.2. 과제 해결책을 얻는다
빅데이터 활용은 데이터 수집에 그치지 않고 데이터 분석을 통해 일의 법칙을 찾아낼 수 있습니다. 신속히 적절한 액션을 취하는 것이 가능합니다. 또한 시책의 효과를 데이터 분석을 통해 검증하고, 시책을 반복해 개선할 수 있습니다.
2.3.새로운 사업기회를 발견한다
빅데이터 활용의 또 다른 장점은 기존 제품과 서비스, 바이어와 공급자, 소비자의 취향에 대한 정보를 수집하고 통합적인 분석을 함으로써 기업들이 새로운 비즈니스 기회를 발견하고 완전히 새로운 서비스를 창출하는 것입니다.
추천할 만 빅데이터 활용 툴
빅데이터 활용의 사례와 장점을 이해했는데 구체적으로 어떤 툴, 어떤 방법으로 빅데이터를 활용할지 묻고 싶은 분이 계실 겁니다. 빅데이터 분석 도구에는 목적 및 용도별로 다양하지만 BI 툴(Tableau, Fine Report), 데이터 마이닝 툴(Python, R), 데이터 시각화 라이브러리(Echarts, Highcharts), 데이터 맵(PowerMap, Polymaps) 등이 있습니다.자세한 내용에 대해서, 이 문장을 보면 됩니다.
대시보드는 훌륭한 데이터 관리 툴입니다. 그러나 한 곳에 데이터 값을 많이 넣는 것 이상이 필요하며, 대시보드를 유용하게 만들려면 데이터를 효과적으로 구성할 줄 알아야 합니다.데이터 기반 의사결정이 가능하고 실무에 활용할 수 있는 대시보드를 제작하는 것은 개인적으로 매우 어려운 일이라고 생각합니다.
*파인리포트란?
*파인리포트는 데이터 연결부터, 리포트 제작,실시간 관제센터를 구축할 수 있는 대시보드 기능을 제공하는 데이터 관리 리포팅 대시보드 툴입니다.
지금 바로 FineReport 무료 체험판을 사용해보세요.
간단한 사용자 등록만 하시면 기능과 기간의 제한이 없는 라이선스 코드가 발급됩니다. 체험판 라이선스는 비영리적인 목적으로만 사용 가능합니다.
체험판 무료로 알아보기
현재 파인리포트(FineReport)는 기간과 기능의 제한이 없는 개인 사용자용 라이선스를 공식홈페이지에서 무료로 배포하고 있습니다.
페이스북에서 FineReport Reporting Sofeware 채널을 구독하고 무료로 대시보드 템플릿을 다운 받으세요!
빅데이터에 대해서 당신이 알아야 할 것들
독일의 “Digitalcourage” 협회 같은 데이터 보호 운동은 빅데이터 분석이 근본적인 위험성을 내포한다고 주장합니다. 이들의 주장은, 사람들을 특정한 알고리즘적 범주로 분류한다면 그 즉시 데이터가 악용되고, 개인 권리가 침해당하고, 사람들이 차별 받을 수 있는 위험성이 있다는 것입니다. 무엇보다도 알고리즘의 결과가 실제와 일치하리라는 보장이 없으며 데이터가 항상 수치적이며 맥락이 없이는 비교적 무의미하다는 주장입니다.
또 한편으로 데이터는 민감한 정보를 비롯한 모든 것을 포함할 수 있으므로 이것을 분석하는 이들에게 힘을 부여합니다. 페이스북은 사용자들이 자동으로 자신의 세계관과 일치하는 것들만 보도록 알고리즘을 프로그램하고 있습니다. 구글의 검색 결과 역시 검색 엔진 알고리즘과 사용자의 이전 검색 내역에 따라서 편향적일 수 있습니다. 전문가들은 이것을 “필터 버블”이라고 합니다.
유럽의 데이터 보호 법에서는 적어도 정보를 수집할 때 제공된 용도로만 데이터를 사용하도록 규정하고 있습니다. 이것을 ‘용도 제한’이라고 합니다. 예를 들어서 피자 주문 데이터를 커넥티드 카와 연동시켜서 이 차가 근처를 지나갈 때 광고를 내보내는 것 같은 것을 금지하는 것입니다.
많은 소비자들은 여전히 정보를 노출시키는 것이 어떤 의미인지 별 감흥이 없습니다. 우리는 “수집되지 않은 데이터만이 안전한 데이터이다”고 한 Digitalcourage 협회의 경고를 새겨들어야 합니다.
소비자 보호 기관들 역시도 빅데이터의 악용 가능성과 데이터 보호의 필요성을 역설하고 있습니다. 커넥티드 카가 자동으로 사고를 보고하거나 교통 정체를 피할 수 있는 것은 소비자들에게 대단히 유용한 기능입니다. 하지만 데이터를 소유한 이들이 소비자들을 조작하고 통제할 수 있다는 문제가 있습니다.
독일 소비자 기구 연맹에서는, 각 개인이 어떤 데이터를 노출하고 어떻게 사용될 것인지를 결정할 권리를 가져야 한다고 주장하고 있습니다.
빅데이터장단점 – 빅데이터의 대한 지식정보
안녕하세요 오늘의 이것저것입니다.
요즘들어 기사를 보면 많은 양의 IT분야 기사가 나오고 있습니다.
IT분야에 대한 기사들 중 빅데이터에 관한 기사의 내용이 있습니다.
기사는 빅데이터 기술이 미래의 혁신적인 기술이 될 것임을 알립니다.
그래서 오늘은 빅데이터 기술의 장단점과 빅데이터 기사에 대해 알아보도록하겠습니다.
기사는 네이터 이데일리의 뉴스기사로 9월 10일자의 기사입니다.
기사의 헤드라인은 크기만 하면 빅데이터? 분석 활용 잘해야 빅데이터
기사의 내용을 알아보겠습니다.
이데일리 노재웅 기자 점심시간을 활용해 스마트폰을 잠시 접속한 온라인 커뮤니티 재미있는 게시물을 읽어 내리며 시간을 보내고 있는데 갑자기 중간 배너에 나의 취향을 제대로 저격한 신상구두 광고가 시선을 사로잡습니다. 방금도 식사한 동료와 이 구두에 대해서 이야기 했는데, 마치 그 마음이라도 읽은 양 ‘지름신’ 이 사도 괜찮다며 정지해 주는 것 같은 생각마저 듭니다.
이러한 과정이 대단한 우연의 일지로 느껴질 수도 있겠지만, 사실 이것은 ‘빅데이터’를 활용한 첨단 마케팅 기법의 결과입니다.
빅데이터는 이름 그대로 방대한 양의 데이터를 말합니다. 지금도 시시각각 엄청난 양의 데이터를 생산하고 있습니다.
온종일 스마트폰으로 주고받는 수많은 메시지부터 인터넷 쇼핑과 사회관계망 서비스는 물로이고 주식 거래나 신용카드 결제, 운전 시 사용하는 네비게이션 등을 통해서 말입니다. 도시와 건물에 빽뺵하게 설치된 CCTV로도 우리의 데이터는 실시간으로 쌓이고 있습니다.
2020년을 기준으로 인류가 지금까지 생산해 낸 모든 데이터의 총합이 59제타바이트(ZB)를 넘겼다고 하는데 미국 시장조사기관 IDC는 2025년에는 이양이 175ZB를 기록할 것이라고 예측을 햇습니다. 1ZB는 양 1조기가바이트(GB) FH 1 뒤에 0이 21개 달린 크기입니다.
IT기술은 초창기에 얼마나 경쟁력이 있고 데이터를 잘 활용하느냐에 따라 경쟁력이 달라지고 있습니다.
빅데이터의 개념이 없더 시절 데이터의 저장은 지금에 비라면 마구 잡이 수준이었습니다. 이렇게 흩어진 데이터는 어딘가에 불리 고립돼 있는 사일로 형태로 존재하는데, 이를 데이터 수집이라 합니다.
이렇게 모은 데이터를 사기 체계적으로 분류해 일정한 흐름에 대한 결론을 도출하는 일렬의 과정을 데이터 분석이라고 부르며, 데이터 분석은 특히 인공지능, 딥러닝의 발달고 사물인터넷의 확산이 접목돼 장소와 시간의 제약을 벗어나 활용이 가능하게끔 진화했습니다.
빅데이터의 활용을 특히 기업에 가장 큰이슈입니다. 그 관심 기업으로는 구글과 페이스북이 대표적인 활용입니다.
정부는 디지털 뉴딜의 대표과제 중 하나인 데이터 댐 사업을 통해 2021년까지 14만 개의 공공데이터 전체를 개방하고, 2025년까지 AI 학습용 데이터 1300종을 구축하기로 했습니다. 2025년까지 총 사업비 18조 1000억 원을 투자해 관련 일자리도 38만 9000개를 창출한다고는 목표입니다.
정부는 또 2021년 6월부터 음성 자연어, 헬스케어, 자율 중행 등 8개 분야의 170종, 총 4억 8000만 건에 달하는 AI학습용 데이터를 AI허브 플랫폼에 차례로 개방하고 있습니다. 삼성전자, LG전자, SK텔레콤, KT, 네이버, 카카오 등 대기업과 중소기업을 포함한 22개 기업 기관으로부터 검증을 거쳐 데이터를 최종 도출했습니다. 한국 정보통신기술협회 등 기관과 산업별 80여 명 전문가가 참여한 품질 자문 위원회를 통해 글로벌 수준의 데이터 품질 검증 과정도 거쳤습니다.
정부 차원의 데이터 활성화 노력과 기업들의 투자 확대로 한국 데이터 산업진흥원은 2020년 국내 데이터 산업 시장 규모가 2019년 대비 14.5% 오른 19조 2736억 원 규모로 커졌다고 밝혔습니다. 2020년 기준 데이터 산업에 종사하고 있는 데이터 직무 인력수도 10만 1967명으로 전년대비 14.5% 증가 했습니다.
빅데이터는 ‘동전의 양날의 칼과 같다는 비유를 많이 합니다.
빅데이터는 유익한 면도 있지만 반대로 데이터가 어디로 빠질지 인지 못하는 경우도 있기에 데이터 사용에 대한 공의를 구하지 않기도 합니다. 빅데이터 시대를 살고 있는 우리는 이러한 것에 치명적인 사생활 침해나 보안 이슈로 골치를 앓게 될 수 있다는 지적이 나오기도 합니다.
이렇게 기사의 내용은 빅데이터 사업의 확장성과 빅데이터 기술의 비전을 보여줌과 동시에 빅데이터 기술을 사용하기 위해서는 데이터를 더 신중하게 다룰 수 있기 위해 제도적 장치의 마련과 사회적 합의가 지속 되어야 할 것 같습니다.
마무리
IT분야는 사회적으로 많은 수용을 거듣나고 있습니다. 이러한 수용이 좋은 쪽으로 가는 방향도 있겠지만 안좋은 방향이 생기기 마련이죠. 그렇기에 IT분야에 대한 올바른 인식이 있고 IT분야가 어떤것이라는 것을 제대로 파악을 하고 있는 것이 나중의 정보화사회에서의 생존의 비결이 될 수 있다는 것입니다.
끝으로 글을 읽고 IT분야에 취미가 있었거나 궁금하신 점 어려움이 있는 분들은
아래의 링크를 참고하고 링크를 통해 무료컨설팅상담이 진행되고 있으니 많은 관심과 참여로 IT분야에 대한 목표를 이루었으면 좋겠습니다. 이상으로 빅데이터장단정에 대한 기사 글 포스팅을 마치겠습니다.
http://it.kg아이티뱅크.kr
https://open.kakao.com/o/sCmJdzsd
빅데이터란 무엇인가, 그리고 빅데이터를 이용해야 하는 이유는?-경북콘텐츠코리아랩 웹진
최근 화두가 되고 있는 기술 중 하나로 ‘빅데이터’, ‘빅데이터 분석’과 같은 말들을 많이 들어보았을 것이다. 빅데이터란, 이름의 뜻 그대로 기존 방식으로 저장·관리·분석하기 어려울 정도로 큰 규모의 데이터를 의미한다.(디지에코 보고서, 2015)
빅데이터의 크기를 보기 위해서는 데이터의 크기를 표시하는 단위로 짐작할 수 있다. 우리가 일반적으로 알고 있는 것은 GB(기가바이트)이며, 이는 대부분의 PC 컴퓨터나 휴대폰 기기의 저장소 크기이다. 다음이 바로 TB(테라바이트)이며 1024TB는 1PB(페타바이트)가 된다. 일반적으로 빅데이터란 현재 페타바이트 단위를 의미한다.
그렇다면, 기존에도 인터넷의 발전과 함께 많은 큰 데이터들이 존재하였는데 왜 새로운 빅데이터란 이름이 나오게 된 것일까?
먼저, 기술의 발전과 함께 우리가 함께 쓰는 데이터의 양도 무섭도록 증가하고 있다. 유튜브(Youtube), 페이스북(Facebook), 카카오톡과 같이 우리가 일상 속에서 사용하는 것들은 모두 데이터이다. 유튜브를 통해 동영상을 시청하고, 페이스북을 통해 친구의 근황을 알고 실시간으로 카카오톡을 통해 친구와 대화를 하는 것 모두 데이터를 통해서 이루어지며 데이터로 저장된다.
유튜브의 경우 전세계 10억명의 사용자가 매일 4억개의 동영상을 시청한다. 데이터가 없다면 우리는 위와 같은 세상의 변화를 체감할 수 없을 것이다. 하지만 기업은 데이터를 관리하기 위해 알래스카에 데이터센터를 지으면서까지 데이터를 저장한다.
스마트폰의 혁신과 함께 변화한 세상은 더 많은 데이터를 내놓기 시작했고, 학자들은 과연 쌓여 있는 데이터들을 통해서 얻을 수 있는 게 있지 않을까라고 생각한다.
그것이 바로 빅데이터 분석이다. 현재 우리가 사용하고 있는 여러 분야에서 빅데이터가 활용되고 있는데 실제로 체감할 수는 없지만 빅데이터의 활용으로 우리는 조금 더 편리한 생활을 하고 있는 것이다. 이런 예로, 서울시 야간버스 노선도, 카드사의 고객맞춤 상품 출시 등이 있다.
빅데이터를 이용해야 하는 이유
최근 한 리서치 업체의 조사에 따르면, 빅데이터 활용을 준비 중이거나 이미 활용 중인 기업이 모든 업종별로 40% 이상인 것으로 조사되었다. 이러한 결과의 이유에는 바로 고객 파악이 모든 사업 성공의 필수 요건이기 때문이다.
데이터는 사용자들이 어떤 것을 원하고, 어떻게 이용하는지에 대한 정보가 모두 담겨 있다. 데이터 속에서 주된 고객층의 흐름을 파악하여 거기에 맞는 상품을 제공하는 것이 고객과 기업 모두의 이익이 되기 때문에 빅데이터 활용은 이제 기업 입장에서 선택이 아닌 필수조건이 되는 것이다. 현재 동일 업종의 기업 내에서 빅데이터를 이용하는 기업과 하지 않는 기업은 실제로 큰 차이를 보여주고 있다.
온라인으로 많은 것을 이용하는 현대 사회에서 소비자의 호감을 얻기 위해 가장 중요한 서비스 특징이 바로 신속성이다. 몇 년 전부터 한 소셜커머스 기업이 빅데이터 분석을 이용하여 다른 소셜커머스 기업들보다 크게 성공하였다.
서비스 이름은 바로 ‘로켓 배송’이다. 한 소비자가 기저귀가 필요하여 주문을 하면, 기존의 소셜커머스 기업들에서는 주문 정보가 들어가고 그때 포장을 하여 택배로 보내는 데까지 1~2일 정도 시간이 필요하다.
그러나 ‘로켓 배송’을 해 주는 소셜커머스 기업에 기저귀를 주문한다면, 주문 정보가 기업으로 가는 것이 아니라, 주문을 한 소비자의 지역에 있는 ‘캠프’라고 불리는 물류센터로 간다. 그렇게 되면 주문 정보를 받은 ‘캠프’에서는 미리 포장을 완료한 기저귀를 즉시 배송을 하여 불과 2~3시간 만에 소비자에게 기저귀가 배달된다.
‘캠프’에서 미리 포장 완료된 기저귀를 준비할 수 있었던 이유가 바로 빅데이터 분석을 활용하였기 때문이다. ‘로켓 배송’에서는 각 지역별로 주문했던 지난 내역들을 빅데이터 분석을 통해 주문이 들어올 상품들을 미리 포장을 완료하여 ‘캠프’라는 물류창고에 보관하고 있었기 때문에 빠른 시간 안에 주문부터 배송까지 완료를 할 수 있었던 것이다.
빅데이터 분석을 통한 주문상품 예측으로 빠른 배송이 완료되어, 소비자들의 기업에 대한 만족도가 ‘로켓 배송’을 안 하는 다른 업체에 비해 월등하게 높게 나타났다. 빅데이터 분석을 통한 주문물량 예측이 완벽하게 맞는 것이 아니기 때문에, 재고에 대한 기업 손해는 엄청나다. 결론적으로, 빅데이터 분석을 통한 주문 예측으로 ‘로켓 배송’에 성공하여 1조원의 투자를 받아 크게 성공했다.
〈그림 1〉은 최근에 소비자들에게 소셜커머스 기업들의 평판을 조사한 자료이다. 이 그래프에서 보듯, ‘로켓 배송’을 하여 소비자에게 빠른 상품 배달을 한 쿠팡은 다른 기업들에 비해 소비자 평판이 높게 나왔다. 또한 ‘로켓 배송’ 서비스를 시작한 2015년 이후 매출액이 상당히 증가한 것을 확인할 수 있었다.
이러한 ‘로켓 배송’이 가능한 이유는 차세대 IT 기술인 빅데이터 분석을 적극 활용하였기 때문이다. 이처럼 빅데이터 분석을 통해 서비스를 개발한 기업은 그러지 않은 기업에 비해 높은 소비자 만족도와 매출을 얻게 되었다.
우리 주변의 빅데이터 활용사례는?
서울시는 심야시간대의 통화량 등의 빅데이터를 분석해 심야버스 노선을 도출했다.
1) 서울시 심야버스 노선도
주변을 둘러보면 빅데이터는 이미 우리의 일상 속 많은 분야에서 응용되고 있다. 대표적인 사례는 2013년 개통한 서울시 심야버스 노선이다. 심야버스의 노선도는 직관적으로 만들어진 것이 아니라 빅데이터를 통한 철저한 분석에 의해 도출된 것이다. 어떤 식으로 사용 되었는가를 간단히 살펴보면 다음과 같다.
우선 심야시간대의 통화량 등을 이용하여 서울시 각 지역의 유동인구 밀집도를 수집하고 이를 분석한다. 그리고 결과에 따른 최적의 노선을 도출한다. 이렇게 도출된 노선을 기준으로 다시 한 번 유동인구 빅데이터를 이용하여 배차 간격을 조절한다. 이러한 과정을 거쳐 탄생한 심야버스는 하루 평균 1000명 이상의 승객이 이용하고 있다. 즉, 빅데이터를 통한 분석과 의사결정이 사람들에게 좀 더 편안함을 준 사례이자 아주 모범적인 빅데이터의 활용 사례라고 할 수 있다.
2) 신용평가모델
빅데이터는 일상생활뿐만 아니라 금융에서도 널리 이용되고 있다. 최근의 신용평가 모델은 기존의 복잡한 과정과 인터뷰 등을 거치지 않고 온라인상으로 제공하는 서비스가 등장하고 있다. 이는 빅데이터 기반의 핀테크 서비스 중 하나로 대두되고 있다. 기존의 신용평가는 여러 종류의 서류와 인터뷰 등을 통해 이루어졌다. 심사 대상자는 신용평가 등급을 받기 위해서는 복잡하고 귀찮은 준비 과정을 거쳐야만 했다.
그러나 빅데이터를 기반으로 한 새로운 신용평가 모델은 이러한 준비가 전혀 필요치 않다. 최소한의 신청자 정보만을 가지고 해당 신청자의 소셜네트워크 활동 데이터를 수집하여 이를 기준으로 평가하는 방식이다. 예를 들면, 신청자가 소셜네트워크상에서 “부정적인 단어의 사용이 많다”라는 것이 빅데이터 수집, 분석을 통해 도출되었다면 신청자의 신용도에 대해서 다시 한 번 고려해 볼 만한 사항이 될 수 있을 것이다.
또한 택배 이용률도 신용평가의 기준이 될 수 있다. 만약 A라는 사람이 꾸준히 택배를 이용하는 사람이라면 A는 일정한 소득이 있을 것이라고 유추할 수 있고 이것을 신용도를 평가하는 요소로 활용할 수 있을 것이다. 즉 빅데이터는 기존의 정형적인 데이터를 넘어서 비정형적인 데이터에서도 의미를 찾을 수 있도록 해 주었다고 할 수 있다.
3) 금융 신상품 개발
또한 빅데이터는 금융 기업들의 마케팅 및 상품 개발에서도 이용되고 있는데 대표적으로 신한카드를 예로 들 수 있다. 신한카드는 위성호 신한카드 사장이 취임하면서 ‘빅데이터 경영’을 선언하였다. 이는 신한카드가 보유하고 있는 고객들의 카드 사용 실적을 토대로 빅데이터를 구성하고 이를 분석하여 소비패턴, 선호 트렌드를 도출한 뒤 각각의 성별, 연령대에 맞춤 형태의 상품을 개발하여 제공하고 있다. 사용자들은 자신에게 가장 적합한 서비스를 제공받을 수 있고 기업의 입장에서는 훨씬 효율적으로 고객유치를 할 수 있으므로 1석 2조의 효과를 가지고 있다고 볼 수 있다.
이러한 여러 사례들을 통해서도 볼 수 있듯이 빅데이터는 우리에게 정보를 보는 새로운 관점과 단순한 숫자나 문자의 나열에 불과했던 과거의 데이터들과는 다르게 의미있는 정보를 제공해준다.
빅데이와 핀테크의 미래
위의 빅데이터의 활용 사례를 보면서 우리가 기술 발전의 혜택이 보이지 않는 곳에서도 많이 받는다는 것을 알 수 있다. 앞으로 빅데이터를 이용한 서비스를 제공하는 기업이 늘어날 추세이며, 우리가 이용하는 데이터 정보가 더 늘어나게 된다면 우리가 받는 혜택 또한 더 다양해질 것이다. 빅데이터가 주는 혜택이란, 우리에게 느껴지지는 않지만 마음속으로만 바랐던 편의성을 기업과 정부에서 제공하는 것이다.
카드 활용 사례나 개인 신용 평가에서 빅데이터가 이용되는 사례를 본다면 과거에 언급하였던 P2P대출, 로보어드바이저의 투자와 같은 핀테크 업체에도 충분히 이용될 전망이다. 특히 최근 P2P대출의 선두주자로 소개하였던 ‘렌딩클럽’의 경우 초기 사용자의 대출 상환이 이루어지지 않아 많은 어려움을 겪고 있는 실정이다. 초기 사용자의 신용평가 모델이 적합하지 않아 이러한 일이 벌어지게 되었는데 빅데이터를 통한다면 해결책이 될 수 있다. 또한 로보어드바이저의 경우에는 기본적으로 데이터 분석을 통한 투자이다. 그렇다면 다양하고 많은 데이터가 있다면 새로운 투자 상품 개발과 투자 적합처를 발견할 수 있게 될 것이다.
이외에도 보험, 대출, 투자 등 핀테크 기업은 빅데이터를 활용하여 사업에서 가장 중요한 시장의 흐름, 고객의 니즈 파악, 상품 분석 등에 이용이 가능하다. 또한 이를 활용한 기업과 활용하지 않은 기업의 차이는 최종적인 성공의 여부와 관련이 있을 것이다.
결론적으로, 이제는 데이터가 우리 사회 전반의 기술의 기름과 같은 역할을 하게 되었고, 더 많은 데이터를 가지고 이용하는 기업이 돈을 벌고, 경쟁에서 이길 수 있는 세상이 열린 것이다.
[월간조선 2017년 4월호 / 글=박수용 서강대 컴퓨터공학과 교수]
빅데이터의 활용 현황, 문제점과 대책
아마존 이용고객이라면 해당 인터넷 사이트를 로그인 할 때, 추천도서가 뜬다는 것을 알고 있을 것이다. 이때 추천도서는 일괄적인 것이 아니라 로그인 한 회원마다 달리 나타난다. 아마존은 과거 고객이 구매한 장르, 클릭한 장르 등 방대한 자료를 분석하여 맞춤형 서비스를 제공한다. 한편, 구글은 검색어 추이를 나타내는 ‘google flu trends’를 통해 어느 지역에서 독감이 유행할 것인지를 예측하며, 월마트는 금요일 밤마다 기저귀 판매대 옆에 맥주를 구비해둔다. 이것이 ‘빅데이터’의 힘이다.
[그림1] google flu trends‘빅데이터’란 단지 양이 거대한 데이터만을 의미하는 것이 아니라, 형식이 다양하고 순환속도가 빨라 분석이 어려운 데이터를 통칭한다. 이는 복잡하지만 막대한 잠재가치를 지닌 원석이라 할 수 있다. 빅데이터 분석을 통해 산업부문, 특히 제조업에서 개발·조립 비용의 50%, 운전자본의 7% 절감을 기대할 수 있고, 공공부문으로는 미국 헬스케어 분야에서 연간 3000억 달러, 유럽에서 연간 2,500억 유로의 가치가 창출될 것으로 기대한다. 이러한 빅데이터의 가치에 주목하여 미국에서는 지난해에만 빅데이터 관련 벤처기업에 대한 투자가 36억 달러(3조7800억원)에 달했고, 빅데이터 선도기업인 구글, 애플, 페이스북 등은 빅데이터 분석업체를 인수했다.
글로벌 시장의 성패(成敗), 빅데이터 활용에 달렸다
이러한 ‘빅데이터’의 전략적 사용은 다음과 같이 크게 네 가지 분야로 나누어 볼 수 있다.
첫째는 과거 데이터로부터 규칙성을 분석하여 미래의 수요 및 리스크를 추정하는 것이다. 패션기업 ‘자라(ZARA)’는 전 세계 환경정보, 품목별 특징과 전시위치, 판매실적 등을 실시간 집계하여 매장·품목별 적정재고를 산출하고 이를 주문 가이드에 이용한다. 미국 ‘T-mobile’은 빅데이터를 이용하여 리스크를 경감시킨 사례이다. 다른 통신사로 옮긴 고객이 사전에 보였던 특유 이용패턴을 발견하고 이를 실시간으로 포착하는 시스템을 구축, 고객 이탈을 사전에 감지 및 대처했다. 그 결과 이탈고객 수는 시스템 구축 전의 절반으로 낮아지는 성과를 이뤘다.
둘째, 고객의 무의식적 니즈에 대한 발견이다. 소비자의 일상이 담긴 정보에서 경쟁사 혹은 고객 스스로 인지하지 못한 새로운 패턴의 니즈를 발견할 수 있다. 미국 ‘하라스 호텔(Harah’s Hotel)’은 매년 3,000만 명에 달하는 고객의 행동패턴을 분석하여 카지노 주 고객층이 관광객이 아닌 평범한 지역주민임을 알아냈고, 가족오락공간으로 맞춤형 마케팅을 통해 업계 1위를 달성했다.
셋째, 빅데이터를 통해 고도의 맞춤형 서비스를 제공할 수 있다. 빅데이터를 활용한다면 인구통계학적 분류 외에 맥락기반의 분류가 가능해져 개별 상황에 적합한 서비스를 제공할 수 있다. 미국의 소셜네트워크 서비스사인 ‘태그드 닷컴(Tagged.com)’은 사용자 1억 명의 데이터로 고객의 친구 및 대화상대까지 파악하여 실시간 개인맞춤형 데이팅 서비스를 제공하고 있다. 앞서 언급한 아마존의 도서추천시스템도 빅데이터를 이용한 맞춤형 서비스의 대표적인 예이다.
빅데이터의 마지막 활용전략은 비용절감이다. 기술투자비의 상당 부분을 빅데이터 관련 연구에 투입하고 있는 미국 운송업체 ‘UPS’는 적절한 부품 교체로 차량 고장을 최소화하며 배송 지연을 줄이고 연간 수백만 달러의 차량 유지비를 절감시켰다. 또한, 반도체기업 ‘마이크론’은 장비에 유입되는 제품의 순서를 조합해 최적화된 공정일정을 세워 생산시간의 10%를 단축, 약 수백억대의 비용 절감을 달성할 수 있었다.
이렇게 선진국의 글로벌 기업들이 일찍이 빅데이터의 중요성에 눈을 뜬 반면, 빅데이터를 경영에 활용하는 우리나라 기업은 10개 미만이다. 아직 빅데이터에 대한 인식이 부족하여 정보를 체계적으로 축적하지 못했고, 단지 의사결정합리화를 위해 일회적으로 데이터를 소모하는 경우가 많아 빅데이터 관리와 분석에 필요한 지식기반이 취약한 실정이다.
따라서, 우리나라의 빅데이터 활용을 위한 과제는 기업들이 이러한 빅데이터의 가치를 인식하고 분석인력과 기술에 대한 적극적인 투자를 함과 동시에 정부 또한 공공 빅데이터 공급과 활용을 위한 인프라를 마련하는 것이다. 영국과 미국은 정부가 포털사이트를 만들어 빅데이터를 공급하고 활용을 장려하고 있는데, 이를 통해 기업들은 새로운 사업기회를 창출하고 있다. 미국 기후보험업체 ‘클라이밋 코퍼레이션’은 정부가 개발한 공공 기후 데이터를 통해 이상 기후 발생 시 해당 농가에 보험금을 지급하는 기후보험을 판매한다. 맥킨지는 이러한 공공부문 빅데이터의 잠재효과를 EU의 경우 1,500~3,000억 유로, 영국의 경우 160~330억 파운드로 추정하고 있다.
잘쓰면 약, 못쓰면 독이 되는 빅데이터의 양면성
물론 빅데이터가 장밋빛 미래만을 제시하지는 않는다. 가장 큰 문제점은 개인정보침해다. 얼마 전 금융회사의 고객정보가 대규모로 유출되어 사회적인 문제가 되었다. 빅데이터는 대량의 개인정보가 수집 및 관리되므로 사업자의 고의 또는 과실에 의해 개인정보가 침해 혹은 누설될 수 있다. 방송통신위원회의 ‘빅데이터 개인정보보호 가이드라인’이 있지만 이 또한 현행개인정보보호법에 위배될 수 있고, 인권 침해 가능성이 있다며 시민단체들은 우려를 표하고 있다.
따라서 빅데이터를 산업발전에 유익하게 사용하려면 개인정보침해에 대한 강화된 대책이 필수적이다. 이를 위해서는 정보보안기술 자체의 개발도 중요하지만, 특히 체계적인 정보보안전략의 수립이 필요하다. 지금까지는 개인정보유출사고가 발생하면 타부서 혹은 외부협력기관에 책임을 전가하며 미봉책으로 대처하는 경우가 많았다. 이제 그러한 안일한 태도에서 벗어나 사전에 철저한 보안전략을 수립하고, 책임소재를 명확히 해야 한다.
현명한 ‘빅데이터’와 사생활을 침해하는 ‘빅브라더’는 동전의 양면이다. 빅데이터의 성공적인 활용은 개인정보침해에 대한 대책이 얼마나 잘 수립되어 있는가에 달려있다고 해도 과언이 아니다. 빅데이터는 지난 다보스 포럼에서 2012년의 가장 중요한 기술 중 하나로 지목되었고, 현 정부의 창조경제를 달성하기 위한 핵심사업이기도 하다. 따라서 앞으로 산업계는 다가오는 빅데이터 시대를 맞이하여 새로운 사업기회를 포착함과 동시에 정보보안리스크에 대한 대책마련에도 힘써야 할 것이다.
조하현 (연세대학교 경제학과 교수, [email protected])
——————————————————————————————————————–
* 외부필자 기고는 KERI 칼럼의 편집방향과 일치하지 않을 수도 있습니다.
[NIE]내 모든 것이 기록되는 세상, 빅데이터
출처=클립아트코리아 주제 다가서기 미디어와 뗄 수 없는 생활을 하는 우리는 구글, 네이버와 같은 검색엔진을 통해 정보를 검색하고, 유튜브에서 동영상을 찾아보며, 메신저와 SNS를 통해 지인들과 소통한다. 그런데 대부분 무료로 서비스를 이용한다. 정말 무료일까? 이런 서비스를 제공하는 회사들은 우리에게서 무엇을 가져갈까? 그건 바로 우리의 ‘데이터’이다. 우리가 어떤 정보를 찾는지, 무엇에 관심이 있는지, 누구와 대화하는지 등 일상의 데이터를 대신 건네받고 있다. 우리의 모든 것이 데이터가 되는 세상에서 ‘21세기의 자원’이라고 불릴 만큼 중요한 가치를 지니고 있다는 ‘빅데이터’는 무엇일까? 어떻게 생성되고 저장되는 것일까? 또 어떻게 활용할 수 있을까? 이번 시간에는 빅데이터에 대해 알아보고, 빅데이터 활용의 양면성과 바람직한 활용 방향에 대해 생각해 보고자 한다. 주제 관련 신문기사 ‣ 매일경제 2021년 4월 21일, 21세기 원유 ‘빅데이터’ 미래 예측 도구로 ‣ 소년한국일보 2020년 7월 22일, 빅데이터가 만드는 새로운 세상 ‘스마트시티’ ‣ 한국경제 2020년 7월 2일, 데이터, 축적과 활용 사이 신문 읽기 21세기 원유 ‘빅데이터’ 미래 예측 도구로 읽기자료> 과거 20년 전만 하더라도 큰 데이터가 있어도 담을 그릇이 없었다. 즉 USB와 같은 저장장치가 부족했다. 하지만 이제는 더 이상 콘텐츠를 담고자 노력을 기울이지 않아도 된다. 그만큼 데이터, 콘텐츠, 정보가 많아졌고 어떻게 데이터를 모으고 재가공하느냐에 따라 전혀 상상치 못했던 새로운 보물이 탄생하게 된다. Q. 빅데이터란 무엇인가. A. 빅데이터(big data)는 대용량 데이터가 뭉친 형태를 일컫는 말이다. 즉 데이터 하나하나가 모여 의미와 가치가 있는 단위로 묶인 데이터 덩어리가 바로 빅데이터라고 보면 된다. 데이터가 중요한 이유는 정보를 담고 있기 때문이고 이러한 정보에서 새롭고 가치 있는 의미를 담은 정보를 재가공할 수 있기에 4차 산업혁명의 대표 기술로 불리고 있다. 기존 데이터베이스 처리 소프트웨어(SW) 방식으로 처리할 수 없을 정도로 방대한 분량을 빅데이터라 부르고 있다. 시장조사기관인 매킨지도 빅데이터를 일반 데이터베이스 소프트웨어가 저장하고 관리하며 분석하는 범위를 초과하는 데이터라고 정의했다. 이젠 데이터를 기반으로 개인별 맞춤형 정보를 제공하는 것도 가능해졌다. Q. 빅데이터의 발전 과정은 A. 2001년 세계적 시장조사업체인 가트너는 빅데이터를 3V로 정의했다. 즉 데이터의 양(Volume), 데이터의 속도(Velocity), 데이터의 종류(Variety)다. 데이터의 양이 매우 많고 속도가 매우 빠르며 매우 다양함을 뜻한다. 빅데이터는 사회관계망서비스 (SNS)와 같은 소셜미디어, 위성항법시스템(GPS)에 따른 위치 정보, 인터넷 이용 정보는 물론 사진, 동영상, 텍스트 등을 모두 포함한다. 불과 지난 2년 동안의 데이터 양이 인류 역사 전체 기간에 축적한 양보다 많다고 한다. 생산 속도도 엄청나 지난해 기준으로 1분에 약 1800테라바이트(TB)가 만들어진다. 무엇보다 빅데이터가 본격 출현한 데는 2007년 스마트폰의 탄생이 영향을 미쳤다. 모바일의 확산은 많은 정보를 만들게 해줬고 빅데이터 개념을 좀 더 빠르게 발전시켰다. 아울러 컴퓨터 성능의 증대, 데이터 저장장치의 비용 감소는 빅데이터 발전을 앞당겼다. 메모리 저장 비용의 하락, 정보를 저장하고 관리하는 클라우팅 컴퓨팅 기술의 확산, 데이터를 쉽고 싸게 이용할 수 있는 분산파일시스템의 개발 등도 큰 요인이 됐다. Q. 생활 속에서 빅데이터는 무엇이 있나 A. 오늘날 데이터는 자산, 자본, 돈이라고 말한다. 혹자는 경쟁력을 좌우할 21세기 원유라고도 한다. 원유는 정제 과정을 거쳐 석유나 휘발유가 되기도 하지만 플라스틱, 의약품 원료, 섬유류로도 재탄생한다. 이처럼 데이터는 여러 분석 과정을 거치면서 전혀 의도하지 않았던 정보도 만들어줘 원유에 비유된다. 구글이 빅데이터를 활용해 미국의 독감 유행을 의료전문기관보다 미리 발표한 것은 유명한 사례다. 데이터를 알면 수백 년 전 기록을 바탕으로 미래를 예측할 수도 있다. 역사적 데이터를 기반으로 한 과거 기상 데이터는 향후 몇 십년 내 지진이나 화산 폭발과 같은 예측에 도움을 줄 수 있다. 이 밖에도 심야버스(올빼미) 노선도나 심야 로켓배송, 카드사나 보험사의 고객 맞춤형 상품 출시 등은 이미 우리 생활 속에 자리 잡고 있다. 이처럼 빅데이터는 좀 더 편리한 생활을 누리는 데 도움을 주고 있다. Q. 미래의 빅데이터는 A. 정부가 추진하는 디지털 뉴딜 정책에 따라 올해 ﹡데이터댐을 통해 데이터 14만개를 일반에 공개하기로 했다. 아울러 디지털 대전환을 이루기 위해 2025년까지 예산 58조원가량을 투입해 디지털 뉴딜 정책을 본격 시행하고 있다. 물론 빅데이터가 가장 우려되는 부분은 사생활 침해와 보안이다. 수많은 이해관계자에게 얻은 정보이기에 데이터를 수집할 때 개인정보가 한번 유출되면 피해가 커 조심스러운 접근이 필요하다. 또 유발하라리가 예측한 것처럼 극소수가 데이터를 독점하는 ‘디지털 독재’를 항상 경계해야 할 것이다. 아울러 빅데이터를 잘 운용하기 위해서는 데이터사이언스의 중요성을 인식하고 관련 교육과 산업을 발전시켜 나가야 한다. 결국 데이터는 우리 속담에 있는 ‘구슬도 꿰어야 보배’라는 말과 가장 일치한다. 출처> 빅데이터가 만드는 새로운 세상 ‘스마트시티’ 읽기자료> 인공지능은 빅데이터 기술을 만나 획기적인 발전을 하고 있어요. 앞으로 더 많은 데이터가 생기고 그 처리 속도가 빨라지게 되면 인공지능의 수준도 비약적으로 발전하게 될 가능성이 충분해요. 미래학자들은 인공지능과 빅데이터가 만나면 지금까지와는 전혀 다른 세상이 펼쳐질 것으로 생각해요. 우리나라를 비롯한 많은 나라는 빅데이터가 변화시킬 미래 도시의 모습에 관심을 기울이고 있어요. 현재 세계 인구 중 도시에 사는 사람들의 비율은 54/%인데 UN은 2050년에는 이 비율이 70%로 증가할 것으로 예상하고 있어요. 이렇게 도시에 사는 사람들이 많아지면 자연스럽게 도시 문제를 어떻게 효율적으로 해결할 것인지가 지금보다도 훨씬 더 중요해져요. 교통 혼잡, 환경 파괴, 일자리 부족, 쓰레기 처리 등 도시에는 해결해야 할 과제가 많기 때문이죠. ‘스마트시티’란 도시를 효율적으로 관리할 수 있는 체계를 갖춰서 사람들의 삶의 질을 높이는 도시를 말해요. 이렇게 똑똑한 도시를 만드는데 빅데이터는 빼놓을 수 없는 중요한 요소지요. 하지만 모든 것이 완벽해 보이는 이상적인 도시가 짧은 시간에 만들어지기는 어려워요. 그래서 작은 것부터 빅데이터를 적용해서 해결하려는 시도가 현재 세계 곳곳에서 진행되고 있어요. 프랑스의 해변 도시 니스에서는 교통량에 따라서 가로등의 밝기를 자동으로 조절하는 스마트 조명을 설치해 에너지 절약은 물론 차량 절도까지 줄이는 효과를 보았다고 해요. 미국은 도시 주요 지역에 적외선 카메라를 설치해서 기후와 대기의 오염 정도, 소음과 진동을 측정하고 이를 분석해서 산책하기 좋은 시간대별 코스 정보를 제공하고 있어요. 중국의 항저우시에는 어람 전 ‘빅데이터 버스’가 등장했어요. 승객이 미리 자기가 갈 곳을 선택해서 예약하면 데이터 센터에서 맞춤형 운행 노선을 만들어요. 버스 노선이 미리 정해져 있는 것이 아니라 그때그때 승객이 원하는 장소로 새롭게 노선이 정해지는 셈이에요. 22명 이상의 승객이 같은 노선을 원하면 버스를 운행해요. 또 항저우시는 주요 도로와 교차로에 4000개의 지능형 CCTV를 설치했어요. 이를 통해 수집한 차량흐름 데이터를 분석해서 신호등을 차량 흐름에 맞게 자동으로 조정했지요. 그 결과 차량 속도가 11%가량 빨라졌다고 해요. 우리나라도 스마트시티를 만드는 계획을 세우고 있어요. 서울시는 25개 구청이 보유하고 있는 CCTV 6만 8000대를 112, 119와 연계할 예정이에요. 이렇게 되면 시민들이 긴급한 상황이 생겨 112나 119로 전화를 걸면 상황이 발생한 곳의 CCTV 영상정보를 활용해서 구조나 구급을 정확하고 신속하게 할 수 있다고 해요. 출처> 데이터, 축적과 활용 사이 읽기자료> 데이터는 ‘21세기 원유’로 비유된다. 지문이나 홍채 등 신체 데이터와 금융 데이터가 결합하면 교통카드 없이 지하철을 타고 별도의 결제수단 없이 쇼핑하는 놀라운 일이 가능해진다. 신체 데이터가 파악되면 연결된 금융계좌를 통해 결제가 이뤄지기 때문이다. 과거엔 공상과학(SF) 영화에서나 가능하다고 여겼던 일들이 이미 현실이 됐다. 중국에서다. 하지만 이들 데이터에는 양면성이 있다. 시민의 삶을 편리하게 하기 위한 데이터가 개인의 이동을 감시하고 통제하는 데 사용될 수도 있다. 중국에서는 빅데이터에 기반을 둔 사회 신용 체계(social credit system)가 작동한다. 교통 법규를 어기거나 잠옷을 입고 거리를 활보하는 등 공중도덕을 지키지 않은 경우 길거리 전광판에 얼굴과 이름이 알려져 공개 망신을 당하고, 세금 체납자는 항공기와 열차 탑승이 현장에서 거부된다고 한다. 이처럼 이종(異種) 데이터의 결합은 기회와 위험 모두를 의미한다. 문제는 그 경계가 명확하지 않다는 점이다. 방대한 데이터가 모였을 때 과연 어떤 분석과 활용까지 허용할 수 있을까. 유럽연합(EU)은 의도치 않은 활용을 막기 위해 이종 데이터의 결합을 원천적으로 봉쇄했다. 이것이 2016년부터 시행된 GDPR(General Data Protection Regulations), 개인정보 보호법이다. GDPR은 개인정보의 수집·저장·구성·변경·사용·결합·삭제를 비롯한 전 범위를 다루며 인터넷 도입 이래 가장 강력하고 까다로운 규정이라 평가받는다. AI 발전에 필요 vs 사생활 침해 이번 신종 코로나 바이러스 감염증(코로나19) 사태에 한국을 비롯해 대만, 호주 같은 국가는 데이터의 기회와 위기 사이에서 균형점을 찾은 듯하다. 개인의 휴대폰 위치 정보와 신용카드 사용 명세 데이터를 결합해 확진자의 동선 및 접촉 위험자를 파악하는 정보로 활용했다. 이를 토대로 확진자가 어디에서 코로나19에 감염됐는지 추적이 가능했고, 역학조산관의 작업 시간도 효율적으로 단축할 수 있었다. 국가가 보유한 데이터를 재난 상황에 적절히 활용해 재빠르게 대처한 것이다. 어쩌면 ‘사생활 침해’로 여겨질 수 있는 데이터 활용임에도 대다수 국민은 개인 데이터가 사용될 수밖에 없는 특수한 위기상황임에 공감했고, 정부에 대한 지지도는 오히려 상승했다. 하지만 코로나19 확진자 경로를 토대로 신변 노출 피해가 뒤따르기도 했다. 이태원 클럽 단순 방문자 중에도 신변 노출을 꺼리는 이가 많았고, 교인들도 신천지 관련 의심을 받을까 공개를 꺼렸다. 이는 사회적 분리 현상을 가속화했다. 일부 확진자와 관련해 잘못된 신상털기 현상이 벌어지기도 했다. 축적보다 활용에 대한 논의 절실 2006년 미국의 저명한 인터넷 기업 아메리카온라인(AOL)은 65만명 사용자의 석 달치 검색어 목록을 연구 목적으로 공개했다. 회사는 사용자 아이디를 무작위 숫자로 변경해 공개했지만 사용자들이 간혹 자신의 이름, 사회보장번호, 집 주소, 전화번호 등의 개인식별정보와 진료를 받은 병원, 특이한 취미 등 민감한 정보를 검색 키워드로 사용한다는 점을 간과했다. 논란이 불거지자 AOL은 즉각 데이터를 삭제했지만 이미 공개된 데이터는 빠른 속도로 퍼져나갔다. 결국 데이터를 공개한 직원과 당시 최고 기술책임자는 해고됐으며 캘리포니아지방법원에서 이뤄진 집단소송 결과 업체의 데이터 공유로 피해를 본 사용자에게 최소 5000달러씩 보상하라는 판결이 내려졌다. AI 분야를 선점하고자 하는 나라들은 앞으로 더욱 빠른 속도로 데이터를 축적하고 공유하며 ‘데이터 산유국’으로 떠오를 것이다. 코로나19로 ‘비대면’이 일상화된 오늘날 AI는 산업과 국가행정에 적극적으로 활용되고 있으며 당분간 데이터 경쟁은 더 치열해질 것이다. 앞으로는 누가 양질의 데이터를 축적했는지에 대한 논의보다 방대한 데이터를 어디까지 사용해도 좋을지에 대한 논의가 필요할 것이다. 한국경제> 생각 열기 활동 1. 을 읽고, 빅데이터가 무엇인지 정리해 봅시다. 읽기자료1> 활동 2. 을 읽고, 편리한 생활을 위해 빅데이터가 어떻게 활용되고 있는지 찾아 써 봅시다. 읽기자료1> 활동 3. 을 읽고, 빅데이터 활용의 장단점에 대해 정리해 봅시다. 읽기자료1> 장점: 단점: 활동 4. 를 읽고, 빅데이터를 적용하여 도시 문제를 해결한 나라들의 사례를 정리해 봅시다. 읽기자료2> ※도표 형식 국가(도시) 문제 해결 방법 프랑스(니스) 미국 중국(항저우) 활동 5. 을 읽고, 중국의 빅데이터 기반 ‘사회 신용 체계’에 대한 생각을 써 봅시다. 읽기자료3> 활동6. 을 읽고, 개인 데이터의 활용 범위에 대한 자신의 생각을 써 봅시다. 읽기자료3> 빅데이터 관련 용어 정리하기 데이터 댐 정부가 2020년 7월 14일 확정·발표한 정책인 ‘한국판 뉴딜’의 10대 대표과제 중 하나로, 데이터 수집·가공·거래·활용기반을 강화하여 데이터 경제를 가속화하고, 5G 전국망을 통한 전 산업 5G와 AI 융합을 확산시키는 것이다. 10대 대표과제는 디지털 뉴딜(3개), 그린 뉴딜(3개), 융합과제(4개)로 구성돼 있는데, 데이터 댐은 디지털 뉴딜 분야에 속한다. 빅브라더(big brother) 사회학적 통찰과 풍자로 유명한 영국의 소설가 조지 오웰의 소설 《1984년》에 등장하는 전체주의 정부를 가리키는 말로서, 정보를 독점해서 사회를 통제하는 권력이나 사회체계를 뜻한다. 생각 키우기 ■ 더 읽어보면 좋을 기사 ‣ 동아일보 2021년 7월 7일, 애플, 中기업 개인정보 추적 차단··· 美-中 ‘데이터 전쟁’ ‣ 국제신문 2021년 12월 20일, 빅데이터 알고리즘으로 사생활 통제···‘빅브라더’ 미래 우려 ‣ 서울경제 2021년 11월 3일, “데이터가 경쟁력” 맞춤형 구독상품 ‘쑥’ ■ 함께 읽으면 좋을 도서 그림입니다. 원본 그림의 이름: 생각이 크는 인문학 15빅데이터.JPG 원본 그림의 크기: 가로 354pixel, 세로 512pixel 제목: 생각이 크는 인문학15 빅데이터 – 빅데이터는 우리의 삶을 어떻게 바꾸고 있을까? 글/그림: 정용찬/이진아 출판사: 을파소(21세기북스) 이 책은 빅데이터는 무엇인지, 빅데이터는 어떻게 활용되고 있으며, 앞으로는 어떻게 발전하게 될 것인지 살펴보고, 빅데이터와 사생활보호, 개인정보보호와 같은 민감하고도 중요한 이슈를 함께 살펴본다. 또한 어린이와 청소년들에게 정보를 어떻게 활용할 것인지, 어떤 정보를 취하고 버려야 할지 등을 함께 생각해보는 기회를 제공할 것이며, 이미 다가온 4차 산업혁명, 빅데이터 시대에 스스로 생각하고, 꿈꾸고 미래를 준비하는 아이들의 좋은 길잡이가 되어줄 것이다. 출처:> /제작=윤지선(이리북일초 교사)
출처=클립아트코리아
주제 다가서기
미디어와 뗄 수 없는 생활을 하는 우리는 구글, 네이버와 같은 검색엔진을 통해 정보를 검색하고, 유튜브에서 동영상을 찾아보며, 메신저와 SNS를 통해 지인들과 소통한다. 그런데 대부분 무료로 서비스를 이용한다. 정말 무료일까? 이런 서비스를 제공하는 회사들은 우리에게서 무엇을 가져갈까?
그건 바로 우리의 ‘데이터’이다. 우리가 어떤 정보를 찾는지, 무엇에 관심이 있는지, 누구와 대화하는지 등 일상의 데이터를 대신 건네받고 있다. 우리의 모든 것이 데이터가 되는 세상에서 ‘21세기의 자원’이라고 불릴 만큼 중요한 가치를 지니고 있다는 ‘빅데이터’는 무엇일까? 어떻게 생성되고 저장되는 것일까? 또 어떻게 활용할 수 있을까?
이번 시간에는 빅데이터에 대해 알아보고, 빅데이터 활용의 양면성과 바람직한 활용 방향에 대해 생각해 보고자 한다.
주제 관련 신문기사
‣ 매일경제 2021년 4월 21일, 21세기 원유 ‘빅데이터’ 미래 예측 도구로
‣ 소년한국일보 2020년 7월 22일, 빅데이터가 만드는 새로운 세상 ‘스마트시티’
‣ 한국경제 2020년 7월 2일, 데이터, 축적과 활용 사이
신문 읽기
21세기 원유 ‘빅데이터’ 미래 예측 도구로 읽기자료>
과거 20년 전만 하더라도 큰 데이터가 있어도 담을 그릇이 없었다. 즉 USB와 같은 저장장치가 부족했다. 하지만 이제는 더 이상 콘텐츠를 담고자 노력을 기울이지 않아도 된다. 그만큼 데이터, 콘텐츠, 정보가 많아졌고 어떻게 데이터를 모으고 재가공하느냐에 따라 전혀 상상치 못했던 새로운 보물이 탄생하게 된다.
Q. 빅데이터란 무엇인가.
A. 빅데이터(big data)는 대용량 데이터가 뭉친 형태를 일컫는 말이다. 즉 데이터 하나하나가 모여 의미와 가치가 있는 단위로 묶인 데이터 덩어리가 바로 빅데이터라고 보면 된다. 데이터가 중요한 이유는 정보를 담고 있기 때문이고 이러한 정보에서 새롭고 가치 있는 의미를 담은 정보를 재가공할 수 있기에 4차 산업혁명의 대표 기술로 불리고 있다.
기존 데이터베이스 처리 소프트웨어(SW) 방식으로 처리할 수 없을 정도로 방대한 분량을 빅데이터라 부르고 있다. 시장조사기관인 매킨지도 빅데이터를 일반 데이터베이스 소프트웨어가 저장하고 관리하며 분석하는 범위를 초과하는 데이터라고 정의했다. 이젠 데이터를 기반으로 개인별 맞춤형 정보를 제공하는 것도 가능해졌다.
Q. 빅데이터의 발전 과정은
A. 2001년 세계적 시장조사업체인 가트너는 빅데이터를 3V로 정의했다. 즉 데이터의 양(Volume), 데이터의 속도(Velocity), 데이터의 종류(Variety)다. 데이터의 양이 매우 많고 속도가 매우 빠르며 매우 다양함을 뜻한다. 빅데이터는 사회관계망서비스 (SNS)와 같은 소셜미디어, 위성항법시스템(GPS)에 따른 위치 정보, 인터넷 이용 정보는 물론 사진, 동영상, 텍스트 등을 모두 포함한다. 불과 지난 2년 동안의 데이터 양이 인류 역사 전체 기간에 축적한 양보다 많다고 한다. 생산 속도도 엄청나 지난해 기준으로 1분에 약 1800테라바이트(TB)가 만들어진다.
무엇보다 빅데이터가 본격 출현한 데는 2007년 스마트폰의 탄생이 영향을 미쳤다. 모바일의 확산은 많은 정보를 만들게 해줬고 빅데이터 개념을 좀 더 빠르게 발전시켰다. 아울러 컴퓨터 성능의 증대, 데이터 저장장치의 비용 감소는 빅데이터 발전을 앞당겼다. 메모리 저장 비용의 하락, 정보를 저장하고 관리하는 클라우팅 컴퓨팅 기술의 확산, 데이터를 쉽고 싸게 이용할 수 있는 분산파일시스템의 개발 등도 큰 요인이 됐다.
Q. 생활 속에서 빅데이터는 무엇이 있나
A. 오늘날 데이터는 자산, 자본, 돈이라고 말한다. 혹자는 경쟁력을 좌우할 21세기 원유라고도 한다. 원유는 정제 과정을 거쳐 석유나 휘발유가 되기도 하지만 플라스틱, 의약품 원료, 섬유류로도 재탄생한다. 이처럼 데이터는 여러 분석 과정을 거치면서 전혀 의도하지 않았던 정보도 만들어줘 원유에 비유된다. 구글이 빅데이터를 활용해 미국의 독감 유행을 의료전문기관보다 미리 발표한 것은 유명한 사례다. 데이터를 알면 수백 년 전 기록을 바탕으로 미래를 예측할 수도 있다. 역사적 데이터를 기반으로 한 과거 기상 데이터는 향후 몇 십년 내 지진이나 화산 폭발과 같은 예측에 도움을 줄 수 있다. 이 밖에도 심야버스(올빼미) 노선도나 심야 로켓배송, 카드사나 보험사의 고객 맞춤형 상품 출시 등은 이미 우리 생활 속에 자리 잡고 있다. 이처럼 빅데이터는 좀 더 편리한 생활을 누리는 데 도움을 주고 있다.
Q. 미래의 빅데이터는
A. 정부가 추진하는 디지털 뉴딜 정책에 따라 올해 ﹡데이터댐을 통해 데이터 14만개를 일반에 공개하기로 했다. 아울러 디지털 대전환을 이루기 위해 2025년까지 예산 58조원가량을 투입해 디지털 뉴딜 정책을 본격 시행하고 있다.
물론 빅데이터가 가장 우려되는 부분은 사생활 침해와 보안이다. 수많은 이해관계자에게 얻은 정보이기에 데이터를 수집할 때 개인정보가 한번 유출되면 피해가 커 조심스러운 접근이 필요하다. 또 유발하라리가 예측한 것처럼 극소수가 데이터를 독점하는 ‘디지털 독재’를 항상 경계해야 할 것이다. 아울러 빅데이터를 잘 운용하기 위해서는 데이터사이언스의 중요성을 인식하고 관련 교육과 산업을 발전시켜 나가야 한다. 결국 데이터는 우리 속담에 있는 ‘구슬도 꿰어야 보배’라는 말과 가장 일치한다.
출처>
빅데이터가 만드는 새로운 세상 ‘스마트시티’ 읽기자료>
인공지능은 빅데이터 기술을 만나 획기적인 발전을 하고 있어요. 앞으로 더 많은 데이터가 생기고 그 처리 속도가 빨라지게 되면 인공지능의 수준도 비약적으로 발전하게 될 가능성이 충분해요. 미래학자들은 인공지능과 빅데이터가 만나면 지금까지와는 전혀 다른 세상이 펼쳐질 것으로 생각해요. 우리나라를 비롯한 많은 나라는 빅데이터가 변화시킬 미래 도시의 모습에 관심을 기울이고 있어요.
현재 세계 인구 중 도시에 사는 사람들의 비율은 54/%인데 UN은 2050년에는 이 비율이 70%로 증가할 것으로 예상하고 있어요. 이렇게 도시에 사는 사람들이 많아지면 자연스럽게 도시 문제를 어떻게 효율적으로 해결할 것인지가 지금보다도 훨씬 더 중요해져요. 교통 혼잡, 환경 파괴, 일자리 부족, 쓰레기 처리 등 도시에는 해결해야 할 과제가 많기 때문이죠.
‘스마트시티’란 도시를 효율적으로 관리할 수 있는 체계를 갖춰서 사람들의 삶의 질을 높이는 도시를 말해요. 이렇게 똑똑한 도시를 만드는데 빅데이터는 빼놓을 수 없는 중요한 요소지요.
하지만 모든 것이 완벽해 보이는 이상적인 도시가 짧은 시간에 만들어지기는 어려워요. 그래서 작은 것부터 빅데이터를 적용해서 해결하려는 시도가 현재 세계 곳곳에서 진행되고 있어요.
프랑스의 해변 도시 니스에서는 교통량에 따라서 가로등의 밝기를 자동으로 조절하는 스마트 조명을 설치해 에너지 절약은 물론 차량 절도까지 줄이는 효과를 보았다고 해요. 미국은 도시 주요 지역에 적외선 카메라를 설치해서 기후와 대기의 오염 정도, 소음과 진동을 측정하고 이를 분석해서 산책하기 좋은 시간대별 코스 정보를 제공하고 있어요. 중국의 항저우시에는 어람 전 ‘빅데이터 버스’가 등장했어요. 승객이 미리 자기가 갈 곳을 선택해서 예약하면 데이터 센터에서 맞춤형 운행 노선을 만들어요. 버스 노선이 미리 정해져 있는 것이 아니라 그때그때 승객이 원하는 장소로 새롭게 노선이 정해지는 셈이에요. 22명 이상의 승객이 같은 노선을 원하면 버스를 운행해요. 또 항저우시는 주요 도로와 교차로에 4000개의 지능형 CCTV를 설치했어요. 이를 통해 수집한 차량흐름 데이터를 분석해서 신호등을 차량 흐름에 맞게 자동으로 조정했지요. 그 결과 차량 속도가 11%가량 빨라졌다고 해요.
우리나라도 스마트시티를 만드는 계획을 세우고 있어요. 서울시는 25개 구청이 보유하고 있는 CCTV 6만 8000대를 112, 119와 연계할 예정이에요. 이렇게 되면 시민들이 긴급한 상황이 생겨 112나 119로 전화를 걸면 상황이 발생한 곳의 CCTV 영상정보를 활용해서 구조나 구급을 정확하고 신속하게 할 수 있다고 해요.
출처>
데이터, 축적과 활용 사이 읽기자료>
데이터는 ‘21세기 원유’로 비유된다. 지문이나 홍채 등 신체 데이터와 금융 데이터가 결합하면 교통카드 없이 지하철을 타고 별도의 결제수단 없이 쇼핑하는 놀라운 일이 가능해진다. 신체 데이터가 파악되면 연결된 금융계좌를 통해 결제가 이뤄지기 때문이다. 과거엔 공상과학(SF) 영화에서나 가능하다고 여겼던 일들이 이미 현실이 됐다. 중국에서다.
하지만 이들 데이터에는 양면성이 있다. 시민의 삶을 편리하게 하기 위한 데이터가 개인의 이동을 감시하고 통제하는 데 사용될 수도 있다. 중국에서는 빅데이터에 기반을 둔 사회 신용 체계(social credit system)가 작동한다. 교통 법규를 어기거나 잠옷을 입고 거리를 활보하는 등 공중도덕을 지키지 않은 경우 길거리 전광판에 얼굴과 이름이 알려져 공개 망신을 당하고, 세금 체납자는 항공기와 열차 탑승이 현장에서 거부된다고 한다.
이처럼 이종(異種) 데이터의 결합은 기회와 위험 모두를 의미한다. 문제는 그 경계가 명확하지 않다는 점이다. 방대한 데이터가 모였을 때 과연 어떤 분석과 활용까지 허용할 수 있을까.
유럽연합(EU)은 의도치 않은 활용을 막기 위해 이종 데이터의 결합을 원천적으로 봉쇄했다. 이것이 2016년부터 시행된 GDPR(General Data Protection Regulations), 개인정보 보호법이다. GDPR은 개인정보의 수집·저장·구성·변경·사용·결합·삭제를 비롯한 전 범위를 다루며 인터넷 도입 이래 가장 강력하고 까다로운 규정이라 평가받는다.
AI 발전에 필요 vs 사생활 침해
이번 신종 코로나 바이러스 감염증(코로나19) 사태에 한국을 비롯해 대만, 호주 같은 국가는 데이터의 기회와 위기 사이에서 균형점을 찾은 듯하다. 개인의 휴대폰 위치 정보와 신용카드 사용 명세 데이터를 결합해 확진자의 동선 및 접촉 위험자를 파악하는 정보로 활용했다. 이를 토대로 확진자가 어디에서 코로나19에 감염됐는지 추적이 가능했고, 역학조산관의 작업 시간도 효율적으로 단축할 수 있었다. 국가가 보유한 데이터를 재난 상황에 적절히 활용해 재빠르게 대처한 것이다. 어쩌면 ‘사생활 침해’로 여겨질 수 있는 데이터 활용임에도 대다수 국민은 개인 데이터가 사용될 수밖에 없는 특수한 위기상황임에 공감했고, 정부에 대한 지지도는 오히려 상승했다.
하지만 코로나19 확진자 경로를 토대로 신변 노출 피해가 뒤따르기도 했다. 이태원 클럽 단순 방문자 중에도 신변 노출을 꺼리는 이가 많았고, 교인들도 신천지 관련 의심을 받을까 공개를 꺼렸다. 이는 사회적 분리 현상을 가속화했다. 일부 확진자와 관련해 잘못된 신상털기 현상이 벌어지기도 했다.
축적보다 활용에 대한 논의 절실
2006년 미국의 저명한 인터넷 기업 아메리카온라인(AOL)은 65만명 사용자의 석 달치 검색어 목록을 연구 목적으로 공개했다. 회사는 사용자 아이디를 무작위 숫자로 변경해 공개했지만 사용자들이 간혹 자신의 이름, 사회보장번호, 집 주소, 전화번호 등의 개인식별정보와 진료를 받은 병원, 특이한 취미 등 민감한 정보를 검색 키워드로 사용한다는 점을 간과했다.
논란이 불거지자 AOL은 즉각 데이터를 삭제했지만 이미 공개된 데이터는 빠른 속도로 퍼져나갔다. 결국 데이터를 공개한 직원과 당시 최고 기술책임자는 해고됐으며 캘리포니아지방법원에서 이뤄진 집단소송 결과 업체의 데이터 공유로 피해를 본 사용자에게 최소 5000달러씩 보상하라는 판결이 내려졌다.
AI 분야를 선점하고자 하는 나라들은 앞으로 더욱 빠른 속도로 데이터를 축적하고 공유하며 ‘데이터 산유국’으로 떠오를 것이다. 코로나19로 ‘비대면’이 일상화된 오늘날 AI는 산업과 국가행정에 적극적으로 활용되고 있으며 당분간 데이터 경쟁은 더 치열해질 것이다. 앞으로는 누가 양질의 데이터를 축적했는지에 대한 논의보다 방대한 데이터를 어디까지 사용해도 좋을지에 대한 논의가 필요할 것이다.
한국경제>
생각 열기
활동 1. 을 읽고, 빅데이터가 무엇인지 정리해 봅시다. 읽기자료1>
활동 2. 을 읽고, 편리한 생활을 위해 빅데이터가 어떻게 활용되고 있는지 찾아 써 봅시다. 읽기자료1>
활동 3. 을 읽고, 빅데이터 활용의 장단점에 대해 정리해 봅시다. 읽기자료1>
장점:
단점:
활동 4. 를 읽고, 빅데이터를 적용하여 도시 문제를 해결한 나라들의 사례를 정리해 봅시다. 읽기자료2>
※도표 형식
국가(도시) 문제 해결 방법 프랑스(니스) 미국 중국(항저우)
활동 5. 을 읽고, 중국의 빅데이터 기반 ‘사회 신용 체계’에 대한 생각을 써 봅시다. 읽기자료3>
활동6. 을 읽고, 개인 데이터의 활용 범위에 대한 자신의 생각을 써 봅시다. 읽기자료3>
빅데이터 관련 용어 정리하기
데이터 댐
정부가 2020년 7월 14일 확정·발표한 정책인 ‘한국판 뉴딜’의 10대 대표과제 중 하나로, 데이터 수집·가공·거래·활용기반을 강화하여 데이터 경제를 가속화하고, 5G 전국망을 통한 전 산업 5G와 AI 융합을 확산시키는 것이다.
10대 대표과제는 디지털 뉴딜(3개), 그린 뉴딜(3개), 융합과제(4개)로 구성돼 있는데, 데이터 댐은 디지털 뉴딜 분야에 속한다.
빅브라더(big brother)
사회학적 통찰과 풍자로 유명한 영국의 소설가 조지 오웰의 소설 《1984년》에 등장하는 전체주의 정부를 가리키는 말로서, 정보를 독점해서 사회를 통제하는 권력이나 사회체계를 뜻한다.
생각 키우기
■ 더 읽어보면 좋을 기사
‣ 동아일보 2021년 7월 7일, 애플, 中기업 개인정보 추적 차단··· 美-中 ‘데이터 전쟁’
‣ 국제신문 2021년 12월 20일, 빅데이터 알고리즘으로 사생활 통제···‘빅브라더’ 미래 우려
‣ 서울경제 2021년 11월 3일, “데이터가 경쟁력” 맞춤형 구독상품 ‘쑥’
■ 함께 읽으면 좋을 도서
그림입니다. 원본 그림의 이름: 생각이 크는 인문학 15빅데이터.JPG 원본 그림의 크기: 가로 354pixel, 세로 512pixel
제목: 생각이 크는 인문학15 빅데이터
– 빅데이터는 우리의 삶을 어떻게 바꾸고 있을까?
글/그림: 정용찬/이진아
출판사: 을파소(21세기북스)
이 책은 빅데이터는 무엇인지, 빅데이터는 어떻게 활용되고 있으며, 앞으로는 어떻게 발전하게 될 것인지 살펴보고, 빅데이터와 사생활보호, 개인정보보호와 같은 민감하고도 중요한 이슈를 함께 살펴본다. 또한 어린이와 청소년들에게 정보를 어떻게 활용할 것인지, 어떤 정보를 취하고 버려야 할지 등을 함께 생각해보는 기회를 제공할 것이며, 이미 다가온 4차 산업혁명, 빅데이터 시대에 스스로 생각하고, 꿈꾸고 미래를 준비하는 아이들의 좋은 길잡이가 되어줄 것이다.
출처:>
/제작=윤지선(이리북일초 교사)
저작권자 © 전북일보 인터넷신문 무단전재 및 재배포 금지
우리나라의 빅데이터 활용과 문제점들
빅데이터에 대한 정의는 어렵다하기 보다는 모호하다는 표현이 맞을 것이다. 네이버 지식백과에서는 “빅데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고 , 생성 주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다“고 규정한다.
다른 측에서는 기존의 기업 환경에서 활용되던 정형화된 데이터를 포함해 메타정보, 센서 데이터, 공정 데이터 등 반정형화 데이터, 사진 및 동영상 등 멀티미디어 데이터인 비정형 데이터를 모두 포함해 말하기도 한다.
논란을 접어두고, 빅데이터의 핵심은 21세기 기업들에 있어 다양한 정보의 집약체인 빅데이터 속에서 어떠한 가치를 끌어내는 지에 따라 기업의 명운을 가르게 된다는 점은 분명하다.
이에 따라 세계의 유수한 기업들은 실제 빅데이터를 분석하고 기업에 필요한 자료를 만들어내는 전문가와 기술에 많은 비용과 시간을 투자하고 있다.
이러한 빅데이터 활용은 소비자에게 최적의 서비스를 제공한다는 점에서 소비자와 기업간의 간극을 줄여주고, 선택에 낭비되는 시간을 줄여주는 장점을 가지고 있다는 것은 분명하다.
예를 든다면 최근 많은 쇼핑몰이나 구매를 목적으로 서비스하는 사이트들의 경우 소비자의 구매 패턴이나 검색 패턴을 고려해 로그인만 하면 소비자의 패턴에 맞는 물품 리스트를 제공한다.
모두에게 동일한 물품 리스트를 보여주는 것이 아닌, 소비자의 특성에 맞는 리스트를 제공하는 것이다. 또한 의료분야에서는 신약개발이나 연구에 있어 각종 의료 정보 및 자료들을 분석해 연구 비용을 절감할 수 있다.
또한 빅데이터을 분석하여 질병의 발생 원인 및 진료 방법 등에 적용하기도 한다. 이 밖에도 빅데이터를 활용해 개인의 삶을 더 윤택하게 만들어주는 사례들은 수없이 많다.
반면, 부작용으로 볼 수 있는 문제들은 개인 사생활 침해와 관련된다. 개인적으로 SNS에 올린 글, 사진, 인터넷 사용 기록들이 데이터 베이스에 남아 그것들이 새로운 정보로 재생성 될 수 있다는 것이다.
심지어 네트워크상에서 지인과의 일상대화까지 빅데이터로서 수집되고 분석된다는 것이다. 그리고 이렇게 수집된 비 식별화된 데이터들이 분석되고 몇 번의 과정을 거치게 되면 실제 개인을 식별할 수 있는 정보로 쉽게 변할 수 있다는 문제가 있다.
이러한 문제점의 대표적인 사례가 미국에서 발생한 대형 소매 유통업체인 ‘타겟(TARGET)’이 어떤 고객이 임산부가 주로 구매하는 품목을 구매했다는 정보를 분석해 여고생 고객의 임신 사실 및 개월 수를 파악하고 임산부를 위한 할인쿠폰을 발생해 문제가 됐던 경우이다.
결국 비 식별화된 데이터도 수집, 분석의 과정을 거쳐 개인을 식별할 수 있는 자료화가 될 수 있다는 사례가 되는 것이다. 바로 이러한 문제가 익명화를 전제로 개정되는 신용정보법과 관련된 논란들이기도 하다.
또 다른 문제이자 핵심적인 문제는 우리나라 및 기업, 사회문화가 개인의 사생활과 관련된 정보의 비밀 유지에 대하여 빅데이터를 활용할 수 있을 만큼 충분히 성숙했냐는 것이다.
2년 전 사이버 검열과 관련하여 수사 기관의 정당한 법 집행이란 이유로 카카오톡이 감청을 허용해줬던 부분과 최근 카카오톡 URL 관련된 논란들이 바로 대표적인 사례다.
특히 2년전 카카오톡에서 국정원의 사이버 검열과 관련해 협조를 하면서 생겼던 논란은 텔레그램 사이버 망명이라는 슬프고도 안타까운 사회적 현상으로 이어졌다.
그리고 올해 테러방지법 통과 이후 또 다시 텔레그램 망명은 반복됐다. 이러한 기업의 모습은 빅데이터를 적극적으로 활용하면서도 개인의 프라이버시를 중요시 여겨 FBI의 협조를 거부한 애플의 모습과는 대조적이다.
최근 카카오톡 URL 사고의 경우에도 언론에서 논란이 시작되기 전에 카카오측은 전혀 심각하게 생각하지 않았을 정도였다고 한다.
최근 우리기업들은 미국의 사례를 들며 빅데이터를 활용할 수 있는 법적 규제의 완화를 외치고 있다. 그리고 실제 국가는 신용정보법의 개정을 통해 기업들이 말하는 규제를 풀어주려 하고 있다. 하지만 과연 아직도 이러한 논란 및 문제가 계속 반복되고 있는 우리나라 및 기업, 사회적인 문화가 개인의 프라이버시를 충분히 지켜주면서 미국과 같이 빅데이터를 활용하고 사용할 만큼 충분히 성숙했는지 되돌아 볼 필요가 있겠다.
저작권자 © Korea IT Times 무단전재 및 재배포 금지
키워드에 대한 정보 빅 데이터 장단점
다음은 Bing에서 빅 데이터 장단점 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.
이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!
사람들이 주제에 대해 자주 검색하는 키워드 빅 데이터 3분 요약
- 동영상
- 공유
- 카메라폰
- 동영상폰
- 무료
- 올리기
빅 #데이터 #3분 #요약
YouTube에서 빅 데이터 장단점 주제의 다른 동영상 보기
주제에 대한 기사를 시청해 주셔서 감사합니다 빅 데이터 3분 요약 | 빅 데이터 장단점, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.