당신은 주제를 찾고 있습니까 “빅 데이터 보안 – 빅데이터와 보안 : 빅데이터를 활용한 보안 사례“? 다음 카테고리의 웹사이트 ppa.maxfit.vn 에서 귀하의 모든 질문에 답변해 드립니다: https://ppa.maxfit.vn/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 송파런 이(가) 작성한 기사에는 조회수 324회 및 좋아요 7개 개의 좋아요가 있습니다.
빅 데이터 보안 주제에 대한 동영상 보기
여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!
d여기에서 빅데이터와 보안 : 빅데이터를 활용한 보안 사례 – 빅 데이터 보안 주제에 대한 세부정보를 참조하세요
[소개] 삼성SDS 기술사회의 분야별 IT 전문가가 설명해 주는 미래교육강의.4차 산업혁명과 최근 글로벌 정보화 트렌드 및 기술동향을 함께 배워보자.
빅데이터와 보안 : 빅데이터를 활용한 보안 사례
삼성SDS 조규백 기술사
빅 데이터 보안 주제에 대한 자세한 내용은 여기를 참조하세요.
빅 데이터 보안 기술 및 대응방안 연구 – Korea Science
빅 데이터 보안 기술 및 대응방안 연구. 김병철*. 극동대학교 유비쿼터스IT학과*. Big Data Security Technology and Response Study. Byung-chul Kim*.
Source: koreascience.kr
Date Published: 11/2/2021
View: 3242
빅데이터를 활용한 사이버 보안 기술 동향
빅데이터와 관련된 기본 분석 기술의 활용과 더불어. 보안 분야에 특화된 연관성 분석 방법론이 필요하며, 이. 를 지원할 수 있는 대용량 누적 데이터 저장 및 처리를.
Source: ettrends.etri.re.kr
Date Published: 1/19/2022
View: 3200
빅데이터를 활용한 보안기술
빅데이터를 활용한 보안기술 유현주 ([email protected]) 現 아이리포 기술사회, 정보관리기술사 사이버 위협에 대한 새로운 개념으로서 가트너 …
Source: dataonair.or.kr
Date Published: 12/24/2021
View: 81
[논문]빅데이터 보안 강화 및 활용 방안 – 한국과학기술정보연구원
현재 빅데이터의 기술은 데이터 추출과 이용에만 초점이 맞춰져 있어 보안에 취약한 시스템에 해킹시도가 있을 경우 개인과 기업에 막대한 피해가 발생될 수 있다. 따라서 …
Source: scienceon.kisti.re.kr
Date Published: 6/28/2021
View: 904
[기획특집] 보안, 빅데이터와 만나 더 단단해지다 … – 컴퓨터월드
이에 보안 업계는 빅데이터 분석을 통해 그 동안 활용하지 않던 데이터나 할 수 없었던 데이터들을 분석함으로써, APT 공격의 사전 징후를 찾아내고자 …
Source: www.comworld.co.kr
Date Published: 1/28/2022
View: 7296
빅데이터 시스템의 보안 위협 및 보안 요구사항 분석
빅데이터에 대한 관심이 폭증하면서 빅데이터 플랫폼 시장에서 사실상 표준으로 인식되는 하둡의 경우 보안 문제가 주요 이슈로 대두되고 있다. 아파치 커뮤니티의 오픈 …
Source: www.kci.go.kr
Date Published: 4/16/2021
View: 7757
빅데이터 분석 플랫폼, 데이터 보안의 시작은? – LG CNS
IDC 보고서에 따르면 세계 빅데이터 분석 시장의 성장세를 2020년까지 연평균(CAGR) 11.9%로 예상하며, 특히 클라우드 플랫폼을 통한 데이터 분석 환경 구축 및 전문 …
Source: www.lgcns.com
Date Published: 12/14/2021
View: 8280
주제와 관련된 이미지 빅 데이터 보안
주제와 관련된 더 많은 사진을 참조하십시오 빅데이터와 보안 : 빅데이터를 활용한 보안 사례. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.
주제에 대한 기사 평가 빅 데이터 보안
- Author: 송파런
- Views: 조회수 324회
- Likes: 좋아요 7개
- Date Published: 2021. 5. 11.
- Video Url link: https://www.youtube.com/watch?v=zUlzWLhWmZ8
빅데이터를 활용한 보안기술
빅데이터를 활용한 보안기술
유현주 ([email protected])
現 아이리포 기술사회, 정보관리기술사
사이버 위협에 대한 새로운 개념으로서 가트너 그룹이 정의한 시큐리티 인텔리전스(Security Intelligence)분야가 주요 대안으로 주목 받고 있으며, 그 기반 기술로 빅데이터 처리/분석기술들을 이용한 빅데이터 보안 기술이 활용하고 있다. 이는 APT공격과 같이 복합적이고 알려져 있지 않은 보안 위협을 사전 예측하고 방어하는데 초점을 맞추고 있으며 향후 사이버 방어기술의 핵심개념의 하나로 자리잡고 있다. 현재 사이버 위협의 대응 수준을 알아보고 시큐리티 인텔리전스 분야에 활용할 수 있는 주요한 빅데이터 보안 기술들이 어떤 것들이 있으며 이러한 보안기술들의 활용 사례들을 알아보고자 한다.
1, 사이버 위협 대응 수준의 현재
사이버 위협 대응기술의 수준을 4단계로 보았을 때, 현재의 대응기술 수준은 3단계 수준에 위치한다. 초기 단계에서는 오용탐지 기법을 중심으로 네트워크 경계보안이 집중되었으나, 최근에는 APT등 고도의 해킹공격 위협 증가함에 따라 패턴 기반의 공격이 아닌 시스템 프로세스, 이벤트, 네트워크 트랜잭션등의 관계성 분석을 통해 알려지지 않은 새로운 공격을 탐지하는 기술이 필요하다.
2. 빅데이터 보안의 필수 요소
고도의 복합적이고 알려지지 않은 새로운 사이버위협에 대응하기 위해서는 알고리즘, 심층 인텔리전스, 자동화등은 빅데이터 보안에서 필수요소라고 할 수 있다.
■ 준비된 알고리즘
높은 정확도를 위해 데이터 처리 능력, 커스텀 규칙(Custom Rule)을 혼합하여 기계학습, 행동이상 탐지 등의 알고리즘 이용한다. 또한, 알고리즘이 감염된 호스트, 네트워크 정찰, 자격 수확, C&C(Command & Control)통신의 지속적인 스트리밍의 패턴. 장후 파악을 위한 알고리즘이 필요하다.
■ 심층 인텔리전스
내 외부 네트워크에서 어떤 일이 일어나는지 대한 상황적 인식과 네트워크 자산, 구성, 취약점에 대한 지속적인 모니터링을 연계함으로써 인텔리전스 허브역할 수행한다.
■ 자동화
사람이 대응하기에 너무도 많은 위협과 취약점, 사건, 네트워크 패킷등이 존재한다. 지속적인 탐지와 비정규적인 공격에 대한 자동 감지 및 대응이 필요하다.
다음은 APT공격등과 같은 치명적인 사이버 위협 공격에 대응하기 위해서 주요 IT기반 시스템의 다양한 데이터, 보안 이벤트등의 연관성을 분석할 수 있는 주요한 빅데이터 보안 기술들이다.
3. 빅데이터를 활용한 보안 기술
가. 빅데이터 보안 데이터 수집/저장 기술
■ Streaming
인터넷에서 음성, 오디오, 비디오 데이터를 실시간으로 수집할 수 있는 기술
■ Log Aggregator
웹 서버 로그, 웹 로그, 트랜잭션 로그, 클릭로그, DB로그등 각종 데이터를 수집하는 오픈 소스 기술
■ RDB Aggregator
관계형 데이터베이스에서 정형데이터를 수집하여 하둡 분산 파일 시스템이나 HBase같은 NoSQL에 저장하는 오픈 소스 기술
■ 분산파일시스템
분산된 서버의 로컬 디스크에 파일을 저장하고 파일의 읽기, 쓰기등과 같은 연산을 운영체제가 아닌 API를 제공하여 처리하는 파일시스템
■ 인메모리 데이터 그리드
분산된 서버의 메인 메모리에 데이터를 저장하여 다수의 컴퓨터로 고속병렬처리 및 실시간 처리가 가능한 기술
나. 빅데이터 분석 기술
■ 연관성 규칙 학습 (Association Rule Learning)
대용량 데이터베이스 내의 다양한 변수로부터 흥미 있는 주제의 관련성 및 연관성을 찾는 기술로 잠재적 규칙을 만들어 내고 테스트하는 일련의 알고리즘으로 구성
■ 분류 ( Classification)
이미 분별된 데이터를 포함하는 학습데이터 세트를 기반으로 새로운 데이터가 속해있는 카테고리를 식별할 수 있는 기술
■ 군집화 ( Cluster Analysis)
유사성에 대한 특성이 사전에 알려져 있지 않은 상태에서 유사한 개체들의 작은 그룹으로 분할하기 위한 통계적 방법
■ 앙상블 학습 (Ensemble Learning)
기계 학습의 분류 방법을 통해 여러 개의 분류기를 생성하고 그것들의 예측을 결합함으로써 새로운 가설을 학습하는 방법
■ 유전 알고리즘 ( Genetic Algorithm)
자연 세계의 진화 과정에 기초한 계산 모델로써 최적화 문제를 해결하는 기법
■ 아웃라이어 판별(Outlier Discovery)
주어진 데이터에서 이상값(Outlier)을 찾아내어 전체에 영향을 주는 요소들을 제거하거나 이상값(Outliner)에 대한 원인을 분석하는 기술
■ 머신러닝
악성 행위의 식별을 위해서는 사용자의 행위 이벤트 간 연관성을 고려하여 해킹 행위 사이클에 따라 이상 행위를 찾아내고, 악성 행위로 식별하기 위해서는 정밀한 분석을 통한 적용 모델을 도출하기 위한 기법
■ 시각화 (Visualization)
데이터 분석의 결과를 표현하고 이해의 수준을 향상하기 위하여 이미지, 다이어그램, 애니메이션 등을 사용하는 기법 이러한 빅데이터 분석 요소기술들을 활용하여 실시간 모니터링, 행위 프로파일링, 다양한 위협과 공격패턴에 대한 지능적 분석등 사이버 위협에 대응하기 위한 보안 기술로 활용된다.
다. 프라이버시 보호 기술
빅데이터를 활용하여 보안분석 시 프라이버시 보호에 대한 방법도 같이 고민해야 한다. 개인정보 보호법등 법규나 정책등에 저촉되지 않도록 분석하고자 하는 데이터에 대한 보호 수준 및 알고리즘 선택등에 대한 고려가 필요하다.
■ PPDM (Privacy Preserving Data Mining)
프라이버시를 보호할 수 있도록 변환하거나 이를 보호할 수 있는 방법을 사용하여 데이터마이닝을 수행하고 그 결과를 도출하는 방법이다.
■ 마스킹, 암호화, 교정(redaction)을 통한 데이터 보호
데이터를 처리 및 분석하는 주체가 악의적인 경우 해당 개인정보는 쉽게 유출될 수 있다. 이를 방지하기 위해 익명화 과정을 거처 데이터에 존재하는 개인정보를 제거한 형태의 처리 및 분석과정이 필요하다. 또한, 순서보존 암호 및 연산보존 암호와 같은 암호화 기술등을 이용하여 빅데이터 보안 분석시 프라이버시 보호와 함께 유용한 정보를 도출할 수 있는 기술이 필요하다.
4. 빅데이터를 활용한 보안 모범사례
빅데이터에 숨겨진 통찰력을 발견하고 이를 활용하여 최근 사이버위협에 대응할 수 있는 주요 모범 사례는 살펴보자.
■ 자동화된 통합보안 정보 수집
위험 기반 보안 인텔리전스를 달성하고 사이버위협에 대한 보안 모니터링을 향상시키려면 가치 있는 정보를 저장하고 분석해야 한다. 이것은 단순한 로그 관리로 가능한 일이 아니며, 자동화된 수집, 통합 로그에서의 위협에 대한 Insight를 발견할 수 있어야 한다.
■ 빅데이터 분석을 통한 실행 가능한 통찰력의 실시간 제공
복잡한 공격을 더욱 확실하게 식별해야 하는 필요성이 증가함에 따라, 패턴 매칭 이상의 고급 분석이 필요하며, 복잡한 실시간 분석이 가능한 보안 플랫폼을 기반으로 위험 기반 분석 및 모델링을 구현한다.
■ 모니터링 및 차단
차단 가능한 위협과 불가능한 위협을 파악하고 가용 서비스, 데이터, 리소스를 활용할 수 있는 위협을 감지하는 모니터링기능을 갖춘다. 차단할 수 있는 위협은 방지하고 차단할 수 없는 위협은 모니터링한다. 모든 보안 관련 이벤트에서 context에 맞추며 분석을 수행하여 의심스럽거나 악의적인 활동을 탐지한다.
■ IT와 보안의 융합 통한 시너지 창조
보안과 IT 사이에는 뛰어난 이해와 협력이 필요하다. 보안과 IT가 적절한 단계로 융합되어 사이버 보안 위협에 대해 시너지 효과를 가져온다.
빅데이터를 활용한 사이버 보안을 위한 상용 보안 솔루션이 이미 활용되고 있으며, 데이터 및 보안 이벤트에 대한 응용 프로그램 콘텍스트 및 콘텐츠를 얻기 위해 DPI(DeepPacket Inspection) 기능을 수행, 이벤트 정보와 보안 정보를 수집하고 연관성 분석할 수 있는 통합보안관리 기능을 제공하고 있다.
요즘 이슈가 되고 있는 4차 산업혁명은 외부와 연결되지 않은 것들을 연결하게 되기 때문에 사이버 보안 취약점은 지금까지보다 더 취약한 환경이라고 할 수 있다. 4차 산업혁명 시대에는 사이버 보안의 고려가 필수적이고 사이버 보안이 선제되어야 한다. 선제적 보안강화의 한 방법으로 빅데이터 보안에 대한 통합적 보안 프레임워크를 통한 플랫폼 구축과 함께 사례 기반 업종별 빅데이터 연구를 통해 업종별 특성에 맞는 보안에 대한 고찰이 필요하다.
[ 참고 문헌 ]– 빅 데이터 보안 분야의 연구동향 분석 (정보화 정책 제23권)
– 빅 데이터 보안 분석의 정의와 요건 (IDG Tech Focus, joltsik)
– 빅 데이터 분석기술과 사이버 보안(TTA Journal Vol.153)
– 빅데이터를 활용한 사이버 보안 기술 동향 (ETRI)
– 빅데이터 환경에서 개인정보보호를 위한 기술(Internet & Security Focus 2013 3월호)
– 보안관제 기술동향 조사 및 차세대 보안관제 프레임워크 연구(정보보호학회지 제23권 2013)
– 빅데이터를 이용한 APT 공격 시도에 대한 효과적인 대응 방안(중소기업융합학회 논문지 2016)
– 새로운 기술패러다임으로서 빅데이터 : 쟁점과 과제 (과학기술정책)
– 빅 데이터를 이용한 선제적 사이버전 강화 방안 연구 (보안공학연구논문지, 강정호) – 데이터 스택의 위협 식별에 대한 보고서(McAfee)
출처 : 한국데이터진흥원
[논문]빅데이터 보안 강화 및 활용 방안
초록
최근 데이터의 양이 기하급수적으로 증가하면서 빅데이터가 이슈가 되어 많은 관심을 받고 있는 현실이다. 현재 빅데이터의 기술은 데이터 추출과 이용에만 초점이 맞춰져 있어 보안에 취약한 시스템에 해킹시도가 있을 경우 개인과 기업에 막대한 피해가 발생될 수 있다. 따라서 본 논문에서는 빅데이터 보안에 초점을 두어 외부로부터 피해를 방지하고 안전하게 빅데이터 서버를 운영하는 방법을 제시한다. 즉, Iptable을 이용한 IP나 포트 허용 여부를 지정하고 가상사설망(VPN)을 이용하여 외부 접속을 방지하며 패스워드 강화를 통해 빅데이터 서버의 보안 강화 및 활용 방안을 제시하였다.
[기획특집] 보안, 빅데이터와 만나 더 단단해지다
[컴퓨터월드] 알려지지 않은(Unknown) 공격으로 여겨지던 지능형 지속 위협(Advanced Persistent Threat, APT)도 이제는 많은 사람들이 인지하고 위험성을 느끼게 됐다. 하지만 공격 수법이 갈수록 지능화되고 고도화됨에 따라 APT 공격을 탐지하는 것 역시 점점 더 어려워지고 있다. 이에 보안 업계는 빅데이터 분석을 통해 그 동안 활용하지 않던 데이터나 할 수 없었던 데이터들을 분석함으로써, APT 공격의 사전 징후를 찾아내고자 노력하고 있다. 보안 분야에서 빅데이터 분석을 어떻게 활용하고 있는지 알아본다.빅데이터 분석으로 이상 징후 찾아내
최근 몇 년 간 IT업계 화두는 단연 빅데이터다. 빅데이터란 데이터의 생성이나 주기, 양, 형식 등이 매우 방대해져서 기존 방식으로는 수집이나 저장, 검색, 분석 등이 어려운 데이터를 의미한다. 특히 이전까지는 데이터로 취급하지 않았던 것들도 이제는 엄연한 데이터로 인정받게 되며 그 규모는 더더욱 커지고 있다. 무선 네트워크와 모바일 기기의 발달로 인해 SNS 등 개인들이 생성하는 데이터의 양도 급속도로 증가하면서 빅데이터는 더욱 빅(Big)해지고 있다.
빅데이터가 주목받고 있는 이유는 단순하다. 데이터 속에 필요한 것이 있기 때문이다. 많은 데이터를 모으고 분석을 통해 그 속에서 어떤 사회현상에 대한 어떤 법칙 등을 발견하고 통찰력(Insight)을 찾아서 그에 대응하는 조치를 취한다. 기업 입장에서는 문제를 해결하고 수익을 추구하는 쪽으로 이용하고 있다.
▲ 소니 픽쳐스는 지난해 APT 공격으로 개봉되지 않은 영화 자료들이 유출되는 사고를 겪었다
보안 업계도 빅데이터에 주목하고 있다. 지난해 발생한 소니 픽쳐스 해킹사고나 한수원 해킹사고처럼 APT 공격을 당할 경우 그 피해가 막대한 만큼, 사전에 APT 공격을 탐지하고 차단하고자 빅데이터 분석을 보안에 접목시키고 있기 때문이다.
보안 시장에는 보안 정보 이력 관리(Security Information Event Management, SIEM)나 기업보안관리(Enterprise Security Management, ESM) 등 각종 보안 솔루션들이 쏟아내는 정보들을 취합해 한 눈에 파악할 수 있도록 보여주는 제품들이 존재한다. 여기에 과거 데이터들과 실시간으로 취합되는 데이터들을 상관분석하게 되면 새로운 유의미한 결과가 나타나면서 미처 파악하지 못했던 이상 징후들도 감지할 수 있게 되는 것이다.
데이터 연관성 파악이 핵심
각종 보안 솔루션들이 쏟아내는 데이터는 이루 헤아릴 수 없을 정도다. 이 데이터들 하나하나가 갖는 의미도 중요하지만, 각 데이터들의 연관성을 파악하는 것이 특히 중요하다.
하나의 예를 들어보자. 어떤 기업의 관리자 아이디가 오후 1시에 서울에서 접속한 기록이 발생했다. 현재 이 정보만으로는 알 수 있는 내용이 한정돼 있다. 뒤이어 오후 1시 15분에 해당 관리자 아이디가 부산에서 접속한 기록이 발생했다. 역시 이 정보 하나만으로는 알 수 있는 내용이 한정돼 있지만, 앞선 정보와 조합하면 이상 징후를 발견할 수 있다. 오후 1시에 관리자 아이디가 서울에서 접속을 했는데, 불과 15분 만에 부산에서 같은 아이디로 접속한 기록이 남는 것을 확인할 수 있기 때문이다. 만약 서울에서 접속한 아이디가 정상적이라면 부산에서 접속한 아이디는 다른 누군가가 도용했다는 의미가 되므로, 보안 담당자는 즉시 해당 IP의 접속을 차단하는 조치를 취할 수 있다.
▲ 이상 징후가 빠르게 발견되면 보안 담당자는 신속하게 조치를 취할 수 있다
이처럼 복잡하지 않고 단순한 정보를 조합한 것만으로도 실제로 보안상 문제가 발생하는지 여부를 확인할 수 있다. 그러나 이는 수많은 데이터들 중 한 가지 사례에 불과한 것이므로, 실제 환경에서는 이보다 더 복잡하다. 때문에 사람이 수작업으로 모든 것을 할 수는 없다. 이 때 빅데이터 분석이 빛을 발하게 되는 것이다.
기존 보안 솔루션들은 대부분 알려진 패턴을 감지해내는 정적인 분석에 머물러 있다. 그러나 동적이고 다이내믹한 패턴의 감지와 분석을 위해서는 빠른 시간 내 대용량의 데이터를 수집하고 저장하는 기술이 필요하다. 일정한 데이터에 알려진 패턴이 있는지 여부만을 판단하는 것이 아니라, 다양한 데이터를 통합해 수집·분석을 해야 한다는 측면에서 빅데이터의 대용량(Volume)과 속도(Velocity) 성향이 환영 받고 있다.
업계에서는 향후 사물인터넷(Internet of Things, IoT) 시장이 확대되면 앞선 사례와 같은 현상들이 더 많이 등장할 것으로 예상하고 있다. 더 많은 데이터들이 생겨나면서 이에 대한 처리 요구 수요도 늘어날 것이며, 실제로 IoT 시대에 가장 중요하다고 여겨지는 것 중 하나가 보안이기 때문이다.
보안 업무 효율성 증대
각종 보안 솔루션들은 실시간으로 단일 경보를 발생한다. 각 보안 솔루션마다 각각의 경보를 발생하기 때문에, 그 경보들의 양도 상당수에 이른다. 그러나 실시간으로 발생되는 경보와 과거치 데이터의 통계, 그리고 과거 데이터들을 엮어서 다차원적으로 상관분석을 처리하게 되면 실제로 보지 않아도 되는 경보들을 줄여주고, 보안 관제 인력이 우선적으로 처리해야 하는 업무 순서도 제시해줄 수 있다.
가령 취약점 점검을 통해 이미 패치가 완료된 곳에 들어오는 공격이 있다면 각 보안 솔루션들은 그에 대한 경보를 발생시킬 것이지만, 상관분석이 이뤄지면 경보를 발생시키지 않을 것이다. 설령 경보가 발생하더라도 이미 대처가 된 사항이기에 급하게 처리할 문제는 아니게 된다. 그렇게 되면 보안 관제 인력은 해당 사안보다 다른 사안을 우선적으로 처리할 수 있다.
이는 결과적으로 보안 관제 인력의 수도 줄일 수 있게 된다는 것을 의미한다. 이전에는 각각 발생하는 경보를 처리하기 위해 10명이 필요했다고 한다면, 경보의 양도 줄어들었을 뿐만 아니라 일의 우선순위까지 배정해주기에 그보다 적은 인력으로도 운영이 가능하기 때문이다.
“보안 인력의 역량을 개발하라”
▲ 서종렬 블루코트코리아 상무 보안 영역은 솔루션을 너무 맹신하고 있는 것이 아닌가 하는 생각이 든다. 또 실제로 그런 경향이 보안 사고를 만들어가는 것 같다. 보안 사고에 대비하기 솔루션을 도입하지만 그것도 한계가 있다. 홀(취약점)은 계속 생기기 때문이다. 따라서 전반에 대해 점검해보고 왜 누수가 일어나는지 관리자가 알아야 한다. 빅데이터를 접목한 보안 솔루션들이 발전하고 있지만, 이를 얼마나 잘 활용하느냐는 결국 사람의 문제다. 솔루션들이 해주는 것은 한계가 있다. 솔루션들은 어디까지나 보완재일 뿐이며, 사람이 가진 경험이나 운용 능력까지 대체하기는 어렵다. 머신러닝이 아무리 잘 돌아간다 하더라도 인간이 개입할 수 있는 부분이 생길 수밖에 없는 것이다. 최종 판단은 결국 사람이 해야 하며, 이로 인해 적절한 판단을 내릴 수 있는 역량을 키워야 한다. 그렇게 역량을 키운 인력이 다른 보안 솔루션도 도입을 할 수 있다. 만약 잘 모르는데 도입한다면 툴에 종속될 수밖에 없다. 100% 완벽한 툴은 없다. 사람이 판단을 내려야 하는 부분이 왔을 때 대처할 수 있는 부분이 없다. 사람이 하는 단순 반복 작업들과 추론들은 솔루션이 대신하고, 사람이 가진 고유한 판단력과 추론능력은 것은 키워야 한다. 현재 국내 시장 자체가 기술 투자에 많은 비중을 두고 있는데, 기술이 발전하더라도 그 기술을 따라갈 수 있는 인간의 역량이 함께 개발되지 않으면 안 된다. 이것이 빅데이터 보안에 있어 선결 과제라고 본다. 기업들도 단순히 솔루션만 도입하기보다는 그것을 운용할 인력의 역량 개발을 어떻게 해나가야 할지 고민해야 한다.
국산 솔루션, 아직 갈 길 바빠
빅데이터 분석을 결합한 보안 시장 규모는 점차 커질 것으로 예상되고 있다. 전체적인 통합 관점에서 분석할 수 있는 부분들이 늘어나고 있기 때문이다. 고객들이 기존에 보유하고 있던 방화벽 등 보안 솔루션들이 만들어내는 로그들을 분석해 보안에 활용하려는 것도 그 중 일부로 볼 수 있다.
그러나 정작 시장이 넓어지는 만큼 국내 보안 기업들의 입지는 좁아지는 듯하다. 글로벌 기업들이 생태계를 갖춰 국내 시장에 진입하고 있기 때문이다. 이들은 이미 전 세계에 갖춰진 인프라를 통해 다양한 정보를 수집하고 있으며, 이들을 토대로 한 보안 솔루션을 경쟁력으로 내세우고 있다.
▲ 블루코트 보안 분석 플랫폼 어플라이언스
실제로 블루코트의 보안 분석 플랫폼(Security Analytics Platform, SAP)은 IBM, HP, 스플렁크(Splunk) 등의 SIEM 솔루션을 지원하면서 파이어아이(Fireeye)와 샌드박싱 기술 제휴를, 프리럿(Prelert)과 머신러닝 및 데이터분석을 위한 협력체계를 구축해 고객들에게 서비스를 제공하고 있다.
이를 통해 블루코트의 솔루션은 SIEM이나 통합로그와 연동돼 로그와 글로벌 DB분석, 네트워크 포렌식을 수행한다. 또한 시스템을 도입해 정보를 모아놨지만 분석을 할 수 없는 고객들을 위해 머신러닝 솔루션을 지원, 네트워크 포렌식을 통해 나타나는 다양한 징후들을 자동적으로 처리할 수 있도록 한다.
한 보안 업계 관계자는 “이런 글로벌 기업들과 경쟁하려면 충분한 인프라를 갖춰야 한다. 그러려면 기존 정부 규제 중심의 보안 환경을 넘어서 다양한 제휴나 협력 모델을 갖출 필요가 있다”고 조언했다. 아직까지는 글로벌 기업들이 좀 더 넓은 마켓과 경함을 갖고 있기 때문에 유리하지만, 그들과 협력 또는 상생하면서 기술력을 쌓을 수도 있기 때문이다.
“머신러닝으로 탐지능력 높일 수 있어”
▲ 남현우 이글루시큐리티 인터넷보안연구소장
APT 공격이 이슈가 됐던 것은 검출이 쉽지 않기 때문이다. 말 그대로 공격이 더 쉽다. 방어하는 입장에서는 시나리오를 연구하는 TF팀이 있다. 사이트에서 이슈가 발생하면 모여서 공격이 어떻게 들어오는지 등에 대한 시나리오를 짠다. 공격은 사이버 킬체인이라 불리는 과정을 통해서 이뤄진다. 각 단계 중 하나의 채널만 끊으면 공격을 막거나 피해를 최소화 시키는 것이 가능하다. 이를 위해 TF팀은 서버 로그나 네트워크 로그 등을 다 들여다보게 되는데, 이 때 머신러닝을 이용하면 보다 효율적으로 공격 징후를 탐지할 수 있다. 머신러닝은 정기적인 트래픽 양이 있다. 예를 들면 직원들이 아침에 출근하면 인터넷 트래픽이 늘어났다가 근무시간에 접어들면 줄어들고, 또 점심시간이 늘고 하는 것과 마찬가지다. 머신러닝의 트래픽도 전체적인 양은 늘어날 수 있지만 일정한 패턴들이 그려진다. 공격이 일어나는 시점을 보면 디도스(DDoS)와 같은 것은 눈에 띄지만, APT는 아주 조금씩 은밀하게 일어나다보니 일상의 정해진 패턴에서 빗나가는 것을 탐지할 수 있다. 실제 사람의 눈으로 보기에는 쉽지 않은 작은 징후들을 이처럼 머신러닝을 이용하면 찾아낼 수 있다.
솔루션 도입 시 ‘분석’ 능력 우선해야
최근 많은 기업과 관공서 등에서 적극적으로 빅데이터 기술을 도입하거나 검토하는 등 활발한 노력을 기울이고 있다. 초기에는 빅데이터 기술이 스몰데이터(Small Data) 시대의 기술과 어떤 차별성이 있느냐를 검토하다보니, 빅데이터의 핵심인 분석기술보다는 데이터의 수집, 저장, 검색에 따른 기능, 성능 및 비용측면에서만 접근했던 것이 사실이다.
업계 관계자는 “이제는 빅데이터의 본질인 데이터 안에 숨어있는 가치와 패턴을 발견해 내는 기술 그 자체에 좀 더 집중할 시기가 왔다. 수집성능, 저장성능 등은 솔루션별로 크게 차이가 없이 일반화 됐다고 해도 과언이 아니다. 어떤 솔루션이 더 분석을 잘하는지, 시각화를 통해 어떻게 다양한 분석의 토대를 갖추었는지 등이 중요하다. 더불어 우리조직의 상황에 맞게 구현될 수 있는가를 고심해야 한다”고 강조했다.
실제로 외국에 많은 레퍼런스가 있다고 하더라도, 단지 다른 조직에서 사용하던 패턴 룰을 전달해주는 경우도 있기 때문에, 분석에 초점을 맞춰 업무가 진행될 수 있도록 하는 솔루션을 고려해야 한다고 당부했다.
빅데이터 시스템의 보안 위협 및 보안 요구사항 분석
ICT 발전으로 스마트 기기가 대중화되고 다양한 유형의 데이터가 폭발적으로 생산되면서 이들 데이터를 수집, 분석, 활용하여 새로운 가치를 만들어내는 빅데이터가 주목받고 있다. 빅데이터에 대한 관심이 폭증하면서 빅데이터 플랫폼 시장에서 사실상 표준으로 인식되는 하둡의 경우 보안 문제가 주요 이슈로 대두되고 있다. 아파치 커뮤니티의 오픈소스 컴포넌트로 구성되어 자체적으로 보안 취약점을 내포하고 있기 때문이다. 본 연구에서는 오픈 소스를 기반으로 빅데이터를 저장 및 처리 분석할 수 있는 기술 인프라를 ‘빅데이터 시스템’이라 정의하고, 빅데이터 시스템 환경에서 발생할 수 있는 보안 위협을 분석한다. 빅데이터 시스템의 4 계층별로 보안 위협을 도출하고, 보안 위협을 기반으로 계층에 따른 보안 요구사항을 제시한다. 제안된 보안 요구사항은 빅데이터 시스템을 위한 보안 점검 솔루션을 개발할 수 있는 기초를 제공할 것으로 예상된다.
As ICT develops, smart devices become popular and various types of data are being explosively produced. As a result, Big Data, which creates new value by collecting, analyzing and utilizing this data, is regarded as a promising sector. At the same time, in the case of Hadoop, the industry standard in Big Data platforms, security problems became a significant issue because of the innate security vulnerabilities in the open source components structure of the Apache community. This paper defines “BigData system” as a technology infrastructure and analyzes the security threats founded in Bigdata system. This infrastructure can store, treat, and analyze BigData based on open sources. We present security threats in the four layers of BigData System and propose security requirements. The proposed security requirements are expected to provide a basis for the development of security vulnerability inspection system.
빅데이터 분석 플랫폼, 데이터 보안의 시작은? – LG CNS
IDC 보고서에 따르면 세계 빅데이터 분석 시장의 성장세를 2020년까지 연평균(CAGR) 11.9%로 예상하며, 특히 클라우드 플랫폼을 통한 데이터 분석 환경 구축 및 전문적인 분석 서비스의 요구와 관심이 높아지고 있다고 합니다.
l 세계 빅데이터 분석 시장의 성장세 (출처: IDC)
중요한 자산인 데이터 그 자체보다는 데이터를 통해 의미 있는 규칙과 인사이트(Insight)를 찾아내고 여기에 부가적인 가치를 창출하는 분석 기술과 분석 서비스가 요즘 더 많은 관심과 노력이 집중되고 있습니다.
데이터 수집 영역부터 기술의 발전으로 수집 속도는 점점 빨라지고, 수집되는 데이터 양도 크고 방대해지고 있습니다. 물론 그것에 비례해서 출처를 알 수 없거나 왜곡되고 저품질의 데이터뿐만 아니고 회사의 기밀정보, 고객의 개인정보 또한 늘어나고 있습니다.
빅데이터 분석 플랫폼의 데이터 보안은 수집 단에서부터 시작된다
그래서 직접 빅데이터 분석하거나, 분석 서비스를 의뢰하는 고객들의 가장 큰 고민거리가 데이터 유출 영역이며, 클라우드 기반의 빅데이터 분석 플랫폼인 경우 더 많은 우려와 걱정이 있는 것입니다. 이전 블로그에서 언급한 것처럼 APT 기반의 외부 공격과 내부 직원에 의한 유출이 또한 중요하게 생각될 수 있습니다.
어떻게 클라우드 플랫폼 기반에서 빅데이터를 수집 단계부터 폐기될 때까지 보호할 수 있을까요? 데이터 유출 방지는 수집 영역의 데이터 거버넌스로 시작해서 상호 연관된 일관된 정책을 적용할 수 있는 통합 관리 방안이 만들어져야 합니다.
● 데이터 거버넌스
다양한 채널과 디바이스를 통해서 대량의 데이터가 생성•연계되어 수집되기 때문에 데이터 사용자와 분석가는 어디에 어떤 데이터를 어떻게 활용할 것인가를 판단하고, 이 데이터를 처리하는 방법과 절차를 알아야 합니다.
데이터의 출처 및 근원 관리를 위해 빅데이터의 버전 관리, 기관 인증, 출처 추적, 생명주기 관리 등과 같은 데이터 신뢰성을 제고할 방법이 확보되고, 분산된 다중 사이트(데이터 레이크)의 메타 데이터가 상호 연동될 수 있어야 하고, 데이터 형식도 사전에 정의되어야 합니다.
데이터 거버넌스는 메타 데이터 관리로 시작됩니다.
메타 데이터(Meta Data)란?
데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터이다. 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다. 어떤 데이터 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말한다.
● 메타 데이터 관리
빅데이터의 효과적 분석을 위한 내•외부 데이터 간의 메타 데이터 관리가 가능해야 합니다. 비정형 데이터에 존재하는 마스터 데이터를 식별하고, 다양한 데이터 형식을 하나의 형식으로 변환하기 위해 일련의 통합 규칙과 논리적 연결고리를 유연하게 관리할 수 있도록 메타 데이터를 관리해야 합니다.
데이터 수집 및 통합 분석의 핵심 정보들은 싱글 뷰를 제공하기 위해 기준 정보 데이터 분류에 따른 식별자 속성을 정하고, 그 기준에 의해 다른 시스템에 분산된 정보와 융합해야 한다는 것입니다.
다시 말해 메타 데이터 관리를 통해서 기밀정보, 생명주기 관리, 개인정보, 민감정보 등 보안 및 보호가 필요한 속성에 대한 정책 및 관리 기준을 설정 관리할 수 있습니다.
빅데이터 플랫폼에 수집되는 데이터는 수집부터 폐기될 때까지 관리되고 모니터링되어야 합니다. 데이터 레이크는 또 다른 수집 영역의 이름이 될 수 있습니다.
데이터 레이크(Data Lake)란?
오픈소스 기반의 Business Intelligence 기업 펜타호(Pentaho)의 창립자이자 CTO인 제임스 딕슨(James Dixon)이 2014년 처음으로 사용한 용어로 정제되지 않은 다양한 형태의 데이터 저장소를 의미한다.
데이터 레이크의 주요 기능을 알아야 수집 영역에서 데이터 유출 보안을 위한 고려 사항을 찾아낼 수 있습니다.
빅데이터를 활용할 수 있도록 정제되지 않은 원천 데이터를 한 곳에 통합 저장해 인사이트를 도출해 내기 위해 생성된 개념으로 주요 기능은 다음과 같습니다.
가공되지 않은 상태의 다양한 비정형 형태 포맷의 데이터를 저장하고 가공할 수 있어야 합니다.
전통적인 기술로 처리하기 어려운 규모의 대용량 데이터를 저장•관리할 수 있어야 하며, 비용을 최소화할 수 있도록 클라우드 기반의 스토리지를 제공할 필요가 있습니다.
데이터 입력 및 활용을 위한 표준화된 인터페이스와 활용 대상 데이터의 메타 정보를 제공해야 분석가들의 활용도를 올릴 수 있습니다.
데이터를 찾고 가공할 수 있는 스크립트 언어 또는 SQL과 같은 도구가 필요합니다.
IoT 데이터가 중요한 데이터의 원천이므로 정적 데이터의 처리 이외에도 동적 스트리밍 데이터의 동적 분석이 가능해야 합니다.
여기에 데이터 처리 오케스트레이션(Orchestration) 기능 또한 필요합니다.
여기 언급된 주요 기능에 꼭 필요한 부분은 보안 관점에서 데이터 레이크에 저장된 데이터의 접근과 변경에 대한 사용자•분석가 관점의 보안 정책이 수립되고 적용되어야 합니다.
데이터 접근 통제하는 인증(Authentication)과 데이터 활용 권한을 통제하는 인가(Authorization) 기능 및 각종 데이터 관리 및 활용에 대한 감사(Audit) 기능이 필요합니다.
데이터 레이크 솔루션을 제공하는 기업 중에는 T 사는 최근 아파치 하둡(Apache Hadoop), 아파치 스파크(Aparch Spark), 아파치 나이파이(Apache Nifi)와 같은 최신 오픈소스를 기반으로 하는 데이터 레이크 관리 소프트웨어 플랫폼을 제공하고 있는데 관련 솔루션 적용 시 인증, 인가 및 감사 증적에 필요한 로그 기능 확인해 봐야 합니다.
수집 영역부터 법과 제도가 고려 되어야 한다
정부 관계 부처는 개인정보 비식별 조치 가이드라인(2016년)을 수립하였습니다. 현행 개인정보 보호 법령의 틀 내에서 빅데이터가 안전하게 활용될 수 있도록 하는데 필요한 개인정보의 비식별 조치 기준과 비식별 정보의 활용 범위 등을 제시했습니다.
l 개인정보 비식별 조치 가이드라인 (출처: 관련 부처 합동. 2016)
또한 금융권 클라우드 서비스 이용 가이드(2016년, 금융 보안원)에서도 금융 회사가 클라우드를 이용하려면 ‘비 중요 정보 처리 시스템’으로 지정하도록 하고, 비식별화 조치 가이드라인을 준수하여 비식별화한 경우 ‘비 중요 정보 처리 시스템’으로 지정 가능함을 명시하여 금융권에서도 클라우드를 통한 빅데이터 분석이 가능하게 되었습니다.
그래서 자사의 D 플랫폼에서 아래와 같은 비식별화 프로세스를 활용하고 있습니다.
l 비식별화 적용 절차
개인정보 비식별 처리에는 가명화와 익명화로 크게 구분할 수 있고, 가명화의 경우 추가적 정보를 활용하면 개인을 식별할 수 있어 식별 가능한 개인정보로 봐야 한다고 명시되어 있습니다. 여기서 지나친 비식별 기술을 적용할 경우 데이터 활용도가 떨어질 수 있습니다.
정부는 빅데이터 산업 육성을 위해 개인정보 비식별화 조치와 기술 안정성 확보에 속도를 내고 있으며, 특히, 규제 완화를 위해 가명 정보 활용이 가능하도록 입법화를 추진하고 있습니다.
결과적으로 현 국내법상으로 클라우드에서 개인정보를 분석할 수 있는 경우는 고객으로부터 명시적으로 동의를 받았거나 비식별화 조치를 수행되어야 많은 법적 이슈가 되지 않을 것으로 판단됩니다.
수집 영역부터 시작하는 데이터 보안을 위해서는 어떻게 해야 할까?
APT(Advanced Persistent Threat)와 같은 더 지능적인 해킹 방식이 증가하고 내부 사용자에 의한 정보 유출의 위협이 늘면서 단순히 네트워크 또는 시스템 레벨에서 차단하는 경계선 기반의 보안 솔루션 만으로는 100% 정보 유출을 막을 수 없습니다.
데이터 자체를 보호하는 데이터 암호화 적용과 로깅을 기본적인 사항이며, 빅데이터 활용의 특성상 여러 사람이 공유하고 이동하는 것을 효율적으로 관리하는 데는 일부 한계가 있어, 문서 보안 솔루션이라고 부른 DRM 기반 솔루션도 고려해 볼 수 있습니다.
또한 앞에서 언급되었던 개인정보 보호법 준수를 위한 개인정보 비식별화 적용 또는 향후 입법화되면 적용될 수 있는 가명화가 고려되어야 합니다.
실제로 데이터를 활용하는 환경에서 이런 ‘암호화, 로깅, DRM, 비식별화, 데이터 보안 솔루션을 어떻게 적용할 것인가?’와 ‘보안 정책과 생명주기에 따른 통합 관점에서의 보안’이 더 중요한 문제입니다.
l 한국데이터 진흥원 2017 데이터 산업 백서
정리를 해보면 다음과 같습니다.
분석가 및 사용자 환경의 물리적 접근 통제는 기본적으로 확보되어야 하며
어떤 중요한 데이터를 어떤 형태로 어느 곳에 보관하고 있는지를 관리할 수 있는 ‘데이터 거버넌스’를 수립하고 그 기반에 메타 데이터 관리 및 접근통제를 적용하고,
권한이 있는 여러 분석가가 공유하고 이동하면서도 보안정책과 생명 주기에 따는 암호화 및 DRM 등의 복합적인 보안 솔루션 적용이 필요하며
실제 이러한 데이터들의 사용 현황과 로그가 모니터링되고
다양한 시스템 로그들의 연관 관계를 분석해서 내부 데이터 유출의 리스크를 최소화 있도록 데이터 수집 영역에서부터 통합 관리해야 어떠한 보안 위협에서도 중요한 정보를 안전하게 보호할 수 있습니다.
빅데이터 플랫폼이 더욱 확대되기 위해서는 사용자의 쉬운 접근성 확보, 클라우드 기반 서비스 확대와 더불어 데이터 생명주기에 따른 데이터 보안을 확보하는 것이 필수적이라고 판단됩니다.
글 l LG CNS 보안컨설팅팀
키워드에 대한 정보 빅 데이터 보안
다음은 Bing에서 빅 데이터 보안 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.
이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!
사람들이 주제에 대해 자주 검색하는 키워드 빅데이터와 보안 : 빅데이터를 활용한 보안 사례
- 동영상
- 공유
- 카메라폰
- 동영상폰
- 무료
- 올리기
빅데이터와 #보안 #: #빅데이터를 #활용한 #보안 #사례
YouTube에서 빅 데이터 보안 주제의 다른 동영상 보기
주제에 대한 기사를 시청해 주셔서 감사합니다 빅데이터와 보안 : 빅데이터를 활용한 보안 사례 | 빅 데이터 보안, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.