추천 서비스 | 날씨 기반 옷 추천 서비스 상위 176개 베스트 답변

당신은 주제를 찾고 있습니까 “추천 서비스 – 날씨 기반 옷 추천 서비스“? 다음 카테고리의 웹사이트 ppa.maxfit.vn 에서 귀하의 모든 질문에 답변해 드립니다: https://ppa.maxfit.vn/blog/. 바로 아래에서 답을 찾을 수 있습니다. 작성자 Computer Science Dongduk Women’s University 이(가) 작성한 기사에는 조회수 74회 및 좋아요 없음 개의 좋아요가 있습니다.

추천 시스템(推薦system)은 정보 필터링 (IF) 기술의 일종으로, 특정 사용자가 관심을 가질만한 정보 (영화, 음악, 책, 뉴스, 이미지, 웹 페이지 등)를 추천하는 것이다. 추천 시스템에는 협업 필터링 기법을 주로 사용한다.

추천 서비스 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 날씨 기반 옷 추천 서비스 – 추천 서비스 주제에 대한 세부정보를 참조하세요

추천 서비스 주제에 대한 자세한 내용은 여기를 참조하세요.

데이터 기반 개인화 추천 (1/3): 트렌드와 기술편 | 뷰저블

개인화 추천 서비스라는 단어를 들어보신 적이 있으신가요? 아마 큐레이션(Curation) 서비스라고 하면 좀 더 익숙하실 것입니다. 원래 큐레이션이란 미술관이나 박물관 …

+ 자세한 내용은 여기를 클릭하십시오

Source: www.beusable.net

Date Published: 7/1/2021

View: 764

요즘 서비스들의 추천 UX, 정리해드림 – PUBLY

10분 안에 이런 걸 알려드려요! 토스, 쿠팡, 스포티파이… 요즘 서비스들은 이렇게 추천합니다; 추천 시스템의 유형별로 달라지는 사용자 경험과 UX 디테일 …

+ 더 읽기

Source: publy.co

Date Published: 11/2/2021

View: 4037

성공의 핵심 요소로 떠오른 ‘추천 시스템’, 비즈니스의 본질 먼저 …

추천 시스템의 목표는 ‘사용자 기록 정보, 거래 상세 정보, 상호작용 로그와 같은 사용 가능한 사용자의 인터넷 활용 정보와 제품 사양, 사용자 후기, 다른 제품과의 비교 …

+ 자세한 내용은 여기를 클릭하십시오

Source: dbr.donga.com

Date Published: 8/22/2022

View: 6805

초개인화 시대, AI를 활용한 맞춤 추천 서비스 – post.naver – 네이버

다양한 분야의 기업에서 활발히 활용하고 있는 ‘개인 맞춤형 추천 서비스’는 개개인의 소비 패턴을 파악해 분석하는 빅데이터 기술, 수집된 데이터를 …

+ 여기에 보기

Source: m.post.naver.com

Date Published: 8/9/2022

View: 7232

상품 추천 서비스 유형에 따른 소비자 반응 연구

추천 서비스 유형을 구. 분하는 명확한 기준은 없지만 흔히 자주 사용되며 대표. 적인 추천 시스템 기술이라 언급되어온 유형들은 협업. 필터링(Collaborative Filtering), …

+ 여기에 표시

Source: koreascience.or.kr

Date Published: 4/2/2022

View: 8254

[기고] 이커머스에서 추천 서비스 잘하기 (2) – 아이티데일리

그렇다면 추천 서비스를 잘하기 위해서는 어떻게 해야 할까? 모바일 홈쇼핑 포털 앱 ‘홈쇼핑모아’에서 추천 영역을 담당하며 경험한 내용을 공유한다. 글 …

+ 자세한 내용은 여기를 클릭하십시오

Source: www.itdaily.kr

Date Published: 2/15/2021

View: 6753

04화 추천 알고리즘, 내 취향을 어떻게 그렇게 잘 알아? – 브런치

그럼 이제 이 개념에서 파생된 추천 시스템을 소개해드리겠습니다. 협업 필터링(Collaborative Filtering, CF)이란? 집단지성의 힘 …

+ 여기에 보기

Source: brunch.co.kr

Date Published: 4/15/2021

View: 5968

‘최고의 광고추천 서비스’를 개발하는 카카오 광고추천팀을 소개 …

광고추천팀은 카카오 광고 비즈니스 중심에 있는 핵심적인 팀으로서 첨단 AD TECH 기술을 통해 ‘광고 서비스 관련 최적화 로직 개발 및 서빙 시스템 개발’ …

+ 여기에 보기

Source: tech.kakao.com

Date Published: 9/6/2022

View: 2592

주제와 관련된 이미지 추천 서비스

주제와 관련된 더 많은 사진을 참조하십시오 날씨 기반 옷 추천 서비스. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

날씨 기반 옷 추천 서비스
날씨 기반 옷 추천 서비스

주제에 대한 기사 평가 추천 서비스

  • Author: Computer Science Dongduk Women’s University
  • Views: 조회수 74회
  • Likes: 좋아요 없음
  • Date Published: 2018. 12. 24.
  • Video Url link: https://www.youtube.com/watch?v=vNQ3hlIBus4

위키백과, 우리 모두의 백과사전

추천 시스템(推薦system)은 정보 필터링 (IF) 기술의 일종으로, 특정 사용자가 관심을 가질만한 정보 (영화, 음악, 책, 뉴스, 이미지, 웹 페이지 등)를 추천하는 것이다. 추천 시스템에는 협업 필터링 기법을 주로 사용한다. 소셜 북마크 사이트에서 링크를 사람들에게 추천하고 무비렌즈 데이터 세트에서 영화를 추천하는 방법등이 이에 속한다.

개요 [ 편집 ]

추천 시스템은 일반적으로 Collaborative filtering 방식과 content-based filtering (personality-based approach라고도 불림) 방식을 통해 추천 목록을 만든다.

Collaborative 와 Content-based의 차이점은 Last.fm 과 Pandora Radio과 같은 유명한 음악 추천시스템에 의해 잘 보여진다.

Last.fm은 사용자가 주로 들어온 밴드와 각각의 음원이 무엇인지 관찰하고 다른 사용자와의 행동(behavior)을 비교하면서 추천된 음악의 “상태”를 만든다. 그 (추천 받을)사용자의 음악 목록에는 없지만 비슷한 취향을 가진 다른 사용자가 자주 들었던 음악을 추천해 준다.

Pandora는 비슷한 특성이 있는 음악을 재생하는 “상태”를 만들기 위해 아티스트 또는 음악의 특성을 사용한다(약 400개의 특성을 가진 부분집합으로). 사용자의 피드백은 사용자가 특정한 음악에 싫어요를 눌렀을 때 그 특정한 속성을 약화하고 좋아요를 누른 음악을 강조하면서, 그 상태의 결과를 다듬기 위해 사용된다.

각각의 시스템은 모두 강점과 약점이 있다. 위에 예에서는, Last.fm은 정확한 추천을 만들기 위해 한 사용자에 대한 많은 양의 정보를 필요로 한다. Pandora는 시작할 때 매우 적게 정보를 필요로 하는 반면에, 범위(scope)가 더 한정적이다.(예를 들어, 판도라는 오직 원래의 정보에서 비슷한 추천만 만들 수 있다.

추천 시스템은 검색 알고리즘의 유용한 대안이다. 왜냐하면 사용자가 찾지 못한 것들을 다른 방법으로 발견하게 해 주기 때문이다. 아주 흥미롭게도, 추천 시스템은 종종 non-traditional data를 묶으면서(indexing) 검색 엔진을 사용할 때 시행(implement)되기 때문이다.

접근법 [ 편집 ]

Collaborate filtering은 사용자 행동, 활동 또는 선호도에 대한 많은 정보를 분석하고 모으고 다른 사용자와의 비슷함에 기초를 두고 사용자들이 무엇을 좋아할 지를 예측하는 것에 기초를 두고 있다. Collaborative Filtering 접근법의 한 중요한 장점은 machine analyzable content에 의존하고 있지 않다는 것이다. 그래서 정확하게 아이템 그 자체를 이해하지 않고도 영화와 같은 복잡한 아이템들을 추천 할 수 있다. 많은 알고리즘은 추천 시스템에서 사용자나 아이템의 비슷함(similarity)을 측정하는 데 사용되고 있다. 예를 들어, KNN[1]과 Pearson correlation이 있다.

KNN

분류할 때, 분류 대상과 가까운 k개를 뽑아 그 중 가장 많은 비율을 차지 한 쪽으로 분류

Pearson correlation

연속형 두 변수간의 선형관계(관련성)를 구하기 위해 사용된다. -1에서 +1사이의 범위값

Collaborate filtering은 과거에 동의한 사람들이 미래에도 동의하고 그들이 그들이 과거에 좋아했던 것들을 좋아할 것이라는 가정에 기초를 두고 있다.

사용자의 행동으로부터 모델을 만들 때, 특징(차이점)은 종종 data collection의 뚜렷하기도하고 암시적이도한 형태 사이에서 만들어진다.

Explicit data collection의 예

사용자에게 item을 평가하게 하기, 검색하게 하기, 가장 선호하는 것과 가장 덜 선호하는 것을 순위매기게 하기 등

implicit data collection의 예

사용자가 본 item을 관찰하고 분석하기, 사용자가 구매한 item을 기록하기, 사용자의 SNS를 분석하고 비슷한 likes와 dislikes를 찾아내기

이 추천 시스템은 모아진 데이터를 다른 사람들로부터 모아진 비슷하고 안비슷한 데이터와 비교하고, 사용자의 추천된 items 목록을 계산한다.

Linkedin, facebook과 같은 SNS는 collaboprative filtering을 친구 추천 등에 사용한다.

Content-based filtering [ 편집 ]

또 다른 잘 알려진 접근법은 content-based filtering이다. 이는 item에 대한 설명(description)과 사용자 선호에 대한 profile을 기반으로 한다.

Content-based 추천 시스템에서, 키워드는 item을 설명(describe)하는데 사용되고 사용자의 프로필은 이 사용자가 좋아하는 류(type)의 item을 가리키게(indicate) 만들어진다. 다른 말로하면, 이런 알고리즘들은 과거에 사용자가 좋아했던 것들(또는 현재 보고 있는 것들)과 비슷한 items을 추천하려고 한다. 구체적으로 말하면, 다양한 후보 items은 사용자에 의해 현재 평가되는 (rated) items과 비교되고 best-matching items은 추천된다. 이 접근법은 information retrieval과 information filtering에 뿌리를 두고 있다.

Information retrieval

집합적 정보로부터 원하는 내용이나 관련되는 내용을 가져오는 것

Information filtering

필요 없는 정보를 제거하는 것

Items의 특징을 끌어내기 위해, tf-idf 알고리즘이 많이 사용된다.

Tf-idf: Term frequency-inverse document frequency

여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다.

TF(term-frequency 단어 빈도)가 높을 수록 문서에서 중요하다고 생각될 수도 있지만 단순히 흔하게 등장하는 것일 수도 있음. 이를 DF(document frequency 문서 빈도)라고 하며, 이 값의 역수를 IDF(inverse)라고 한다. TF-IDF는 TF와 IDF를 곲한 값이다.

사용자의 profile을 만들기 위해서, 그 시스템은 대게 두가지 정보에 집중한다:

1. 사용자의 선호의 model

2. 추천시스템과 사용자의 상호작용 정보(history)

기본적으로 이런 방법들은 시스템 안에서 item에 특성을 부여하면서 item profile(이산적 features와 attributes)을 사용한다. 그 시스템은 item특성의 weighted vector을 기반으로 한 사용자의 content-based profile을 만든다. Weights는 사용자에게 각각의 feature의 중요도를 나타내고 개별적으로 점수 매겨진(rated) content vectors로부터 다양한 방법으로 계산될 수 있다. 사용자가 좋아할것 같은 확률(probability)을 계산하기 위해 다른 복잡한 방법들해 베이지안 분류, 클러스터 분석, 결정 트리 그리고 인공 신경망 네트워크와 같은 머신러닝 기술을 사용하는 반면에, 간단한 접근법들은 그 점수 매겨진 item vector의 평균 값을 사용한다.

보통 ‘좋아요’와 ‘싫어요’와 같은 형태로 사용자로부터 직접적인 피드백은 특정한 속성(attribute)의 중요도에 대한더 높거나 낮은 weight를 할당하는데 사용될 수 있다.

Content-based filtering의 중요한 문제점은, 한 content source에 관련된 사용자들 행동으로부터 사용자 선호도를 배울 수 있고 다른 content 종류(type)을 넘어서 그것들을 사용할 수 있을지 아닌지이다. 그 시스템이 사용자가 이미 사용한 것과 같은 종류의 content를 추천하는 것에 한정돼 있을 때, 다른 서비스의 다른 종류의 content가 추천될 수 있을 때보다 추천 시스템의 가치는 상당히 낮다. 예를 들어, news browsing에 기반한 추천 뉴스 기사는 유용하지만, news browsing에 기반해 추천될 수 있는 다른 서비스의 음악, 비디오, 제품 토론에서 더 유용하다.

Pandora Radio는 첫 seed와 같이 사용자에 의해 제공된 노래와 비슷한 특징의 음악을 재생해 주는 content-based 추천 시스템의 한 예이다.

Hybrid recommender systems [ 편집 ]

최근 연구는 collaborate 과 content-based filtering을 섞은 hybrid 접근 법이 몇몇의 상황에서 더 효과적일 수 있다고 설명한다. Hybrid 접근법은 여러가지 방법으로 사용(implement)될 수 있다: 한 접근 법을 다른 접근법에 더하거나, 하나의 model로 만들거나. 몇몇의 연구들은 두가지 접근법을 hybrid와 경험에 기인해서 비교하고 hybrid가 두 접근법들보다 훨씬 더 정확한 추천을 제공한다고 말한다. 이런 방법들은 cold start와 sparsity 문제와 같은 추천시스템에서 공통적인 문제의 몇몇을 극복할 수 있다고 한다.

Cold start: 충분한 정보가 없어서 필요한 정보를 얻지 못하는 것

Netflix는 hybrid 추천 시스템의 좋은 예이다. 이 웹사이트는 사용자가 높게 평가했던(content-based)영화와 비슷한 특성을 띄는 영화를 추천 하고, 비슷한 사용자(collaborate)들의 검색 습관과 시청을 비교함으로서 추천을 한다.

다양한 기술들은 추천시스템의 기초로 제안되어 왔다: collaborative, content-based, knowledge-based 그리고 demographic 기술. 이 기술들은, 몇개의 평가(rating)을 한 새로운 사용자를 어떻게 하지와 같이 collaborative와 content-based의 유명한 cold-start문제와 knowledge-based 접근 법의 the knowledge engineering bottleneck(병목현상)과 같은 단점을 가지고 있다. Hybrid 추천 시스템은 그들 사이의 시너지를 얻기 위해서 여러 기술들을 합치는 것이다

Collaborative 이 시스템은 다른 사용자들과 items에 대한 profiles을 평가하는 정보만 사용하면서 추천을 한다. 이 시스템은 현재의 사용자나 items과 비슷한 평가 기록(history)와 함께 비슷한(peer) 사용자 또는 items을 배치하고, 이 근접이웃(neighborhood)를 이요해서 추천을 만든다. 사용자 기반과 item기반의 가장 가까운 이웃 알고리즘은 cold-start문제를 해결하기 위해 합쳐질 수 있고 추천 결과를 향상시킬 수 있다. Content-based 이 시스템은 사용자가 그들에게 준 평가와 제품들과 관련된 특징이라는 두가지 Sources로부터 추천을 만든다. Content-based 추천자는 추천을 user-specific 분류 문제처럼 다루고 제품의 특징에 기반한 사용자의 좋아요와 싫어요의 분류자를 학습한다. Demographic Demographic(인구 통계학적) 추천은 사용자의 인구통계학적 정보(profile)를 기반으로 추천을 제공한다. 추천된 제품은 그 영역의 사용자들의 평가들을 합침으로써 다른 인구통계학적 영역을 위해 만들어질 수 있다. Knowledge-based 이 추천자는 사용자의 선호와 요구(needs)에 대한 추론을 기반으로 한 제품을 제안한다. 이 지식(knowledge)는 때때로 얼마나 특정한 제품 특징이 사용자의 요구를 충족시키는 지에 대한 뚜렷한 기능적(functional) 지식을 포함한다.

Hybrid 추천 시스템이란 용어는 여기서 결과를 만들어 내기 위해 다중의 추천 기술을 함께 섞는 어떠한 추천 시스템을 설명하는데 사용된다. 같은 유형의 몇몇의 다른 기술들이 함께 되지(be hybridzed) 못하는지에 대한 이유는 없다. 예를 들어, 두개의 다른 content-based 추천은 함께 효과를 낼 수 있고 많은 프로젝트들이 이런 종류의 조합에 투자해 왔다: naïve bayes와 knn을 함께 사용한 NewsDude는 한 예다. 7개의 hybridization 기술들:

1. Weighted: 다른 추천 요소들의 점수는 수학적으로 합쳐진다.

2. Switching: 그 시스템은 추천 요소들 안에서 선택하고 고른 것을 적용한다.

3. Mixed: 다른 추천자로부터의 추천들은 추천을 주기위해 함께 보여진다.

4. Feature Combination: 다른 지식 sources로부터 나온 특징들은 함께 합쳐지고 하나의 추천 알고리즘에 쓰인다.

5. Feature Augmentation: 하나의 추천 기술은 하나의 특징이나 다음 기술의 입력의 한 부분이 될 특징들의 세트에 사용된다.

6. Cascade: 추천자는 더 낮은 우선 순위들이 더 높은 것들의 점수를 매기는 것이 단절되면서 엄격한 우선순위를 가진다.

7. Meta-level: 한 추천 기술은 적용되고 다음 기술의 입력으로 사용되는 몇몇의 model을 만든다.

정확도를 넘어서 [ 편집 ]

전형적으로, 추천 시스템에 대한 연구는 가장 정확한 추천 알고리즘을 찾는 것에 관심을 둔다. 하지만, 많은 중요한 요소들이 있다.

Diversity – 사용자들은 다른 아티스트이 items와 같은 더 높은 intra-list 다양성이 있을 때 추천 시스템에 더 만족하는 경향을 보인다.

Recommender persistence – 어떤 상황에서, 추천을 다시 보여주거나 사용자가 다시 items을 평가하게 하는 것이 더 효과적이다.

Privacy – 추천 시스템은 대게 privacy 문제를 해결해야한다. 왜냐하면 사용자들은 민감한 정보를 공개해야하기 때문이다. Collaborative filtering을 사용해 사용자의 profiles을 만드는 것은 privacy의 관점에서 문제가 될 수 있다. 많은 유럽 국가들은 data privacy에 대한 강한 문화를 가지고 있고, 사용자의 profile을 만드는 어떠한 단계를 소개하려는 모든 시도는 부정적인 사용자 반응을 초래할 수 있다. Netflix Prize competition을 위해 Netflix에서 제공한 데이터 셋에 관련해서 많은 privacy 문제가 발생했었다. 그 데이터 셋이 고객의 개인정보를 지키기 위해 익명화 됐음에도 불구하고, 2007에 텍사스 대학의 두 연구자는 Internet Movie Database에 영화 평가 데이터 셋을 매칭함으로써 사용자 개개인을 식별할 수 있었다. 결과적으로, 2009년 12월, 한 익명의 Netflix사용자는 Netflix를 고소했다. 이건 2010의 두번째 Netflix Prize competition을 취소하는 데 부분적으로 영향을 끼쳤다. 많은 연구들은 이 영역의 진행중인 개인정보문제를 행하고 있다. Ramakrishnan 은 개인화와 정보보호 사이에서 교환의 확장적인 개요에 대해 행동했고, 다른 데이터 소스(sources)와 약한 연결들(우연히 발견한 추천을 제공하는 예상치 못한 연결)의 조합이 익명화된 데이터 셋에서 사용자의 정체를 발견하는데 사용될 수 있다는 것을 찾았다.

User demographics- Beel 은 사용자 인구학이 얼마나 사용자가 추천에 만족해 하는 지에 대해 영향을 줄지도 모른다는 것을 발견했다. 그들의 연구에서, 그들은 나이가 많은 사용자들이 어린 사용자들보다 추천에 더 관심을 보이는 경향이 있다는 것을 증명했다.

Robustness – 사용자가 추천 시스템에 참여할 수 있을 때, 속이는 문제(the issue of fraud)는 반드시 다뤄진다.

Serendipity – Serendipity(우연히 발생, 발견됨)는 얼마나 추천시스템이 놀라운가에 대한 측정이다. 예를 들어, 마트에서 고객에게 우유를 추천하는 한 추천 시스템은 완벽하게 정확 할지라도, 이건 좋은 추천 시스템이 아니다. 왜냐하면 그 고객이 살 품목이 너무 명백하기 때문이다. 하지만, 뜻밖의 serendipity는 정확도에 부정적인 영향을 줄지도 모른다.

Trust – 추천 시스템은 사용자가 시스템을 신뢰하지 않으면 사용자에게 가치가 없다. 신뢰는 어떻게 추천을 만들어 내는 지와 왜 이 item을 추천 했는지를 설명함으로써 쌓을 수 있다.

Labelling – 추천 시스템에 대한 사용자의 만족은 추천의 labeling(그룹 짓기, 이름 짓기)에 따라 영향을 받을지도 모른다. 예를 들어, 한 인용된 연구에서, sponsored로 묶인 추천에 대한 Click Through Rate(CTR)은 Organic으로 묶인 동일한 추천에 대한 CTR보다 낮다. 그 연구에서 Label이 없는 추천이 가장 좋은 성능을 보였다.

데이터 기반 개인화 추천 (1/3): 트렌드와 기술편

안녕하세요 뷰저블입니다. 개인화 추천 서비스라는 단어를 들어보신 적이 있으신가요? 아마 큐레이션(Curation) 서비스라고 하면 좀 더 익숙하실 것입니다. 원래 큐레이션이란 미술관이나 박물관에서 큐레이터라 불리우는 전시기획자들이 우수한 작품들을 선별하여 주제를 정하여 전시를 하는 행위를 의미하였습니다. 지금은 모든 분야에서 콘텐츠를 선별하고 조합하여 의미를 부여하고, 새로운 가치를 창출하는 행위를 말합니다.

한걸음 더 나아가 인터넷 서비스 상에서의 ‘개인화 추천(=큐레이션)’은, 넘쳐나는 정보의 홍수 속에서 고객의 관심사에 맞게 정보를 맞춤형으로 편집하여 제공하는 것을 의미합니다. 정보의 양이 증가하는 속도가 엄청나게 빨라졌으며 PC에서 모바일로 디바이스가 작아지며 큐레이션은 ‘중요한 것’을 넘어 ‘필수적인 것’이 되었습니다.

뷰저블은 e-커머스 서비스의 ‘개인화 추천’에 대해 크게 마케팅과 UX적인 관점으로 나누어 살펴보려고 합니다. 어떻게 사용자 경험을 큐레이션하고 개인화하였을까요? 마케팅 메시지를 또한 어떻게 개인화하여 소구할까요? 이번 공유드리는 글은 단순히 e-커머스에만 통용되지는 않으며 다양한 도메인에도 적용해볼 수 있을 것입니다.

타깃 세그먼트 기반 큐레이션 서비스가 제공되었던 초기단계

서비스가 성공하기 위해서는, 여타 기사에 종종 언급되는 전시들이 그러하였듯 기획자의 역량이 가장 중요했습니다. 똑똑한 기획자가 양질의 콘텐츠를 엄선하여 모든 사람들에게 제공하였죠. 헌데 시간이 지나며 ‘고객 중심 마인드’가 자리잡았고 자연스럽게 콘텐츠들이 고객 중심으로 ‘구분(=세그먼트화)’되기 시작하였습니다. 그 결과는 어떠했을까요?

뉴스를 예로 들어보겠습니다. 이전에는 포탈 뉴스를 에디터라 불리우는 전문가가 중요 보도자료를 선별한 뒤 메인에 노출시키는 프로세스로 구성되었습니다. 에디터의 권력이 매우 막강하였죠. 포탈이 메인에 언론사들의 뉴스를 노출시켜주지 않으면 아무리 훌륭하고 공들인 기사라 할지라도 큰 관심을 받을 수 없었습니다.

[사용자의 관심사에 따라 다르게 제공되는 콘텐츠 노출]

이런 서비스가 고객 중심이라는 흐름을 타고, 고객이 직접 선택한 관심사별, 언론사별로 우선 노출하는 방식으로 변화합니다. 제가 A라는 신문사의 ‘스포츠’, ‘경제’를 선택하였다면 두 카테고리 관련 기사가 메인에 가장 먼저 노출될 것입니다. 사용자의 관심사에 따라 같은 콘텐츠라도 다르게 보여지는 것이죠. 유투브 같은 동영상 서비스라면요? 내가 ‘동물’ 카테고리를 선택하였다면 당연히 동물 관련 동영상 콘텐츠가 상위 노출될 것입니다.

고객이 직접 선택하는 데이터에 기반하여 큐레이션하는 형태 외에도 CRM 차원에서 보통 회원가입 단계에서 성별이나 결혼 유무, 생일 등의 추가 개인 정보를 받아 세그먼트를 구분하기도 합니다. 이러한 데이터에 기반하여 e-커머스 서비스들은 20대의 미혼 여성에게 화장품이나 의류 상품을 메인에 노출한다면, 20대 남성에게는 면도기와 남성용 향수를 노출하였죠. 반려동물 카테고리를 보유한 서비스라면 고양이를 키우는지 새를 키우는지를 선택하게 하고 관련 상품들을 추천하였습니다.

세그먼트를 넘어 ‘초개인화 큐레이션 시대’가 도래한 현재

현재는 어떠한가요? 넷플릭스나 유투브를 떠올려보세요. 나도 모르게 내가 원하는 콘텐츠를 추천받아 무심코 재생을 해본 적 있지 않으신가요? 동물의 귀여운 모습을 좋아하는 저에게는, 똑똑한 유투브가 종종 놀랍게도 ‘귀여운 동물 모음’ 영상들을 추천해주곤 합니다.

e-커머스 사이트에서 내가 계획하지 않았던 물건을 사보신 경험 없으신가요? 저는 너무나 많습니다. 편안한 러닝화를 즐겨 신는 저에게 무심코 나이키 러닝화가 추천 상품으로 노출되어 클릭한 경험도 있습니다. 몇 일 뒤에는 구매까지 하였습니다. 위에서 언급한 것처럼, 이전에는 특정 세그먼트별로 나누어 고객에게 해당 타깃 세그먼트에 맞는 서비스나 제품을 제안하는 경우가 많았습니다. 허나 지금은 개인의 구매 이력과 취향에 기반하여 엄선된 제품을 제안하고 ‘초(趠)고객 경험’을 실현중입니다.

[고객 개인의 취향과 선호에 기반하여 영상 콘텐츠를 제공하는 넷플릭스]

e-커머스 서비스에서 제공하는 기본적인 상품 추천 기술

e-커머스 서비스들은 어떻게 이렇게 초개인화 서비스를 제공할 수 있는 것일까요? 고객의 행동 이력이나 고객과 고객간의 관계, 상품과 상품간의 유사도, 고객의 콘텍스트(Context)에 기반하여 고객의 관심 상품을 자동으로 예측하고 제공하는 추천 알고리즘을 활용합니다.

개인화 추천 알고리즘에 앞서, 개인화되지 않은 추천 방식 또한 존재합니다. 개인화되지 않은 추천 방식(Non-Personalized Recommender)의 대표적인 예로는 ‘현재 많이 구매되는 상품’이 있습니다. 개인화 추천 모델링을 위한 데이터가 부족할 때 가장 기본적으로 활용할 수 있습니다.

1) 나와 비슷한 성향의 사용자가 좋아하는 상품을 나에게도 추천해주는 협업 필터링

협업 필터링(CF, Collaborative Filtering)이란 대규모 고객 행동 데이터를 분석하여 나와 비슷한 성향을 지닌 고객들이 선호하는 상품 또는 콘텐츠를 추천해주는 기술입니다. 일반적으로 ‘이 상품을 구매한 사용자가 구매했던 상품들’을 제안하는 추천 서비스를 떠올릴 수 있습니다. ‘불닭볶음면’을 구입한 고객이 ‘스트링 치즈’를 구매한 경우가 많았다면, 다른 ‘불닭볶음면’을 구입하려는 고객에게 ‘스트링 치즈’를 함께 추천할 수 있습니다. 이렇게 상품과 상품간의 관계 외에도 고객과 고객간의 관계, 고객과 아이템간의 유사도에 기반하여서도 추천할 수 있습니다.

2) 콘텐츠의 특성과 고객 프로파일 비교를 통해 선호 콘텐츠를 제공하는, 콘텐츠 기반 필터링

콘텐츠 기반 필터링(Content Based Filtering)이란, 위에서 말한 협업 필터링보다 좀 더 진보적인 기술로써 콘텐츠를 추천하기 위해 해당 콘텐츠 자체를 분석하여 유사한 콘텐츠를 추천합니다. 콘텐츠 기반 필터링을 실현하기 위해서는 콘텐츠 자체를 분석한 프로파일과 고객의 선호도를 추출한 프로파일 두 정보간의 유사성을 분석해야 합니다.

[해리포터와 신비한동물사전 영화 이미지. 출처: https://nghood1.tistory.com/245]

평소 해리포터 시리즈를 좋아하는 저는 제가 자주가는 동영상 서비스에서 해리포터 관련 영상에 자주 Like를 누르고 구매 이력 또한 많습니다. 해리포터라는 영화가 판타지, 역사, 영국이라는 특징을 보유하고 있다면 서비스는 저에게 같은 특징을 보유하고 있는 ‘신비한 동물사전’이나 ‘나니아연대기’ 등을 추천할 수 있습니다. 보통 멜론 같은 음악 서비스에서 이런 개인화 추천 방식을 활용하여 음악의 비트, 장르 등을 분석하고 추천 기능을 제공합니다.

3) 고객 행동에 기반하여 점수를 메기는 단순 룰 베이스 방식의 추천

고객이 본 상품 상세 페이지, 장바구니에 담았던 상품들의 이력을 추천하여 단순히 1점씩 매기고 점수가 높은 순으로 추천을 하는 룰 베이스 방식의 추천 기법도 있습니다. 과거 1~2개월 데이터를 분석하고 점수화하면 추천할만한 상품들을 발굴할 수 있을 것입니다. 예를 들어볼까요?

고객A가 과거 2개월 동안 e-커머스 서비스 안에서 취한 행동

수박 : 상세 페이지 클릭 10번, 장바구니 담기 2회 – 총 12점

딸기 : 상세 페이지 클릭 9번, 장바구니 담기 4회 – 총 13점

연어 : 상세 페이지 클릭 3번, 장바구니 담기 5번 – 총 8점

팽이버섯 : 상세 페이지 클릭 2번, 장바구니 담기 7번 – 총 9점

[딸기 – 수박 – 팽이버섯 – 연어] 순으로 점수가 높습니다. 이러한 상품들이 한 고객당 수십 개가 된다면 점수가 가장 높은 3개 정도의 상품들을 메인, 자주구매 GNB, 장바구니 등 다양한 곳에서 추천할 수 있을 것입니다. 이 외에도 협력 필터링, 상품명간의 유사도를 분석하여 추천하는 등 다양한 추천 알고리즘들이 존재하지만 오늘은 짧게 위 3가지만을 설명드리겠습니다.

[Tip] 개인화 추천 서비스가 얼마나 잘 개인화 되었는지는 어떻게 평가할까요? 추천 결과를 평가하는 방법은 알고리즘 자체의 성능을 평가하는 방식과 고객의 반응을 체류시간이나 상품 자체의 장바구니 추가 수, 상세 보기 클릭 수 등으로 측정하는 방식들이 있습니다. 일반적인 머신러닝에서 Accuracy, Precision, Recall, F1-score 등을 활용하고 있습니다.

초개인화 속에서 기획자가 놓치지 말아야 할 가장 중요한 자세, ‘제공 정보의 균형’

위에서 말한 다양한 추천 알고리즘들은 현존하는 대다수 온라인 서비스들에게 적용되고 있습니다. 허나 말 그대로 필터링하여 보여주기 때문에 내 관심사가 아닌 정보라면 놓치곤 합니다. 만약 제가 A커머스에서 화장품만 구매한다면, 계속해서 알고리즘은 저에게 화장품만을 추천해주겠죠. A커머스에서 양질의 도서 상품이나 의류를 판매하더라도 저는 그러한 상품 정보들을 접할 기회가 적을 것입니다.

이렇게 정보가 양극화되는 현상, 고객의 입맛 외의 정보가 숨겨지는 현상을 필터 버블(Filter Bubble)이라 합니다. 이렇게 정보가 양극화되지 않도록 기획자는 어떤 콘텍스트에서 추천 알고리즘을 활용할 것인지, 강도를 얼마나 조정할 것인지 고민할 수 있어야 합니다. 고객의 생활과 정서를 좌우하는 막중한 책임이 있기 때문이죠.

오늘은 e-커머스 서비스들의 개인화 추천 서비스 트렌드와 기본적인 알고리즘에 대해 다루었습니다. 다음 글은 ‘마케팅’ 관점에서 어떻게 개인화 추천 서비스들이 이뤄지고 있는지를 공유드릴 예정인데요, 여러분이 기다리시는 뷰저블의 다양한 데이터를 예제로 들어 설명드리겠습니다. 다음 글도 기대해 주세요. 뷰저블이었습니다!

참고 자료: https://www.samsungsemiconstory.com/2265, http://www.kocca.kr/insight/vol05/vol05_04.pdf

[기고] 이커머스에서 추천 서비스 잘하기 (2)

박현규 버즈니 PM

[아이티데일리]이커머스에서 좋은 추천이란 무엇일까? 무엇보다 고객이 만족하는 쇼핑을 할 수 있도록 돕는 것이다. 그렇다면 추천 서비스를 잘하기 위해서는 어떻게 해야 할까? 모바일 홈쇼핑 포털 앱 ‘홈쇼핑모아’에서 추천 영역을 담당하며 경험한 내용을 공유한다. 글은 두편으로 구성됐다.

[1편] (지난호)

1. 이커머스 추천 서비스 이해하기

2. 어떻게 잘 만들 수 있을까?

[2편] (이번호)

3. 푼 문제들 (서비스 예시)

4. 앞으로 더 잘해야하는 것들 (필요한)

3. 푼 문제들(서비스 예시)

3.1. 홈영역 개인화 콘텐츠

[개요]

모든 서비스에서 가장 중요한 화면은 홈이다. 서비스에 진입한 유저의 니즈와 홈에서 전달하는 가치가 잘 맞아야 좋은 서비스의 시작이라 할 수 있다. 때문에 홈에서 제공하는 서비스와 서비스의 구조는 그 어떤 영역보다 중요하다.

많은 모바일 앱서비스의 홈 구조는 아래와 같다. 순서의 차이는 있겠지만, 대부분 홈의 첫 영역은 서비스에서 가장 강조하는 기능이며, 밑으로 갈수록 롱테일을 저격할 수 있는 콘텐츠를 제공하는 방식이다.

모바일 앱서비스의 홈 구성

다른 이커머스와 다르게 모바일 홈쇼핑 포털 앱 ‘홈쇼핑모아’에서는 특성상 ‘시간’이라는 정보가 존재하며, 편성표 등의 서비스를 통해 홈쇼핑사의 편성 정보를 제공하고 있다. 홈쇼핑모아는 현재 편성표가 서비스의 홈 역할을 하고 있으며, 방송에 예정된 상품의 편성표를 탐색하는 고객도 굉장히 많다.

‘홈쇼핑모아’ 홈 영역 : 18개 홈쇼핑사 편성표

편성표의 첫 화면은 현재 방송중인 18개 홈쇼핑 및 T커머스의 현재 방송하고 있는 생방송 리스트다. 이는 홈쇼핑모아 서비스의 가장 중요한 부분이며, 고객에게 가장 강조하고 싶은 기능이자 고객의 가장 큰 요구이기도 한다.

아래로 스크롤을 하면, 앞으로 방송이 예정된 상품이 시간순으로 리스팅 돼 있다. 홈의 하단 영역은 고객의 능동적인 선택(스크롤)에 의해 노출이 되는 영역이기에 첫 화면보다 광고, 콘텐츠 등의 배치가 더 많은 영역이다.

홈쇼핑모아는 방송 예정 상품을 탐색하는 고객들에게 방송 예정 상품 사이사이에 콘텐츠를 제공하고 있다. 콘텐츠는 기획전, 이벤트, 개인화 추천, 인기 검색어 등이 있으며 배너, 캐로셀, 리스트 방식으로 노출하고 있다.

‘홈쇼핑모아’ 편성표 콘텐츠

[문제 인식]

기존 개인화 추천 콘텐츠는 카테고리로 그룹핑해 서비스를 제공했다. 예를 들어, 패션에 대한 유저의 니즈가 있다고 판단되면 패션 관련된 상품만 추천을 해줬다. 때문에 특정 카테고리에 니즈가 없다고 판단된 고객의 경우에는 다른 카테고리 추천이 안되고 있는 상황이었다.

[문제 정의]

방송 예정 상품을 탐색하는 고객에게 카테고리 구분없이 가장 관심가질만한 추천을 제공하는 것.

[실험 설계]

기존을 포함해 3그룹으로 나눠 a/b 테스트를 진행했다. 기존 추천 서비스였던 카테고리 기반의 추천에서, 카테고리를 구분하지 않고 유저가 가장 관심을 가질 만 한 상품을 실시간에 가깝게 추천해주는 서비스로 2가지 추천 모델을 만들었다.

a/b 테스트 요약

b, c 그룹은 a그룹과 비교하면 서비스 레벨에서 컨셉 자체가 다른 서비스이며, b그룹과 c그룹은 서비스 레벨의 컨셉은 같으나 알고리즘이 다른 것이다. 또한 세 그룹 모두 한 번만 노출되는 것이 아니라, 방송 예정 상품 사이사이에 최대 14번의 다른 추천 결과가 노출된다(a그룹의 경우 다른 카테고리).

[실험 결과]

여러 가지 지표를 비교했지만, 대표적인 지표로는 클릭률(ctr)과 구매버튼 전환율(cr)이 있다. 실험 결과 상품 클릭률(ctr)은 a그룹 대비 b그룹은 약 25%, c그룹은 약 80% 이상의 상승을 보였으며, 구매버튼 전환율(cr)은 a그룹 대비 b그룹은 약 10%, c그룹은 약 5%의 상승을 보였다.

◆ 상품 클릭률(CTR) : c > b > a

◆ 구매버튼 전환율(CR) : b > c > a

[서비스 출시]

클릭률이 좋은 c그룹(WMF 모델)과 구매버튼 전환율이 좋은 b그룹(Session based 모델) 중 어느 모델을 서비스로 출시해야할지 고민이었다.

그런데 데이터를 더 깊숙히 들여다보니, 새로운 사실들이 보였다. 노출되는 개인화 추천 콘텐츠(최대 14개)를 노출되는 순서별로 클릭률(ctr)과 구매버튼 전환율(cr)을 보니 가장 먼저 추천되는(랭킹 스코어가 가장 높은) 콘텐츠의 경우 b그룹(Session based 모델)의 클릭률(ctr)과 구매버튼 전환율(cr) 수치가 훨씬 높았다.

반면, 전체 14개의 개인화 추천 콘텐츠의 평균 클릭률(ctr)은 c그룹(Session based 모델)이 b그룹(WMF 모델)에 비해 훨씬 높았다.

이는 위 두 모델의 특징을 이해한다면, 결과가 납득이 된다. 위에서 언급했듯이, b그룹의 Session based 모델은 고객의 액션에서 ‘순서(Sequence)’가 중요하게 반영된 모델이다. 따라서 추천되는 결과의 랭킹에 고객 액션의 최신성이 반영된 결과라고 할 수 있다.

반면, c그룹(WMF 모델)의 경우 순서와 관계없이 유저의 전체 액션을 바탕으로 한 글로벌한 추천 결과다. 즉, 추천 결과의 상위 상품들은 Session based 모델의 반응이 좋고, 전체 결과에 대해선 WMF 모델의 반응이 좋았던 것이다.

이러한 분석 결과를 바탕으로 고객에게는 전부 ‘나를 위한 실시간 추천’이라는 이유로 추천 콘텐츠를 제공하지만, 가장 첫번째 노출되는 콘텐츠는 b그룹에서 테스트한 Session based 모델을, 나머지 13개의 콘텐츠는 c그룹에서 테스트한 WMF 모델을 적용했다.

그 결과 기존 카테고리 기반의 추천 대비 클릭률(ctr)은 최대 158%, 구매버튼 전환율(cr)은 최대 47% 까지 상승했다.

[디벨롭할 포인트]

다음 단계로 콘텐츠 간 순서 자체도 개인화를 준비하고 있다. 기획전, 이벤트, 개인화 추천, 인기검색어 등 모든 고객에게 같은 순서대로 보여주는 것이 아니라, 고객 한 사람 한 사람 니즈에 맞게 콘텐츠 순서도 개인화해 제공할 예정이다.

4. 앞으로 더 잘해야하는 것들

추천 서비스를 잘 하기 위해선 머신러닝 모델을 잘 만드는 것을 넘어, 다양한 직군간의 협업이 필요하다. 그 외에 잘하기 위한 요소들은 상당히 많겠지만, 그 중 현재 홈쇼핑모아에서 더 잘해야할 부분을 중심으로 얘기하겠다.

4.1. 측정 지표를 고도화 해야 한다.

이커머스에서 제공하는 추천 서비스의 궁극적인 목표는 매출 상승이다. 일시적인 상승이 아닌 지속적인 성장이 중요하다. 이러한 점을 감안할 때 추천 서비스의 평가는 쉽지 않다. 추천 서비스로 제공된 아이템만이 데이터로 드러나기 때문에, 추천 서비스의 평가는 장기간에 걸쳐 이뤄져야 한다.

그렇다고 서비스를 출시하고 많은 데이터가 쌓일 때까지 가만히 있을 수는 없다. 첫 출시 후 추천 서비스의 최종적인 목표와 같은 방향이 되는 short-term 지표와 지속적으로 고객에게 좋은 가치를 전달해 비즈니스에 도움이 되는 long term 지표가 함께 필요하다.

대표적인 short term 지표는 클릭률(ctr)이다. 추천한 아이템이 노출대비 클릭을 얼마나 많이 받았냐를 알 수 있는 지표로 성과를 도출하기에 쉽게 적용할 수 있는 지표다. 클릭률(ctr) 지표는(완전히 일치하진 않지만) 추천 시스템의 정확도 수치와 비례한다. 즉, 보통 정확도가 높으면 클릭률이 높다. 그러나 단순히 추천 결과의 정확도만을 목표로 설정하는 것도 문제가 있다.

예를 들어, 특정 유저가 패션 카테고리를 보고 주로 구매하며, 가끔 화장품을 구매한다고 가정하자. 정확도, 즉 클릭률만을 목표로 추천 시스템을 만들었을 때, 해당 추천 시스템은 패션 카테고리만 추천해줄 것이며 장기적으로 고객의 만족도는 떨어질 것이다.

궁극적인 목표에 도달하기 위해선, short term 지표와 long term 지표를 같이 활용해야 한다. 각 지표는 동시에 만족시킬 수 없는, trade-off의 관계지만 장기적으로 좋은 추천 서비스를 하기 위해선 반드시 함께 필요하다. 예를 들어, 얼마나 다양한 카테고리를 커버하는지, 새로운 신상품은 얼마나 등장하는지 등의 지표가 있다.

4.2. 유연한 실험 환경은 필수다.

‘새로운 모델을 테스트를 해보니 정확도가 90%가 넘었어요.’ 새로 나온 모델을 우리 서비스에 맞게 커스터마이징해 오프라인 테스트를 해본 결과를 팀내에 공유한다. ‘이게 유저에게 어떻게 더 나은 가치를 전달하는거죠?’ 라고 누군가가 되묻는다. ‘그게 아니라 제가 만든 모델의 정확도가 90%를 넘었다니까요!’ 다시 한 번 되묻는다. ‘네, 그건 알겠고 그래서 이게 유저에게 어떻게 더 나은 가치를 전달한다는 거죠?’

추천 시스템 평가는 2가지 방식이 있다. 서비스 배포전 자체적으로 실험을 하는 오프라인 테스트와 일부 유저의 반응을 보기 위한 온라인 테스트다.

◆ 오프라인 테스트 : 사전에 정답지를 만들어 놓고, 만든 추천 모델이 알마만큼 정답을 맞추는지 테스트하는 방식. 실제 사용자에게 제공해서 반응을 보진 않음.

◆ 온라인 테스트 : (일부) 유저에게 실제 서비스를 제공하여 그 반응을 보고 지표를 측정하여 테스트하는 방식.

추천 시스템은 다른 머신러닝과 다르게 모델의 퍼포먼스가 반드시 서비스의 좋은 퍼포먼스를 보장하지 않는다. 즉, 오프라인 테스트 후 실제 유저의 반응을 보는 것(온라인 테스트)이 필수적이다(물론 오프라인 테스트와 온라인 테스트의 간극을 줄이는 노력은 필요하다). 그렇기 때문에 추천서비스를 도입하는 많은 회사들이 대부분 a/b 테스트를 통해 검증한다.

더 많은 고객에게 테스트를 할 수록 더 정확한 평가가 가능하지만, 서비스에 끼치는 영향도도 커지므로 위험성도 커진다. 그렇기에 위험성을 최소화하면서 유저의 반응을 쌓아나가기 위해서는 처음 소수의 유저에게 보여주고, 더 큰 확신이 들 때 유저의 숫자를 늘려나가는 방법이 일반적이다.

이렇게 오프라인/온라인 테스트는 추천 서비스를 출시하기 전 필수 과정이다. 그렇기 위해선 자동화되고 쉬운 오프라인/온라인 테스트 환경 구축은 필수요소이며, 이 환경이 갖춰지지 않아 병목이 생겼을 때는 좋은 추천 서비스를 만드는데 큰 장애물이 된다.

4.3. 함께 만들어야 한다.

대표적으로 추천 서비스를 잘 하고 있는 아마존이다. 또한 이커머스는 아니지만 넷플릭스, 유튜브, 스포티파이 등 성공적인 여러 추천 서비스들이 있다. 이 서비스들이 성공한 이유에 대한 공통점은 쉽게 찾기 어렵다. 이는 서비스를 사용하는 고객, 전달하는 가치, 비즈니스 모델 등이 다르기 때문에 특정 서비스에서 성공한 추천 시스템이 다른 서비스에서 좋은 추천 서비스를 보장하지 않는다는 것이다.

즉, 단순히 추천을 연구한 머신러닝 전문가가 모든 것을 해결할 수는 없다. 좋은 추천 서비스를 만들기 위해선 비즈니스, 디자인, 엔지니어링, 과학을 담당하는 구성원들이 함께 만들어가야 한다. 추천 서비스는 결국 비즈니스다. 궁극적으로 매출을 확대해야 하기 때문에 비즈니스에선 어떤 기준으로 추천 시스템을 평가할지 고민해야 한다.

추천 시스템은 데이터로부터 시작한다. 그러나 고객은 자신의 취향과 니즈에 대한 정보를 쉽게 내주지 않아 디자인은 어떻게하면 데이터를 잘 모을 수 있을지 UI/UX적으로 서비스에 잘 녹여내야 한다. 수많은 유저와 아이템을 고객에게 제공해야 하는 엔지니어는 실제 서비스를 할 수 있는 요구사항을 구현하는 방안에 대해서 고민해야 한다.

마지막으로 과학의 경우는 서비스의 맥락에서 고객의 아이템에 대한 호감도를 예측하는 문제를 잘 풀어야 한다. 어떻게 모델을 만들어 실험을 설계할 것이며, 그 호감도를 수치화하고 예측할 수 있을지가 중요하다.

앞으로 더욱 고객의 니즈는 세분화되고 다양해질 것이며 정보의 양은 계속해서 증가할 것이다. 즉, 풀어야할 문제는 갈수록 복잡하고 어려워지기 때문에 다양한 직군이 함께 추천 서비스를 만들어가야 성공의 가능성을 높일 수 있다.

04화 추천 알고리즘, 내 취향을 어떻게 그렇게 잘 알아?

평범한 다수가 똑똑한 소수보다 낫다.

여러분은 이 말에 동의하시나요?

제임스 서로위키(James Surowiecki)는 『Wisdom of Crowds』라는 책에서 우수한 한 명의 직감보다는 평범한 여러 명의 직감의 조합이 더 우수한 결과를 만든다는 이야기를 합니다.

이에 대한 다양한 의견이 존재할 듯합니다. 하지만 이번 콘텐츠만큼은 열린 마음으로 읽어주시기 바랍니다. 오늘의 주제인 ‘집단지성’의 개념과, 여기서 파생된 추천 알고리즘을 잘 이해하기 위함입니다.

위의 명제를 무비판적으로 수용하지는 않되, 크게 의심할 필요 또한 없을 것 같습니다. 추천 알고리즘이 이미 많은 분야에서 활용 중이라는 점이 그 정확성을 꽤나 증명하고 있으니 말입니다.

집단지성(Collective Intelligence)이란?

다수의 개체들이 서로 협력함으로써 얻게 되거나 더욱 배가되는

집단적인 지적 능력

이 용어는 1910년대 하버드 대학 교수이자 곤충학자인 윌리엄 모턴 휠러가 개미의 사회적 행동을 관찰하면서 처음 사용되었습니다. 개체로는 미미한 개미가 공동체로서 협업하여 거대한 개미집을 만들어내는 과정은 집단이 개인보다 높은 지능 체계를 형성함을 잘 설명합니다. 새, 물고기 떼 등의 움직임 또한 개체 하나의 지적 능력을 넘어 집단지성을 이루고 더 큰 힘을 발휘함을 보여주는 사례입니다.

[그림 1] 개체로는 미미한 새들이 대형을 이뤄 날아가는 모습은 집단지성을 잘 보여준다.

인간사회에서 역시 집단지성의 사례를 어렵지 않게 찾을 수 있습니다. 집단지성은 인터넷이 대중화되면서 많은 사용자들의 정보 교환이 수월해짐에 따라 더욱 조명받았습니다.

대표적인 사례로 오픈 백과사전인 위키피디아를 꼽을 수 있습니다. 지난 한 해동안 세계에서 다섯 번째로 가장 많은 방문자들이 찾은 사이트에 등극할 정도로 저명한 인터넷 백과사전입니다. 위키피디아는 오늘날 전 세계 295개의 언어로, 약 4천3백3십만 개 이상의 문서를 보유하고 있습니다. 25만여 명의 개인 편집 참여자가 끊임없이 토론하고 편집한 지식정보의 집약체라고 할 수 있습니다.

[그림 2] 인간사회에서의 집단지성을 보여주는 위키피디아

집단지성의 개념을 이해하셨나요?

그럼 이제 이 개념에서 파생된 추천 시스템을 소개해드리겠습니다.

협업 필터링(Collaborative Filtering, CF)이란?

집단지성의 힘을 빌려보겠습니다. 위키피디아는 협업 필터링을 다음과 같이 정의하고 있습니다.

많은 사용자들로부터 얻은 기호 정보에 따라

사용자들의 관심사들을 자동적으로 예측하게 해주는 방법

가장 일반적인 예로, 온라인 쇼핑몰에서 ‘이 상품을 구매한 사용자가 구매한 다른 상품들’이란 카테고리로 추천 상품을 보여주는 서비스를 들 수 있습니다.

협업 필터링의 포인트는 ‘많은 사용자들’로부터 얻은 기호 정보입니다. 사용자들의 행동이 축적되어감에 따라 추천 결과의 정확도가 더욱 높아지기 때문입니다. 여기서 말하는 ‘사용자의 기호 정보’가 집단지성에서의 ‘다수의 개체’가 되는 것이죠. 축적된 사용자의 기호를 기반으로 추천 시스템을 가동한다면 더 만족스러운 결과를 도출할 수 있다는 점에서 집단지성의 개념과 일맥상통합니다.

협업 필터링의 유형으로는 아래 두 가지가 있습니다.

1) 사용자 기반 추천 (User-based Recommendation)

나와 비슷한 성향을 지닌 사용자를 기반으로, 그 사람이 구매한 상품을 추천하는 방식입니다.

예를 들어 한 사용자가 온라인 몰에서 피자와 샐러드, 그리고 콜라를 함께 구매하고, 또 다른 사용자는 피자와 샐러드를 구매했다고 가정해보겠습니다. 알고리즘은 구매 목록이 겹치는 이 둘을 유사하다고 인식하고, 두 번째 사용자에게 콜라를 추천합니다.

SNS에서의 ‘친구 추천’ 서비스 또한 같은 추천방식입니다. 내가 친구로 맺은 사람을 나와 비슷한 성향으로 인식하고 친구의 또 다른 친구들을 나에게도 추천하는 알고리즘입니다.

사용자 기반 추천은 아래와 같이 도식화할 수 있습니다.

[그림 3] 사용자 기반 추천 도식화

2) 아이템 기반 추천 (Item-based Recommendation)

내가 이전에 구매했던 아이템을 기반으로, 그 상품과 유사한 다른 상품을 추천하는 방식입니다.

상품 간 유사도는 함께 구매되는 경우의 빈도를 분석하여 측정합니다. 예를 들어 콜라와 사이다가 함께 구매되는 경우가 많다면 콜라를 구매한 사용자에게 사이다를 추천하는 것입니다.

아이템 기반 추천은 아래와 같이 도식화할 수 있습니다.

[그림 4] 아이템 기반 추천 도식화

협업 필터링 방식의 한계

언뜻 생각해보면 두 가지 방식 모두 사용자의 취향을 파악하기 위한 합리적인 방법입니다.

그러나 협업 필터링에는 아래와 같은 몇 가지 단점이 있습니다.

1) 콜드 스타트(Cold Start)

협업 필터링 알고리즘을 사용하기 위해 필수적인 요소를 눈치채셨나요? 바로 기존 데이터입니다.

사용자 기반 추천방식만으로는 아무런 행동이 기록되지 않은 신규 사용자에게 어떠한 아이템도 추천할 수 없을 것입니다. 아이템 기반 추천방식에서도, 새로운 아이템이 출시되더라도 이를 추천할 수 있는 정보가 쌓일 때까지 추천이 어려워지겠죠.

콜드 스타트란 이러한 상황을 일컫는 말입니다. ‘새로 시작할 때의 곤란함’ 정도로 해석할 수 있습니다. 시스템이 아직 충분한 정보를 모으지 못한 사용자에 대한 추론을 이끌어낼 수 없는 문제입니다.

2) 계산 효율 저하

또 다른 문제점은 추천의 효율성이 떨어진다는 점입니다. 협업 필터링은 계산량이 비교적 많은 알고리즘이기 때문에, 사용자가 많아질수록 계산이 몇 시간에서 길게는 며칠까지 걸리는 경우도 종종 발생합니다.

사용자가 일정 수준 이상이어야 정확한 결과를 낼 수 있는 반면 시간이 더욱 많이 걸리게 된다는 점은 협업 필터링 알고리즘의 문제점이자 딜레마입니다.

3) 롱테일(Long Tail)

롱테일은 파레토 법칙(전체 결과의 80%가 전체 원인의 20%에서 일어나는 현상)을 그래프로 나타내었을 때 꼬리처럼 긴 부분을 형성하는 80%의 부분을 일컫는 말입니다. 이 현상을 협업 필터링에 적용하면, 사용자들이 관심을 많이 보이는 소수의 콘텐츠가 전체 추천 콘텐츠로 보이는 비율이 높은 ‘비대칭적 쏠림 현상’이 발생한다는 의미입니다.

아이템이나 콘텐츠의 수가 많다고 하더라도 사용자들은 소수의 인기 있는 항목에만 관심을 보이기 마련입니다. 따라서 사용자들의 관심이 저조한 항목은 정보가 부족하여 추천되지 못하는 문제점이 발생할 수 있습니다.

미디어 시장의 롱테일을 그래프로 나타내면 다음과 같습니다.

[그림 5] 미디어 시장 콘텐츠의 롱테일 현상 그래프

인간의 집단지성은 협업 필터링의 한계 극복을 위해 ‘콘텐츠 기반 필터링’ 방식을 고안해내었습니다.

콘텐츠 기반 필터링(Contents-based Filtering)이란?

콘텐츠 기반 필터링은 말 그대로 콘텐츠에 대한 분석을 기반으로 추천하는 방식입니다.

영화 콘텐츠의 경우라면 스토리나 등장인물을, 상품이라면 상세 페이지의 상품 설명을 분석합니다.

콘텐츠 기반 필터링의 장점은 많은 양의 사용자 행동 정보가 필요하지 않아 콜드 스타트 문제점이 없다는 것입니다. 아이템과 사용자 간의 행동을 분석하는 것이 아니라 콘텐츠 자체를 분석하기 때문입니다.

그렇다면 콘텐츠는 어떻게 분석되고 분류될까요?

이 작업은 기계가 할 수도, 사람이 할 수 도 있습니다.

한 예로 넷플릭스에 올라오는 콘텐츠의 분류 방식을 들 수 있습니다. 지난번 개인화 마케팅 콘텐츠에서 추천 시스템을 성공적으로 활용했던 넷플릭스의 사례에 대해 잠깐 언급하기도 했었는데요. 넷플릭스에 올라오는 콘텐츠는 50명의 태거(Tagger)에 의해 분류됩니다. 이들의 역할은 콘텐츠를 면밀하게 보고 여기에 태그를 다는 것입니다. 태거 덕분에 넷플릭스는 사용자에게 더욱 정교한 추천을 할 수 있습니다. 사람이 단 태그를 바탕으로 콘텐츠를 5만 종으로 나눠 정리하기 때문입니다.

인터넷 신문사에서는 주로 이 업무를 기계가 실행합니다. 이때 사용되는 기술이 텍스트 마이닝 기술입니다.

매일같이 BTS 기사를 찾아보는 가상의 팬 B양이 있다고 가정해보겠습니다. 신문사는 텍스트 마이닝으로 B양이 읽는 기사 텍스트를 분석하고, 이와 관련 있는 또 다른 BTS 기사를 B양에게 추천합니다.

그렇다면 콘텐츠 기반 필터링의 문제점은 없을까요?

물론 이 방법에도 문제점이 존재합니다. 가장 큰 문제로 꼽히는 것은 ‘메타 정보의 한정성’입니다. 상품의 프로파일을 모두 함축하는 데에 한계가 있다는 점입니다.

쉬운 설명을 위해 BTS의 또 다른 팬 T군이 있다고 가정해보겠습니다. T군은 BTS 중에서도 특히 정국이라는 멤버를 좋아하여, 그와 관련 있는 신문 기사를 주로 찾아보았습니다.

하지만 기사 내용만으로 콘텐츠를 분류해야 하는 신문사 알고리즘 입장에서는, T군의 성향을 세부적으로 파악하기가 어렵습니다. BTS 전체의 기사 텍스트와 BTS 중 한 명의 멤버에 대한 기사 텍스트에서 큰 차이가 없기 때문입니다. 여기서 콘텐츠 기반 필터링의 정밀성이 떨어지는 문제가 발생합니다.

최신 알고리즘에 대하여

앞서 말씀드린 두 가지 방식의 한계 때문에, 최근에는 새로운 방식의 추천 시스템이 개발되고 있습니다. 그중 각광받는 아래 두 가지 최신 알고리즘을 소개해 드리고자 합니다.

1) 하이브리드 추천 시스템 (Hybrid Recommender Systems)

하이브리드 추천 시스템은 협업 필터링과 콘텐츠 기반 필터링을 조합하여 상호 보완적으로 개발된 알고리즘입니다. 협업 필터링의 콜드 스타트 문제 해결을 위해 신규 콘텐츠는 콘텐츠 기반 필터링 기술로 분석하여 추천하고, 충분한 데이터가 쌓인 후부터는 협업 필터링으로 추천의 정확성을 높이는 방식입니다.

데이터 분석 전문 기업인 ‘빅인사이트’에서 제공하는 추천 알고리즘 서비스 또한 하이브리드 추천 방식을 사용 중이며, 현재 다수의 유명 화장품 브랜드와 의류 브랜드 이커머스에서도 사용 중입니다. 고객사에서는 타 솔루션을 사용할 때와 비교해 최대 32%의 매출 성장을 이뤄낼 수 있었습니다.

빅인사이트 추천 솔루션 도입 문의하기

2) 머신러닝 추천 시스템 (Machine Learning Recommender Systems)

머신러닝의 학습으로 추천하는 방식도 많이 개발되고 있습니다. 사용자에게 추천할 후보군을 먼저 보여주고 기계가 그에 대한 사용자 반응을 학습하며 점점 더 정교한 결과를 도출해내는 방식입니다.

빅인사이트에서 제공하는 서비스인 ‘빅인(bigin) 애널리틱스’의 잠재고객 인사이트 또한 머신러닝의 학습을 기반으로 도출됩니다. 빅인의 머신러닝은 사용자의 단순한 콘텐츠 소비를 넘어서, 상품 조회 및 페이지 클릭 등 사소한 행동까지도 학습합니다. 특정 사용자에게 그와 비슷한 행동을 보인 다른 사용자가 구매한 상품을 노출시킴으로써 구매 전환율을 상승시키는 방법으로 활용할 수 있습니다.

빅인(bigin) 더 알아보기

글을 마치며

이상으로 집단지성의 개념과 추천 시스템의 기본인 협업 필터링, 한계 극복을 위한 또 다른 시스템인 콘텐츠 기반 필터링까지 알아보았습니다.

협업 필터링은 제안된 지 20년이 지난 기술이지만 간결함과 정확성 덕분에 아직까지도 많은 추천 시스템에서 활용되고 있습니다. 그리고 더욱 정확한 결과를 위해 많은 변형 알고리즘과 방법들도 소개되고 있습니다.

넘쳐나는 콘텐츠 속에서 살아남기 위한 방법은 정교한 추천 시스템으로 사용자의 리텐션을 늘리고 지속적인 소비를 유도하는 것입니다. 유튜브는 추천 시스템의 도입으로 총 비디오 시청 시간을 20 배 이상 증가시켰고, 넷플릭스 자체 평가로는 매출의 75%가 추천 시스템에 의해 발생한다고 합니다. 추천이 수익이 되는 시대라고 해도 과언이 아닌 만큼, 많은 개발자들과 연구원들로부터 더욱 발전된 방법들이 개발될 것이라 기대가 됩니다.

추천 결과에 대한 만족도나 예측의 정확성은 추천 시스템의 생명이라고 할 수 있습니다.

또한 대용량의 데이터를 빠른 속도로 분석해 콘텐츠를 추천해줄 수 있어야 합니다.

지금도 머신러닝의 정확도와 효율성을 높이기 위해 끊임없이 연구하는 빅인사이트 집단지성의 성장도 관심 있게 지켜봐 주시기 바랍니다.

참고자료

https://www.sciencetimes.co.kr/?news=새로운-연구-방식인-집단지성&s=집단지성, https://ko.wikipedia.org/wiki/위키백과, https://ko.wikipedia.org/wiki/협업_필터링, http://www.kocca.kr/insight/vol05/vol05_04.pdf, http://blog.skby.net/협업-필터링-collaborative-filtering/, http://biz.chosun.com/site/data/html_dir/2019/05/09/2019050901303.html, http://www.shinailbo.co.kr/news/articleView.html?idxno=1077552, https://www.oss.kr/info_techtip/show/5419f4f9-12a1-4866-a713-6c07fd36e647

‘최고의 광고추천 서비스’를 개발하는 카카오 광고추천팀을 소개합니다.

바야흐로 디지털 마케팅 시대입니다.

전통적인 TV, 라디오를 넘어 PC, Mobile 사이트, 어플 등 다양한 미디어를 통해 우리가 이용하는 거의 모든 온라인 서비스에서 늘 광고를 접할 수 있습니다.

이러한 이면에는 ‘광고가 노출될 기회를 구매하고자 하는 수요자’(Demand Side)와 ‘광고가 노출될 기회를 판매하는 공급자’(Supply Side) 간 수요-공급에 따른 실시간 거래(RTB, Real Time Bidding)가 활발하게 이루어지는 ‘AD EXCHANGE’ 가 자리 잡고 있습니다.

카카오는 DAUM, KakaoTalk, KakaoStory 등 자체 서비스 매체뿐만 아니라 외부의 다양한 서비스 매체들을 대상으로 SSP(Supply Side Platform)를 운영함과 동시에 자체 DSP (Demand Side Platform) 혹은 외부 DSP 통한 광고(주) pool을 기반으로 RTB 거래가 활발하게 이루어지는 환경을 제공하는 국내 리딩 AD NETWORK 서비스 사업자입니다.

효율적이면서 자동화된 방식으로 대규모 RTB가 가능하기 위해서는 광고 지면(인벤토리)을 구매하는 과정에서 프로그래매틱한 메카니즘(Programmatic Buying)이 필수적인데, 기존의 사람 간 협상이나 거래를 기술과 데이터로 대체한 것이며 구매자가 조건을 미리 설정해 놓으면 나머지는 알고리즘이 알아서 인벤토리를 구매하는 방식입니다.

프로그래매틱으로 광고를 구매할 경우 광고 예산을 효율적으로 분배하여 미리 정해진 KPI를 기반으로 결과를 최적화할 수 있습니다. 프로그래매틱을 통하면 맹목적인 구매와는 반대로 잠재적 광고 노출을 개별적으로 평가할 수 있습니다. 온라인 마케팅 분야에서 인공지능, 머신러닝, 빅데이터 관련 기술이 적극적으로 도입, 활용되고 있으며 앞으로 더 높은 성장성이 기대되는 이유가 여기에 있습니다.

(참조 : https://www.iab.com/insights/iab-artificial-intelligence-in-marketing/)

카카오 광고 비즈니스 중심 ‘광고추천팀’

광고추천팀은 카카오 광고 비즈니스 중심에 있는 핵심적인 팀으로서 첨단 AD TECH 기술을 통해 ‘광고 서비스 관련 최적화 로직 개발 및 서빙 시스템 개발’을 담당하고 있습니다.

사용자 입장에서 유용한 광고 서비스 경험을 지원하고 동시에 광고주에게는 좋은 광고 성과를 낼 수 있도록 최적화된 광고 추천 로직과 서빙 시스템을 개발 및 운영하면서 광고 추천 서비스를 제공하고 있습니다.

카카오 서비스들은 다양한 분야로 확장하고 있으며 수많은 사용자를 바탕으로 트래픽이 급성장 추세에 있습니다. 이로 인해 카카오 광고도 매년 크게 성장하고 있습니다. 이러한 자체 서비스 매체뿐만 아니라 외부 서비스 매체로부터 발생하는 엄청난 양의 트래픽에 대해 실시간으로 RTB 통해 ‘사용자-매체-광고주-사업자’ 모두의 이해관계를 고려한 최적의 광고가 추천될 수 있도록 서비스를 운영하는 일은 높은 수준의 기술적 역량을 필요로 합니다.

거대한 규모의 데이터로부터 찾아내는 최상의 가치

광고추천팀은 프로그래매틱 알고리즘이 최상의 성과를 낼 수 있도록 첨단 데이터 사이언스 기술을 적극 활용하여 최적화 모델의 연구, 개발 및 운영을 하고 있으며 동시에 이러한 모델에 기반한 실시간 추천 서비스를 안정적으로 제공하기 위한 거대하고 복잡한 서빙 시스템을 개발, 운영하고 있습니다.

뿐만 아니라 데이터 공급망 (Data Pipeline) 시스템, 모델 학습 및 실험 시스템, 지표 모니터링 시스템 등 관련 기반 시스템을 함께 구축, 운영하면서 MLOPS 구조로 전체 시스템을 유기적으로 워킹하도록 구성하여 최고의 성과를 내고 있습니다.

빅데이터 환경의 도래 및 AI/MachineLearning 기술의 발전 속에서 광고 비즈니스 역시 이전까지 경험해 보지 못한 거대한 규모의 데이터로부터 최상의 가치를 찾아내고 이를 서비스로 구현하는 것이 경쟁력, 아니 그 이상의 생존 전략으로 절실히 요구되는 시대입니다.

광고추천팀이 하는 일

1. 최적화 모델을 개발합니다.

사용자 반응성 (클릭, 전환 등) 관련 예측 모델 개발

입찰전략 모델 개발

최적화 타게팅 모델 개발

탐색 모델 개발

추천 랭킹 모델 개발

어뷰징 감지 및 대응 모델 개발

2. 모델 서빙 시스템 및 데이터 엔지니어링 시스템을 개발합니다.

머신 러닝 학습/예측에 사용할 데이터 처리 프로세스 개발 추천 시스템에서 학습/예측에 사용하는 데이터의 처리 파이프라인을 개발합니다. 모델 성향에 따라서 실시간, 배치 방식을 모두 운영하고 있으며 방대한 데이터를 빠르고 정확하게 제공할 수 있도록 시스템을 발전시킵니다.

데이터 분석을 위한 파이프라인 개발 모든 의사결정은 데이터를 기준으로 내리기 때문에 정확한 데이터가 중요합니다. 목적에 따라 실시간, 배치 지표 시스템을 모두 운영하고 있으며 모델 성능뿐만 아니라 서빙 시스템의 이상 감지 모니터링에도 적극 활용하고 있습니다.

머신러닝 모델 서빙 시스템 운영 데이터 처리 업무뿐만 아니라 준비된 모델을 서빙에 활용해 사용자에게 최적의 광고를 보여주는 백엔드 애플리케이션을 운영합니다.

A/B 테스트 플랫폼 개발 신규 피처를 적용하기 위해서 A/B 테스트를 필수적으로 거치며 이를 위한 A/B 테스트 플랫폼을 개발, 운영합니다.

주요 사용 기술/역량

사용 기술 환경은 다음과 같습니다.

개발 언어 : Golang, Java, Kotlin, Python, Scala

데이터 처리 도구 : Kafka, Spark, Hadoop, Druid

워크 플로우 : Argo workflow, Airflow, Jenkins

DB : Redis, MongoDB, Couchbase, MY-SQL

컴퓨팅 리소스 : Kubernetes, Hadoop YARN

배포 : Docker Hub, ArgoCD, Spinnaker

분석,모델링 : Pytorch, Tensorflow, Tableau, Jupyter Notebook, Zepplin

일하는 방식

현재 전사적으로 시행하고 있는 재택 및 유연근무제를 적극 활용하고 있어 각 구성원이 자유로운 시간, 장소에서 근무하는 것을 장려합니다. 또한 수평적인 문화를 지향하며 연차나 직책에 상관없이 자유롭게 의견을 표현할 수 있는 분위기입니다.

팀 내에서 여러 분야의 스터디를 활발하게 진행하고 있습니다. 머신러닝, 개발 방법론, 개발 언어/프레임워크 등 다양한 주제의 스터디를 자유롭게 참석/진행할 수 있습니다. 그리고 저녁 회식을 지양합니다. 물론 희망자에 한해 진행하고 있습니다.

끝으로

‘데이터의 가치가 돈으로 측정되는 곳, 인터넷 비즈니스의 꽃 광고, 광고 비즈니스의 꽃 광고 추천’, ‘광고 도메인에서 데이터 사이언스 및 엔지니어링 융합된 형태의 완결된 서비스를 경험할 수 있는 곳’ 인 광고추천팀에서 최고의 데이터 사이언티스트, 서버 개발자, 데이터 엔지니어들과 함께 최고의 서비스를 만든다는 자부심을 갖고 꿈을 실현하시길 바랍니다. 지금 바로 최고의 경력을 만들 완벽한 기회입니다!

키워드에 대한 정보 추천 서비스

다음은 Bing에서 추천 서비스 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 날씨 기반 옷 추천 서비스

  • 동영상
  • 공유
  • 카메라폰
  • 동영상폰
  • 무료
  • 올리기

날씨 #기반 #옷 #추천 #서비스


YouTube에서 추천 서비스 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 날씨 기반 옷 추천 서비스 | 추천 서비스, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

Leave a Comment