추천 시스템 introduction

2022-08-01 12 분 소요

2) 콘텐츠 기반 추천 시스템

콘텐츠 기반 추천 시스템에서는 아이템의 설명 속성을 추천에 활용한다. ‘Content’라는 용어가 설명에 해당된다. 콘텐츠 기반 방법론은 사용자의 평점과 구매 행동이 아이템의 콘텐츠 정보와 조합된다.

ex: 존이 <터미네이터>라는 영화에 높은 평점을 주고 다른 사용자의 평점에 대해서는 알 방법이 없다고 해보자. 이 경우 협업 필터링 방법론은 사용할 수 없다. 하지만 <터미네이터>라는 아이템의 설명에는 <에이리언>, <프레데터>와 같은 다른 공상과학영화와 같은 유사 장르 키워드를 포함하고 있다. 이때는 <에이리언>과 <프레데터>를 존에게 추천할 수 있다.

콘텐츠 기반 방법론에서 평점과 함께 레이블돼 있는 아이템 설명은 사용자별 classification 혹은 regression modeling 문제를 만들 때의 학습 데이터로 활용한다. 각 사용자에게 학습 데이터는 사용자가 직접 구매하거나 작성한 아이템 설명에 해당한다. 클래스 변수는 명시된 평점 혹은 구매 행동에 해당한다. 이러한 사용자 특정 모델은 해당 개인이 평점이나 구매 행동이 알려지지 않은 경우에 아이템을 좋아할지 좋아하지 않을지 예측하는 데 사용한다.

콘텐츠 기반 방법론은 평점 데이터가 충분하지 않은 새로운 아이템에 대한 추천에 있어 몇 가지 장점이 있다. 활성 사용자들이 유사한 속성을 가진 다른 아이템들을 평가했을 수 있기 때문이다. 따라서 supervised learning modeling에서는 아이템에 대한 평점 이력이 없다 하더라도 속성을 활용해 추천에 활용할 평점을 매길 수 있다.

하지만 콘텐츠 기반 방법론에도 몇 가지 단점이 존재한다.

대부분의 경우 콘텐츠 기반 방법론은 키워드나 내용 때문에 명백한 추천을 제공한다. 이는 구성된 모델이 현재의 사용자에게 제한돼 있고 유사한 사용자의 커뮤니티 지식을 활용하지 않았기 때문이다. 이런 현상은 추천 아이템의 다양성을 줄이는 바람직하지 않은 경우이다.
콘텐츠 기반 방법론이 새로운 아이템 추천에는 매우 효과적이라 하더라도, 새로운 사용자에게 제안하는 추천은 효과적이지 않다. 타깃 아요자를 위해 학습되는 모델은 사용자의 평점 이력이 있어야만 하기 때문이다. Robust한 예측을 하기 위해서는 타깃 사용자의 매우 많은 수의 평점 정보가 중요하다.

3) 지식 기반 추천 시스템

지식 기반 추천 시스템은 자주 구매하지 않은 아이템에 대해서 특히나 유용하다.이런 경우 충분한 평점이 추천 과정 중에 존재하지 않을 수 있다. 아이템을 드물게 구매하기도 하고 상세 옵션의 종류가 다르기 때문에, 구매하려는 아이템의 특정 인스턴스화(옵션들의 조합)에 대해 충분한 평점 정보를 얻기 어렵다. (Cold Start problem). 또한 소비자 선호도의 특성은 시간이 지남에 따라 변화할 수 있다. 마지막으로, 평점 이력만을 가지고는 사용자의 관심사를 정확히 알기는 어려울 것이다.

ex : 자동차의 경우 자주 구매하지 않는 제품 중 하나이므로 충분한 평점 정보를 얻기 힘들다.

ex : 시간이 지남에 따라 자동차의 트랜드가 변화하는 경우가 생겨, 소비자의 트랜드 역시 변화할 수 있다.

ex : 자동차를 구성하는 요소가 매우 많기 때문에, 자동차 구매이력 하나로는 소비자가 어떤 특징으로 인해 자동차를 구매했는지 명확하게 판단하기 어렵다.

위와 같은 경우 추천을 위해 평점을 활용하지 않는 지식 기반 추천 시스템으로 해결할 수 있다. 고객의 요구 사항과 아이템 상세 정보 간의 유사도, 혹은 사용자 요구 사항을 정하면서 생긴 제약 조건을 이용해 추천 프로세스를 수행할 수 있다. 추천 프로세스는 검색 과정에서 사용하는 규칙과 유사도 함수에 대한 데이터를 포함하는 지식 기반을 사용하기 때문에 가능하다.

지식 기반 추천 시스템은 앞서 언급한 목표를 달성하기 위해 활용하는 인터페이스로 나눌 수 있다.

제약 기반 추천 시스템(Constraint-based) : 사용자가 아이템에 대해 요구 사항과 제한 내용(상계, 하계 제한선)을 아이템 속성에 기입하게 된다.도메인별 규칙은 사용자 요구 사항과 아이템 속성을 일치시키는 데 사용한다. 이 규칙은 해당 시스템에서 사용하는 도메인별 지식을 나타내고 아이템 속성에 대한 도메인별 제약 조건 형식이 될 수 있다. 또한 제약 기반 시스템은 종종 사용자 속성을 아이템 속성과 연관시키는 규칙을 만든다. 검색 프로세스는 사용자가 원하는 결과에 도달할 때까지 수정, 상호작용하며 반복된다. - 사용자에게 필요한 속성의 최대, 최솟값을 기입 후 이를 만족하는 아이템을 나타내주는 것.
사례 기반 추천 시스템() : 사례 기반 추천 시스템의 특정 사례는 사용자가 대상 또는 앵커 포인트(anchor points)로 지정된다. 유사도 측정은 이러한 사례와 유사한 아이템을 검색하기 위해 아이템 속성에 정의된다. 검색된 결과는 사용자에 의해 상호작용한 일부 수정 사항을 반영해 새로운 대상으로 사용하는 경우가 많다. - 사용자가 이상적으로 생각하는 제품 속성을 기입 후 그 속성과 가장 비슷한 제품군을 찾아주는 방법

지식 기반 추천 시스템에서의 상호 작용은 다음 방법 중 하나 이상을 통해 수행한다.

대화형 시스템 : 사용자 선호도는 피드백 루프의 맥락에서 반복적으로 결정된다. 이는 ㅇ아이템 도메인이 복잡하고, 사용자 선호도를 반복적인 대화형 시스템의 맥락에서만 결정할 수 있기 때문이다.
검색 기반 시스템 : 검색 기반 시스템에서 사용자 선호도는 사전에 설정한 일련의 질문으로 추출한다. 경우에 따라 특정 검색 인터페이스는 사용자 제약을 명시하는 기능을 제공하기 위해 설정할 수 있다.
탐색 기반 추천(Navigation-based recommendation) : 사용자는 현재 추천하는 아이템에 대한 변경 요청 수를 명시한다. 반복되는 변경 요청을 통해 원하는 아이템에 도달할 수 있다. 이러한 추천 시스템을 평론 추천 시스템(critiquing recommender systems)이라고 한다.

지식 기반 시스템과 콘텐츠 기반 시스템은 아이템의 속성에 크게 의존한다. 또한 지식 기반 시스템은 콘텐츠 속성을 사용하기 때문에 콘텐츠 기반 시스템과 동일한 단점을 일부 갖고 있다. 두 시스템의 큰 차이는 콘텐츠 기반 시스템은 사용자의 과거 행동으로부터 학습하는 반면, 지식 기반 추천 시스템은 자신의 필요와 관심사에 대한 능동적인 사용자 요구 사항을 기반으로 추천한다는 것이다. 이러한 구별은 시스템의 목표와 사용한 입력 데이터의 종류에 기반한다.

(1) 효용 기반 추천 시스템

효용 기반 추천 시스템에서 효용 함수는 사용자가 아이템을 좋아할 확률을 계산하기 위해 제품 feature에 정의한다. 효용 기반 방식의 핵심 과제는 현재 사용 중인 사용자에게 적절한 효용 함수를 정의하는 것이다. 중요한 점은 협업, 콘텐츠 기반 또는 지식 기반 방식이건 상관없이 추천 시스템은 대상 사용자에 대한 인지된 가치에 근거해 추천한 아이템의 순위를 암묵적으로 매긴다는 것이다. 효용성 기반 시스템에서 효용 값은 우선순위(a priori)로 알려진 함수를 기반으로 한다. 이러한 의미에서 효용 함수는 일종의 외부 지식으로 간주할 수 있다.

4) 인구 통계학적 추천 시스템

인구 통계학적 추천 시스템에서 사용자에 대한 인구 통계학적 정보를 특정 인구 통계학적 평점 또는 구매 성향과 연결할 수 있는 classification 모델을 학습하는 데 활용한다. 대부분의 경우 인구 통계학적 정보를 추천 프로세스에서 추가적인 컨텍스트와 결합할 수 있다. 인구 통계학적 추천 시스템은 대개 독립 실행형으로 최상의 결과를 제공하지는 않지만 하이브리드 또는 앙상블 모델의 구성 요소로서 다른 추천 시스템의 힘을 크게 보탠다.

ex : 남성이 많이 구매한 제품, 20대가 많이 구매한 제품

5) 하이브리드와 앙상블 기반 추천 시스템

앞서 설명한 다양한 추천 시스템은 서로 다른 유형의 입력을 사용하고 다른 강점과 약점을 가지고 있다. 좀더 다양한 입력이 가능한 많은 경우에 동일한 작업에 대해 서로 다른 유형의 추천 시스템을 사용할 수 있다. 그런 경우 하이브리드화를 위한 많은 기회가 존재하는데, 여러 유형의 시스템으로부터 다양한 측면이 결합돼 최고의 시스템이 된다. Machine learning에서 앙상블 모델과 밀접한 관련이 있으며, 여러 추천 시스템을 결합해 다양한 데이터 소스의 힘을 결합하고, 특정 클래스의 추천 시스템의 효율성을 향상시킬 수 있다.

Twolions

추천 시스템 introduction

추천시스템 개요

추천 시스템의 목표

추천 시스템의 기본 모델

1) 협업 필터링 모델

(1) 메모리 기반 기법 (Memory-based methods)

(2) 모델 기반 방법론

(3) 평점의 종류

(4) Classification과 Regression modeling의 일반화로써의 협업 필터링

2) 콘텐츠 기반 추천 시스템

3) 지식 기반 추천 시스템

(1) 효용 기반 추천 시스템

4) 인구 통계학적 추천 시스템

5) 하이브리드와 앙상블 기반 추천 시스템

추천 시스템의 평가

공유하기

댓글남기기

참고

Numpy

이웃 기반 협업 필터링 (4)

이웃 기반 협업 필터링 (3)

이웃 기반 협업 필터링 (2)