추천 시스템 이론 (1) : 추천 시스템의 평가 지표와 인기도 기반 추천

Artificial Intelligence/Recommendation System

추천 시스템 이론 (1) : 추천 시스템의 평가 지표와 인기도 기반 추천

__Vivacé__ 2023. 2. 13. 01:46

소비자들이 소비하는 방법

1. search

의도가 담긴 ‘query’ 가 사용됨
Pull : 사용자가 의도를 가지고 item을 검색해서 가져오는 방식
keyword와 연관성이 높은 상품만 user에게 노출

2. recommend

사용자의 흥미, 의도를 고려해 사용자도 모르는 본인에 취향에 맞는 item을 추천
과거 : 유저가 접할 수 있는 상품, 컨텐츠가 제한적 현재 : 웹/모바일 환경이 다양한 상품, 컨텐츠 등장 -> 정보를 찾는 데 오래걸림
최근에는 정보를 찾는데 시간이 오래 걸림
→ 유저가 원하는 바를 어떤 키워드로 찾아야 하는지 모를 수 있음 : RS의 필요성

threshold / 좋은 RS는 diversity를 추구해야 한다.
- 오른쪽으로 이동 시 recommendation diversity 증가 / RS가 지향하는 바
- 그러나 bad result 생성 가능성이 있음

사례
- 유튜브 동영상 추천
  - 조회수 급상승 → 해당 영상과 관련이 있거나, 업로드 되어 있는 채널의 영상 추천
    - SNS 친구 추천
      - 수십억 유저들 사이에서 내가 알만한 사람들을 추천

Model Test method

1. Offline Test

새로운 추천 모델을 검증하기 위해 가장 우선적으로 수행되는 단계
이 test에서 좋은 성능을 보여야 online serving에 투입되지만, case by case
- Serving bias : online에서는 user의 log가 data로 쌓임
- → model을 재학습해 새로운 model로 추천 (model이 바뀜)
성능 지표
우리가 추천한 아이템 개수: 5(=K) 추천한 아이템 중 유저가 관심있는 아이템 개수: 2 유저가 관심있는 아이템의 전체 개수: 3 Precision@5 =2/5 Recall@5 = 2/3

랭킹 문제 (ML 문제에서의 metric과 동일)

Precision@K
- 우리가 추천한 K개 아이템 가운데 실제 유저가 관심있는 아이템의 비율

Recall@K
- 유저가 관심있는 전체 아이템 가운데 우리가 추천한 아이템의 비율

MAP@K (Mean Average Precision)
- 모든 유저에 대한 Average Precision 값의 평균

AP@KUnlike Precision@K, 관련 아이템을 더 높은 순위에 추천하면 점수가 상승
- Precision@1 부터 Presicion@K 까지의 평균값

Hit Rate
- Hit / User
- 유저마다 Top-k recommendation에서 Hit한게 존재하면 Hit += 1

NDCG@K
- 추천 시스템에 가장 많이 사용되는 지표 중 하나
- 원래는 검색(Information Retrieval)에서 등장한 지표
- Top K 리스트를 만들고, 유저가 선호하는 아이템을 비교
- 추천의 순서에 가중치를 두고 성능을 평가, 1에 가까울수록 좋음
- Unlike MAP, 연관성을 binary가 아닌 scalar로 사용 가능
- → 유저에게 얼마나 더 관련 있는 아이템을 상위로 노출시키는 지 알 수 있음
- 관련 식
  - Cumulative Gain (CG) : 상위 K개 아이템에 대하여 관련도를 합한 것
  - Discounted Cumulative Gain (DCG) : 순서에 따라 Cumulative Gain을 Discount함
  - Ideal DCG (IDCG) : 이상적인 추천이 일어났을 때의 DCG값 / DCG 값중 가장 큼
  - Normalized DCG (NDCG) : 추천 결과에 따라 구해진 DCG를 IDCG로 나눈 값

A, B, C, D, E 는 item 종류 / 소괄호 안 숫자는 아이템이 갖고 있는 관련도를 의미

2. Online Test

Online A/B test
- Offline Test에서 검증된 가설이나 모델을 이용해 실제 추천 결과를 serving하는 단계
- RS 변경 전후의 성능 비교가 아니라, 동시에 대조군과 실험군의 성능을 평가 → (실험 환경을 최대한 동일하게 / 시간도 동일하게 두기 위함)

traffic을 반을 나눠 각 추천 시스템에 전달 → 얻어지는 결과로 의사결정
대부분 현업에서의 의사결정은, 모델 성능이 아닌 비즈니스/서비스 지표

인기도 기반 추천

인기도의 척도
- 조회수, 평균 평점, 리뷰 개수, 좋아요/싫어요 수 등
- 예시
- 네이버 쇼핑 랭킹 순, 다음 뉴스, 댓글 추천, 레딧 Hot 추천

인기도 기반 추천의 Score
- 조회수가 가장 많은 아이템을 추천 (Most Popular)
- → 뉴스 추천 등

   // Simple formula
   
   (upvote - downvote) - time_elasped  # 좋아요, 싫어요, 시간 오래됨

   = pageviews - time_elasped                   # 조회수, 시간 오래됨

But, 위와 같은 방식은 조회수가 높으면 1~2년이 지나도 글이 계속 Top Rank에 보임

1. Hacker News Formula - 뉴스 추천 서비스

뉴스의 가장 중요한 속성은 최신성

시간에 따라 줄어드는 score를 조정하기 위해 gravity(1.8)라는 상수를 사용

2. Reddit Formula

1st term : popularity, 좋아요 수가 폭발적으로 증가하는 것에 대한 penalty로 log 사용
2nd term : 글이 포스팅된 절대시간

평균 평점이 가장 높은 아이템을 추천 (Highly Rated) → 맛집 추천 등

이 방법은 신뢰할 수 있는 평점인 지, 평가의 개수가 충분한 지 검토 필요

1. Steam Rating Formula - steam에서 쓰는 인기도 기반 score

2. Steam Rating Formula → Movie Rating

영화 평점은 1 ~ 5 값으로 구성 / 가중 합으로 avg_rating을 구함
3.0을 빼주는 대신 모든 평점 데이터의 평균 값을 사용해도 됨

저작자표시 비영리 변경금지

현재글추천 시스템 이론 (1) : 추천 시스템의 평가 지표와 인기도 기반 추천

문자열 복사, 세 수의 합, Flood fill, 한양남자님 깃허브, SSR & CSR, python priority queue, python self class, AWS 인스턴스 생성, 민코딩, 문자열, python heapq, 문자열 부분 복사, Tabulation, BFS 시간복잡도, 재귀 함수 시간복잡도, 배열 내장 메서드, 훈련반, 클라이언트 사이드, JavaScript, DFS 시간복잡도,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Title