유튜브 추천 알고리즘의 역사 및 작동 원리

IT 활용 기술/ai 기술관련

유튜브 추천 알고리즘의 역사 및 작동 원리

glasslego 2025. 3. 12. 15:00

유튜브 추천 알고리즘은 전 세계 수십억 사용자의 콘텐츠 소비에 지대한 영향을 미치는 복잡한 시스템입니다. 이 포스팅에서는 유튜브 추천 시스템의 역사적 발전, 핵심 개념, 수학적 원리, 그리고 최신 동향까지 자세히 알아보겠습니다.

1. 유튜브 추천 알고리즘의 역사적 발전

초기 단계 (2005-2010)

유튜브가 처음 시작되었을 때, 추천 시스템은 매우 단순했습니다. 주로 다음 요소를 기반으로 했습니다:

조회수
평점(좋아요/싫어요 비율)
태그 및 제목의 유사성

초기 추천 점수 계산 방식은 다음과 같이 간단했습니다:

추천_점수 = a * 조회수 + b * 좋아요_비율 + c * 댓글_수

여기서 a, b, c는 각 요소의 가중치입니다.

협업 필터링 도입 (2010-2012)

2010년경, 유튜브는 협업 필터링 기법을 도입했습니다. 이 방식은 "당신과 비슷한 취향을 가진 사용자들이 좋아한 비디오"를 추천하는 방식으로 작동합니다.

사용자 기반 협업 필터링의 핵심 개념은 사용자 간의 유사도를 계산하는 것입니다:

유사도(u, v) = cos(θ) 
            = 벡터 u와 v의 내적 / (u의 크기 × v의 크기)
            = (u·v) / (||u|| × ||v||)

여기서 벡터_u와 벡터_v는 사용자 u와 v의 시청 기록을 나타내는 벡터입니다.

항목 기반 협업 필터링은 비디오 간의 유사도를 계산합니다:

유사도(i, j) = 두 비디오를 모두 시청한 사용자들의 평가 유사성

매트릭스 분해와 잠재 요인 모델 (2012-2015)

유튜브는 사용자-항목 상호작용 데이터의 희소성 문제를 해결하기 위해 매트릭스 분해 기법을 도입했습니다.

특이값 분해(SVD) 기반 접근법:

$R \approx P \times Q^T$

여기서:

R: 사용자-항목 상호작용 매트릭스
P: 사용자-잠재요인 매트릭스
Q: 항목-잠재요인 매트릭스
k: 잠재 요인의 수

2. 딥러닝 기반 추천 시스템 (2016)

2016년, Google은 "Deep Neural Networks for YouTube Recommendations"라는 획기적인 논문을 발표했습니다. 이 시스템은 두 가지 주요 신경망으로 구성됩니다:

2.1 후보 생성 네트워크

목적: 수백만 개의 비디오 중에서 사용자에게 관련 있는 수백 개의 비디오를 선별합니다.

입력:

사용자 시청 기록
검색 기록
인구통계 정보

수학적 모델:

임베딩 레이어:

e_v = W_e · v

여기서:

e_v: 비디오 v의 임베딩 벡터
W_e: 임베딩 가중치 매트릭스
v: 비디오의 원-핫 인코딩 벡터
·: 행렬 곱셈

사용자 표현:

u = f(W_u · [e_v1, e_v2, ..., e_vn, e_s1, e_s2, ..., e_sm, d])

여기서:

u: 사용자 표현 벡터
f: 활성화 함수 (ReLU 등)
e_v1, e_v2, ...: 시청한 비디오의 임베딩
e_s1, e_s2, ...: 검색 쿼리의 임베딩
d: 인구통계 정보

2.2 랭킹 네트워크

목적: 후보 비디오에 더 세밀한 특성을 적용하여 최종 순위를 결정합니다.

입력:

후보 비디오 리스트
비디오 특성
사용자 특성
맥락 특성

수학적 모델:

P(watch|u, v, c) = sigmoid(W_2 · ReLU(W_1 · [e_u, e_v, e_c]))

여기서:

P(watch|u, v, c): 주어진 사용자 u, 비디오 v, 맥락 c에서 시청 확률
W_1, W_2: 가중치 매트릭스
e_u, e_v, e_c: 사용자, 비디오, 맥락 임베딩 벡터

3. 강화학습 적용 (2018-2020)

유튜브는 2018년부터 강화학습을 추천 시스템에 통합하기 시작했습니다. 이 접근 방식은 단기적인 참여도와 장기적인 사용자 만족도 사이의 균형을 맞추는 데 중점을 두었습니다.

3.1 강화학습 모델의 수학적 표현

마르코프 결정 과정(MDP) 정의:

상태(S): 사용자의 현재 상태 (시청 기록, 맥락 등)
행동(A): 추천할 비디오 선택
보상(R): 사용자 참여 지표 (시청 시간, 좋아요 등)
상태 전이 확률(P): P(s'|s,a)
할인 계수(γ): 미래 보상의 현재 가치 계수

Q-학습을 이용한 가치 함수 업데이트:

Q(s,a) ← Q(s,a) + α[r + γ * max_a' Q(s',a') - Q(s,a)]

여기서:

Q(s,a): 상태 s에서 행동 a를 취했을 때의 가치
α: 학습률
r: 즉각적인 보상
γ: 할인 계수
s': 다음 상태

3.2 탐색-활용 균형

유튜브 추천 시스템은 사용자에게 이미 알려진 선호도를 기반으로 한 추천(활용)과 새로운 콘텐츠 발견(탐색) 사이의 균형을 맞추기 위해 다양한 전략을 사용합니다.

상한 신뢰 구간(UCB) 알고리즘:

UCB(a) = Q(a) + c * sqrt(log(t) / N(a))

여기서:

Q(a): 행동 a의 예상 보상
c: 탐색 매개변수
t: 전체 시도 횟수
N(a): 행동 a가 선택된 횟수

4. 다중 목표 최적화 (2020-2024)

최근 유튜브는 여러 목표를 동시에 최적화하는 방향으로 발전했습니다.

4.1 다중 목표 최적화 수식

목표 = w1 * 참여도 + w2 * 만족도 + w3 * 장기적 참여 - w4 * 부정적 경험

여기서 w1, w2, w3, w4는 각 목표의 가중치입니다.

4.2 다양성 확보 전략

상호 정보량 기반 다양성:

다양성 점수 = -Sum_i Sum_j P(c_i|u) * P(c_j|u) * sim(c_i, c_j)

여기서:

P(c_i|u): 사용자 u에게 카테고리 c_i의 콘텐츠가 추천될 확률
sim(c_i, c_j): 카테고리 c_i와 c_j 사이의 유사도

5. 최신 기술 발전 (2021-2024)

5.1 트랜스포머와 그래프 신경망 도입

트랜스포머 기반 시퀀스 모델링:

Attention(Q, K, V) = softmax(QK^T / sqrt(d_k))V

여기서:

Q, K, V: 쿼리, 키, 값 매트릭스
d_k: 키 벡터의 차원

그래프 신경망(GNN)을 이용한 관계 모델링:

h_v^(l+1) = activation(W^(l) · AGGREGATE({h_u^(l) : u ∈ N(v)}))

여기서:

h_v^(l): 레이어 l에서 노드 v의 표현
W^(l): 가중치 매트릭스
AGGREGATE: 이웃 노드의 표현을 집계하는 함수
N(v): 노드 v의 이웃 집합

5.2 인과 추론 도입

유튜브는 상관관계가 아닌 인과관계를 파악하기 위해 인과 추론 기법을 도입하고 있습니다.

ATE = E[Y(1) - Y(0)]

여기서:

ATE: 평균 처치 효과(Average Treatment Effect)
Y(1): 추천을 받았을 때의 결과
Y(0): 추천을 받지 않았을 때의 결과

5.3 자기 지도 학습의 확장

유튜브는 레이블이 없는 데이터에서도 학습할 수 있는 자기 지도 학습 방법을 채택했습니다.

L_contrastive = -log( exp(sim(z_i, z_j)/τ) / Sum_k≠i exp(sim(z_i, z_k)/τ) )

여기서:

sim(z_i, z_j): 인코딩된 표현 z_i와 z_j 사이의 유사도
τ (타우): 온도 매개변수

5.4 대규모 언어 모델(LLM) 통합

유튜브는 GPT 계열과 같은 대규모 언어 모델을 추천 시스템에 통합하고 있습니다.

e_content = LLM_encoder(video_metadata, captions, comments)

5.5 멀티모달 파운데이션 모델

비디오, 오디오, 텍스트를 단일 표현 공간에 매핑하는 멀티모달 모델:

e_multimodal = α * Vision_Transformer(frames) + β * Audio_Transformer(audio) + γ * Text_Transformer(captions)

여기서:

α (알파), β (베타), γ (감마)는 각 모달리티의 가중치

6. 유튜브 추천 알고리즘의 평가 지표

6.1 온라인 지표

클릭률(CTR):

CTR = 클릭 수 / 노출 수

시청 시간:

평균 시청 시간 = 총 시청 시간 / 시청 세션 수

사용자 만족도 지표:

만족도 점수 = w1 * 좋아요 비율 + w2 * 댓글 참여도 + w3 * 공유 비율 - w4 * 이탈률

6.2 오프라인 지표

정밀도(Precision@k):

Precision@k = 관련 항목 수 / k

리콜(Recall@k):

Recall@k = 추천된 관련 항목 수 / 모든 관련 항목 수

7. 윤리적 측면과 최신 추세

7.1 알고리즘 발전의 윤리적 측면

필터 버블과 에코 챔버 방지: 사용자가 다양한 관점과 콘텐츠에 노출되도록 하기 위한 다양화 전략이 도입되고 있습니다.

공정성 지표와 편향 감소:

통계적 형평성 = |P(R=1|G=0) - P(R=1|G=1)|

값이 0에 가까울수록 더 공정한 추천 시스템을 의미합니다.

설명 가능한 AI(XAI): 유튜브는 추천 결정의 이유를 사용자에게 설명하는 기능을 강화하고 있습니다.

7.2 최신 추세 (2023-2024)

초개인화와 콘텍스트 인식: 사용자의 현재 맥락(시간, 위치, 활동 등)을 더 세밀하게 고려하는 추천 방식
장기 관계 모델링:여기서 γ는 할인 계수, rt는 시간 t에서의 보상입니다.
장기 가치 = Sum_t γ^t * E[rt|st, π]
프라이버시 보존 기술: 연합 학습 등을 통해 개인 정보를 보호하면서도 효과적인 추천을 제공하는 방향으로 발전

8. 결론

유튜브 추천 알고리즘은 단순한 협업 필터링에서 복잡한 다중 목표 최적화 시스템으로 발전했습니다. 최신 알고리즘은 다음과 같은 핵심 구성 요소를 포함합니다:

딥 임베딩과 표현 학습: 사용자와 콘텐츠의 효율적인 벡터 표현
멀티모달 신경망: 비디오, 오디오, 텍스트 등 다양한 모달리티 처리
강화학습과 다중 목표 최적화: 단기 참여도와 장기 사용자 만족도 간의 균형
트랜스포머와 그래프 신경망: 시퀀스 및 관계 모델링 능력 향상
공정성과 편향 감소 기법: 추천 시스템의 윤리적 측면 개선

유튜브의 추천 알고리즘은 계속해서 발전하고 있으며, 미래에는 더욱 개인화되고, 맥락을 인식하며, 윤리적 고려사항을 반영하는 방향으로 진화할 것으로 예상됩니다.

참고 자료

Deep Neural Networks for YouTube Recommendations (2016)
- 핵심 개념: 후보 생성 네트워크와 랭킹 네트워크의 이중 구조
Reinforcement Learning for Slate Recommendations (2018)
- 핵심 개념: 여러 항목을 동시에 추천하는 slate 추천에 강화학습 적용
Top-K Off-Policy Correction for a REINFORCE Recommender System (2019)
- 핵심 개념: 강화학습을 추천 시스템에 적용하는 방법론
Self-Supervised Learning for Recommender Systems (2021)
- 핵심 개념: 추천 시스템에서의 자기 지도 학습 기법
유튜브 공식 블로그: 추천 시스템 투명성 관련
- 핵심 개념: 유튜브가 자체적으로 공개한 추천 시스템 작동 원리
Google AI Blog: Improving Video Recommendations
- 핵심 개념: 맥락 인식 비디오 추천 기술
Large Language Models for Recommendation Systems (2023)
- 핵심 개념: 추천 시스템에서 대규모 언어 모델의 활용
Privacy-Preserving Recommendation Systems: A Survey (2023)
- 핵심 개념: 개인정보를 보호하는 추천 시스템 기술

이 포스팅이 유튜브 추천 알고리즘에 대한 이해를 돕는 데 유용하셨기를 바랍니다. 질문이나 의견이 있으시면 댓글로 남겨주세요!

저작자표시 비영리 변경금지 (새창열림)

'IT 활용 기술 > ai 기술관련' 카테고리의 다른 글

GPT 모델 비교: 추론 특화 모델과 범용 모델의 특징 및 활용 가이드 (0)	2025.03.31
Amazon Personalize 추천 시스템 플랫폼 (0)	2025.03.13
검색과 추천: 사용자 경험 관점에서의 비교 및 발전 방향 (0)	2025.03.13
생성형 AI의 기본 개념 (0)	2025.03.12

현재글유튜브 추천 알고리즘의 역사 및 작동 원리

안경레고 블로그

데이터 개발뿐 아니라 관심사를 gpt 와 함께 정리중입니다.

floc(federated learning of cohorts), Zapier, adid (android 광고 id), OpenAI, idfa (광고 식별자), 오픈채팅, chatGPT, 워드프레스 광고 최적화, 코호트(cohort) 기반 타겟팅, 자사(first-party) 데이터, 워드프레스 수익화 방법, 인공지능, AI 에이전트, GPT, 프라이버시 샌드박스, 프라이버시 보호, 산업용 로봇, 제3자(third-party) 쿠키, cursor ai 단축키, make.com,

Today :
Yesterday :

안경레고 블로그