2021. 10. 22.

넷플릭스 섬네일 아트워크, 그리고 알고리즘

Photo by Charles Deluvio on Unsplash

 

 

 

이 포스트는 

윤디자인그룹 직원 A씨의 이야기를 재구성한 것입니다

 

 

 

친구와 넷플릭스 계정을 공유하고 있습니다. 구독료는 서로 반반씩 내고요. 프로필도 각자 따로 씁니다. 너와 나의 취향 존중을 위해 상대방 프로필 접속 및 시청은 금하자, 라는 게 룰입니다. 굳이 이런 룰을 만든 이유가 있는데요. 취향이 극단적으로 다르기 때문이죠. 친구는 로맨스와 코미디 장르를 좋아하는 반면, 저는 호러와 액션물을 선호합니다. 그래서, 넷플릭스 ‘콘텐츠 추천 알고리즘’을 보호하고자 각자의 프로필은 넘보지 않기로 약속한 겁니다. 그러던 어느 날, 우리는 뭔가를 발견했습니다.

 

“어? 너랑 나랑 왜 섬네일이 달라?”

 

스마트폰으로 각자 프로필의 메인 페이지를 비교해 보면서 최근에 뭘 봤고 뭐가 좋았는지를 얘기하던 중(친구랑 만나면 종종 이렇게 시간을 보냅니다), 동일한 콘텐츠의 섬네일이 각기 다르단 걸 알게 됐죠. 편의상 제 프로필을 A, 친구 프로필을 B라 구분하겠습니다.

 

넷플릭스 오리지널 시리즈 〈마이네임〉 섬네일 비교

좌: 액션/호러 취향의 프로필 A | 우: 로맨스/코미디 취향의 프로필 B

 

〈마이 네임〉이라는 작품의 섬네일이 달랐어요. ‘페이지 새로 고침을 할 때마다 섬네일이 달라지는 건가?’ 싶어서 친구와 저는 각자 프로필의 페이지를 새로 고침 후 〈마이 네임〉을 검색해봤습니다. 결과는 똑같았습니다.

 

제 프로필은 파이팅 케이지 안에서 복싱 글러브를 착용한 채 격투 자세를 취하는 주인공(배우 한소희)의 모습을 섬네일로 불러들였고, 친구 프로필은 경찰 제복을 입고 경례를 하는 주인공의 모습을 섬네일로 생성했습니다. 전자가 역동적이라면 후자는 다소 정적인 이미지예요. 전자는 ‘격투 액션물’임을 확연히 드러내지만 후자는 그렇지 않습니다. 영화 〈신세계〉 같은 범죄 스릴러 느낌에 더 가까워 보이네요.

 

친구도 저도 궁금한 건 못 참는 성격이라(그렇다고 엄청 학구적으로 의문을 해결하는 타입도 아님), 몇 가지 간단한 테스트를 해보기로 했습니다.

 

 

 

사용자의 시청 이력과 콘텐츠 평가에 따라 섬네일이 달라지는 것 같다

 

우선은 이런 가설을 세웠습니다. 〈마이 네임〉을 예로 들면, 호러와 액션을 좋아하는 제 프로필엔 ‘여전사’ 느낌이 강한 주인공의 모습이, 로맨스와 코미디를 애호하는 친구 프로필엔 ‘여성 경찰관’ 이미지가 섬네일로 등장했잖아요? 우리는 이 현상(?)이 사용자의 취향(시청 이력 및 콘텐츠 평가)을 반영한 거라고 예측한 겁니다. 제 프로필과 친구 프로필에서 콘텐츠 몇 편을 한 번 검색해봤는데요. 아래와 같이 나오더군요.

 

넷플릭스 오리지널 시리즈 〈스위트 홈〉 검색 결과

위: 프로필 A(파란색) | 아래: 프로필 B(노란색)

 

넷플릭스 오리지널 시리즈 〈킹덤 아신전〉 검색 결과

위: 프로필 A | 아래: 프로필 B

 

넷플릭스 오리지널 시리즈 〈위쳐〉 검색 결과

위: 프로필 A 아래: 프로필 B

 

 

섬네일 아트워크의 온도 차가 느껴지시나요? 좀더 확실하게 느끼실 수 있도록 위 검색 결과창에 불러들여진 섬네일들을 대조해보도록 하겠습니다.

 

 

왼쪽 열이 ‘호러와 액션물을 좋아하는’ 프로필 A, 오른쪽 열이 ‘로맨스와 코미디를 선호하는’ 프로필 B입니다. 섬네일 아트워크의 온도 차가 확연하게 감지되시죠?

 

좀비가 있거나 없거나

가장 극단적인 섬네일 대비를 보이는 것이 〈킹덤〉과 〈킹덤 아신전〉입니다. 두 작품은 이른바 ‘조선 좀비물’이라 불리죠. 즉, 좀비가 등장하는 일종의 판타지 사극입니다. 왼쪽 열의 섬네일에선 좀비들이 등장한 반면, 오른쪽 열의 섬네일은 인간 캐릭터만 보입니다. 호러물 많이 보는 프로필 A 섬네일에는 넷플릭스가 친히 좀비들을 대령해주는군요. 이 말을 뒤집으면, 호러물 잘 안 보는 프로필 B 섬네일에선 좀비들이 소환되지 않는 겁니다. 만약 〈킹덤〉 시리즈를 전혀 모르는 누군가에게 프로필 B의 섬네일들만 보여준다면, 아마 ‘조선 좀비물’을 떠올리기란 불가능할 것 같네요.

 

무기가 있거나 없거나

〈스위트 홈〉과 〈위쳐〉의 섬네일도 인상적이에요. 왼쪽 열에선 무기(칼)가 노출되어 있습니다. 〈스위트 홈〉의 경우는 심지어 피 묻은 칼이 딱 보이네요. 왠지 고어물일 것 같은 냄새(?)도 풍깁니다. 하지만 오른쪽엔 배우 이시영의 얼굴이 부각되어 있어요. 입가엔 피가 흐르고 손에는 무기도 쥔 것 같은데, 이러한 폭력성이 좌측 열의 섬네일만큼 전면에 노출되진 않았습니다. 〈위쳐〉는 뭐 긴말할 것도 없겠네요. 장검을 겨누고 있는 배우 헨리 카빌의 모습(좌측 섬네일), 그리고 풍경 사진을 연상케 하는 바다 위 구조물(우측 섬네일). 한눈에 봐도 대조적입니다.

 

옆모습 vs. 앞모습

왼쪽 열의 〈D.P.〉는 골붉은 톤의 배경과 함께 군복 차림을 한 배우 정해인의 그늘진 옆모습을 보여줍니다. 상당히 음울한 분위기죠. 오른쪽 열의 〈D.P.〉는 정해인의 잘생긴 얼굴을 비추고 있습니다. 완전한 정면은 아니지만, 그래도 ‘정해인의 얼굴’을 인지할 만큼 충분한 각도입니다. 좌우 섬네일 모두 어두운 색채이긴 한데, 좌측 섬네일은 배경색 때문인지 공포스럽게도 느껴지네요. 영화 〈알포인트〉 류의 밀리터리 호러물 같은 분위기랄까요.

 

 

 

사용자 취향을 ‘훔치는’ 넷플릭스의 머신러닝 알고리즘

 

친구와 제가 세운 가설(‘사용자의 시청 이력과 콘텐츠 평가에 따라 섬네일이 달라진다’)이 왠지 참인 것 같았어요. 그래서 해외 웹 페이지들을 뒤적여봤습니다. 그리고 아래와 같은 자료를 찾을 수 있었습니다.

 


넷플릭스는 당신이 시청한 콘텐츠의 장르와 출연 배우를 섬네일에 반영해줍니다

 

넷플릭스 알고리즘은 당신의 시청 습관을 관찰합니다. 로맨틱 코미디를 많이 보시나요? 그렇다면 넷플릭스는 〈기묘한 이야기〉의 섬네일을 조이스(위노나 라이더 분)와 호퍼(데이비드 하버 분)의 이미지로 생성해줄 겁니다. 그냥 코미디를 더 좋아하나요? 그러면 〈기묘한 이야기〉 섬네일이 이번엔 극중에서 고스트 버스터즈 코스튬을 입은 어린이 주인공들의 이미지로 채워질 거예요.

 

장르만 섬네일에 반영되는 건 아니랍니다. (···) 예를 들어, 당신이 최근에 배우 우마 서먼의 영화를 봤다면, (그녀의 출연작 중 하나인) 영화 〈펄프 픽션〉의 섬네일에서 우마 서먼의 얼굴을 보게 될 겁니다.

 

똑같은 〈펄프 픽션〉이지만, 우머 서먼의 영화를 즐겨 본 사용자와 존 트라볼타의 영화를 즐겨 본 사용자의 섬네일이 달라짐

 

로맨스 장르를 많이 본 사용자와 코미디 장르를 많이 본 사용자의 〈굿 윌 헌팅〉 섬네일이 달라짐

 

[원문]

Netflix adapts your thumbnails based on genres and actors

 

Do you watch a lot of romantic comedies? Great, Netflix will show you a Stranger Things thumbnail with Joyce (Winona Ryder) and Hopper (David Harbour). Do you watch a lot of comedies? Great, you'll see a Stranger Things thumbnail with the kids dressed up as Ghostbusters.

 

Genre isn't the only thing Netflix looks at. (···) If, for example, you recently watched a movie starring Uma Thurman, you'll see a Pulp Fiction thumbnail featuring Uma.

 

― 인용문 및 이미지 출처: Looper.com


 

넷플릭스 콘텐츠 섬네일은 사용자 취향을 반영한다, 라는 건 확실히 참입니다. 영문 아티클들을 좀더 찾아보니 ‘사용자 맞춤형 섬네일 아트워크 및 콘텐츠 추천’은 넷플릭스의 정책임을 알게 됐습니다. 이 정책을 구현해주는 건 바로 알고리즘! 즉, 머신러닝인데요. 이 머신러닝을 넷플릭스는 이렇게 부르고 있습니다. ‘Contextual Badits’.

 

Contextual은 ‘맥락의’, Bandits는 ‘도둑들’을 뜻합니다. 의역을 해보자면, ‘사용자의 시청 취향과 맥락을 훔치는’ 머신러닝이라는 의미가 아닐까 싶은데요. 뭐 그냥 간결하게 ‘취향 도둑 머신러닝’이라고 불러도 되겠죠?

 


넷플릭스의 추천 알고리즘 대부분은 머신러닝 알고리즘에 의해 구현됩니다. (···) 섬네일 아트워크 맞춤화(personalization)를 위해 넷플릭스가 이용하는 온라인 러닝 프레임워크(online learning framework)가 바로 ‘Contextual Bandits’입니다. 머신러닝의 데이터 학습량 및 수집량이 방대해질 때까지 기다리는 방식이 아니라, (···) 선제적으로 사용자 컨텍스트에 최적화된 아트워크를 선별하는 것이죠.

 

Much of the Netflix recommendation engine is powered by machine learning algorithms. (···) For artwork personalization, the specific online learning framework we use is contextual bandits. Rather than waiting to collect a full batch of data, waiting to learn a model, (···) contextual bandits rapidly figure out the optimal personalized artwork selection for a title for each member and context. 

 

― 인용문 출처: The Netflix Tech Blog


 

사용자 취향(사용자 컨텍스트)을 훔친다, 라는 표현의 의미를 조금은 알 것 같네요. 데이터가 일정 분량 쌓여야 제 기능을 하는 AI가 아니라, 사용자의 서비스 이용 유형에 맞춰서 실시간으로 그때그때 반응한다는 의미인 듯합니다. 그래서 ‘Contextual Bandits’, ‘취향 도둑 머신러닝’이라 불리나 보네요.

 

 

 

네, 알겠습니다. 앞으로도 많이 볼 거예요.

 

사용자가 더 적극적으로 서비스를 이용할수록, 그러니까 더 많이 보고 더 많이 ‘찜’하고 ‘평가’를 할수록, 넷플릭스 머신러닝의 사용자 개인화 시스템은 활기차게(?) 돌아간다고 하네요. 하기야, 사용자에게서 훔칠 컨텍스트가 많아질 테니까요. 왠지 넷플릭스에게 의문의 1패를 당한 것 같은 기분도 듭니다만······. 뭐 어쩌겠습니까. 앞으로도 넷플릭스는 지금처럼 많이 볼 예정이고요. 네, 그러세요. 마음껏 훔치세요···.

 

그럼 이만, 어느 넷플릭스 이용자의 소소한 포스트를 마칩니다. 저와 같은 궁금증을 가졌던 분들께 유용한 정보가 되었기를 바랍니다.

 

(번외)
애니메이션 〈너의 이름은〉 검색 결과
호러/액션을 좋아하는 제 프로필(위) 섬네일엔 남자아이가,
로맨스/코미디를 좋아하는 친구 프로필(아래) 섬네일엔 여자아이가 뜨네요.
머신러닝은 대체 저랑 제 친구로부터 무슨 컨텍스트를 훔친 걸까요..