추천 알고리즘이란 이용자의 정보를 바탕으로 이용자가 원할 만한 정보를 선별적으로 제공하는 기술을 말한다. 이용자의 주의(attention)를 끌어 이들이 최대한 플랫폼에 오래 머물도록 유도하는 것이 목표다. 이를 위해 소셜미디어 기업을 비롯한 빅테크 기업들은 추천 알고리즘을 더욱 정교하게 고도화해 왔다.
특히 유튜브는 추천 알고리즘이 매우 발달한 플랫폼으로, 유튜브 최고경영자인 닐 모한의 과거 인터뷰에 따르면 유튜브 이용자들이 시청하는 콘텐츠의 70%(시간 기준)가 추천 알고리즘에 의한 것이라고 한다. 추천 알고리즘은 기업의 핵심적인 기술 경쟁력이자 비즈니스 전략이기 때문에 그 메커니즘이 외부에 완전하게 공개되지는 않는다. 다만 기업에서 공개하는 일부 자료 및 다양한 연구를 토대로 기술 일부분을 가늠할 수 있다.
유튜브에서 공개한 자료에 따르면, 초기에는 ‘클릭 수’ 중심의 알고리즘이었는데 2012년 이후에는 ‘시청 시간’을 알고리즘에 반영하기 시작했다. 단순히 클릭 수가 높은 콘텐츠를 추천하는 것이 아니라, 이용자의 영상 시청 시간을 분석해 이용자가 더욱 오래 머물 가능성이 높은 콘텐츠를 추천하는 방식이다. 2016년 이후에는 본격적으로 딥러닝 기반의 뉴럴 네트워크(DNN)를 추천 알고리즘에 적용했다. 클릭 수, 시청 시간 등 기존의 규칙 기반 추천 방식에서 방대한 양의 이용자 행동 데이터를 알고리즘에 학습시켜 알고리즘이 스스로 이용자의 숨겨진 선호까지 찾아내 그에 맞는 영상을 추천하는 방식으로 개선한 것이다.
또한 알고리즘 작동 방식도 두 단계로 더욱 정교화했다. 첫 번째 단계에서 이용자 정보를 토대로 전체 동영상 중 이용자가 클릭할 확률이 높은 동영상을 1차 후보군으로 추리고, 두 번째 단계에서 개인의 검색 및 시청 기록, ‘좋아요’ 등의 반응 데이터를 종합 분석해 최종 추천 목록을 정하도록 했다.
그런데 추천 알고리즘이 고도화될수록 여러 가지 부작용에 대한 우려의 목소리도 뒤따랐다. 이용자가 선호하는 콘텐츠만 반복적으로 추천하면서 확증편향을 강화하고 정보 편식을 유도하며, 자극적인 콘텐츠일수록 높은 클릭 수와 긴 시청 시간을 갖게 될 가능성이 크기 때문에 선정성이 높거나 극단적 견해를 담은 영상이 더욱 빠르게 확산할 수 있다는 것이다.
이에 유튜브를 비롯한 일부 소셜미디어 기업들은 추천 알고리즘의 문제를 인식하고 자정 노력을 기울이기 시작했다. 유튜브는 2019년부터 유해 콘텐츠 확산 방지를 위해 경계선(boundary) 콘텐츠로 분류되는 음모론, 허위조작정보 등을 추천 목록에서 제외하거나 노출 빈도를 줄이는 조치를 시행했다. 2021년부터는 이용자가 동영상이 추천된 이유를 알 수 있도록 ‘왜 이 비디오를 추천했나요?’ 기능을 도입해 알고리즘의 투명성을 높이는 노력을 했다.
페이스북은 2023년 이후 추천 시스템의 투명성을 강화하기 위해 피드, 릴스, 스토리 등에서 콘텐츠 순위가 어떻게 정해지는지 공개했고, 이용자들이 추천 콘텐츠를 제어할 수 있는 권한을 확대했다. 인스타그램도 피드, 스토리, 검색 등 각 섹션마다 별도의 알고리즘을 적용해 이용자에게 다양한 유형의 콘텐츠가 제공될 수 있도록 했다. 틱톡 역시 2022년부터는 이용자가 다양한 주제와 스타일의 콘텐츠를 추천받을 수 있도록 알고리즘을 개선하고, 이용자들이 자신의 추천 피드를 초기화해 새로운 콘텐츠를 접할 수 있도록 하는 기능을 추가했다.
기업들의 자정 노력 덕분에 이용자는 더욱 다양한 콘텐츠를 추천받게 됐으며, 특정 콘텐츠가 나에게 추천된 이유를 확인하고 이를 직접 조정할 수 있게 됐다. 그러나 ‘주의 끌기’ 위주의 알고리즘은 여전히 자극적이고 선정적인 영상을 빈번히 노출하며, 최근에는 생성형 AI의 발전으로 딥페이크 등 불법·조작 콘텐츠까지 확산되고 있다. 이에 따라 앞으로는 콘텐츠 노출 책임을 기업과 국가가 공동 부담하고 알고리즘 투명성과 안전 기준을 포함한 거버넌스를 마련해 추천 알고리즘이 사회적 가치를 훼손하지 않는 방향으로 개선해 나갈 필요가 있다.