뉴욕 — 2026년 6월 10일 — Nielsen)의 콘텐츠 인텔리전스 사업부인 Gracenote(Gracenote)는 오늘 최신 보고서인 “AI의 줄거리 허점: 근거 없는 대규모 언어 모델(LLM)이 콘텐츠 발견 문제를 해결할 수 없는 이유”를 발표했다. 이 연구는 13개국에서 2,600편의 인기 영화 및 TV 프로그램에 대한 질문에 주요 대규모 언어 모델(LLM)이 얼마나 정확하게 답변했는지 조사했다. 훈련 데이터에만 기반한 응답과 Gracenote 인텔리전스에 근거한 응답을 비교한 결과, 근거가 부족한 LLM은 조사 대상 506편(전체 작품의 약 5분의 1)에 대해 측정된 모든 메타데이터를 잘못 인식한 것으로 나타났다.
이 보고서는 스트리밍 서비스 및 기타 엔터테인먼트 제공업체들이 시청자들이 압도적인 선택지와 파편화된 콘텐츠 목록을 헤쳐나갈 수 있도록 돕기 위해 대규모 언어 모델(LLM)을 도입하기 시작한 시점에 발표되었다. 요약, 출연진, 장르, 개봉 연도, 상영 시간 등 테스트에 포함된 세부 정보들은 시청자가 무엇을 볼지 결정할 때 활용하는 요소이자, 서비스 제공업체가 콘텐츠를 설명하고, 정리하며, 추천하는 데 사용하는 요소와 동일하다. 이번 결과는 AI 기반 콘텐츠 탐색의 품질이 그 경험을 뒷받침하는 데이터의 질에 달려 있음을 보여준다.
Gracenote의 제품 담당 수석 부사장인 타일러 벨은 “시청자들은 잘못된 답변이 어디서 나왔는지 신경 쓰지 않습니다. 답변이 틀리면 서비스 자체를 탓하죠”라고 말했다. “바로 그 때문에 ‘근거’가 중요합니다. 차세대 엔터테인먼트 탐색 플랫폼을 구축하는 기업들에게 있어, 생성형 AI는 그럴듯한 추측을 정확한 사실로 대체하는 검증된 콘텐츠 인텔리전스에 기반을 두었을 때만 그 잠재력을 발휘할 수 있습니다. 이를 통해 사용 편의성을 높이고, 참여도를 높이며, 충성도를 강화할 수 있습니다.”
그 밖의 주요 내용은 다음과 같습니다:
보고서에서 명확히 밝히고 있듯이, 2026년 현재 환각 현상을 전혀 일으키지 않는 대규모 언어 모델(LLM)은 존재하지 않습니다. 이는 대규모로 정확하고 최신의 엔터테인먼트 관련 답변을 제공해야 하는 AI 시스템에 있어 특히 큰 위험 요소입니다. AI 기반 검색, 콘텐츠 탐색 및 추천 서비스를 구축하는 기업들에게 ‘그라운딩(grounding)’은 모델의 역량을 사용자의 신뢰로 전환하는 데 도움이 됩니다. Gracenote( Gracenote권위 있는 콘텐츠 인텔리전스는 직접적인 데이터 라이선싱 또는 Video MCP Server를 통해 제공됩니다. 이를 통해 LLM은 그럴듯하게 들리는 허구적 정보를 넘어, 시청자의 불편을 줄이고 참여도를 높이며 충성도를 강화하는 더 신뢰할 수 있는 응답을 제공할 수 있습니다.
Gracenote 6월 18일 덴버에서 열리는 ‘스트림TV 쇼(StreamTV Show)’에서 이번 보고서의 주요 내용을 Gracenote , Gracenote 제품 담당 수석 이사인 난디타 아로라(Nandita Gracenote)가“콘텐츠 발견의 재구상(Reimagining ContentDiscovery)” 패널 토론에 참여합니다. 이 세션에서는 AI, 개인화, 통합 검색 및 새로운 사용자 경험 접근 방식이 스트리밍 서비스가 시청자와 콘텐츠를 연결하는 방식을 어떻게 변화시키고 있는지 살펴볼 예정입니다.
전체 보고서인 “AI의 플롯 허점: 근거 없는 대규모 언어 모델(LLM)이 콘텐츠 발견 문제를 해결할 수 없는 이유”( )는 여기에서 다운로드할 수 있습니다.
Gracenote 호주, 브라질, 캐나다, 프랑스, 독일, 일본, 멕시코, 네덜란드, 한국, 스페인, 스웨덴, 영국, 미국 등 13개국에서 인기 있는 영화 및 TV 프로그램 2,600편을 대상으로 Gracenote . 이 연구에서는 훈련 데이터만을 바탕으로 답변하도록 지시받은 ‘그라운딩되지 않은’ 대규모 언어 모델(LLM)의 응답과, MCP 서버를 통해 Gracenote 비디오 데이터에 기반한 응답을 비교했습니다. 응답은 제목, 설명, 출연진, 장르, 개봉 연도 및 상영 시간(해당되는 경우)을 포함한 객관적인 속성들을 기준으로 평가되었습니다. 이러한 속성들은 독립적으로 검증될 수 있으므로, 이번 결과는 그라운딩이 AI가 생성한 엔터테인먼트 관련 응답의 정확성과 신뢰성에 어떤 영향을 미치는지에 대한 정량적인 통찰을 제공합니다.
Gracenote Nielsen의 콘텐츠 인텔리전스 Gracenote . 당사는 전 세계 미디어 및 엔터테인먼트 생태계가 콘텐츠와 관련 메타데이터를 색인화하는 방식을 표준화하여, 제작자, 유통사, 플랫폼 및 광고주 간에 원활하게 정보가 유통되도록 지원합니다. 5,000만 개 이상의 타이틀과 8만 개 이상의 채널 및 카탈로그에 걸쳐 타의 추종을 불허하는 심층적인 정보를 제공함으로써, 80여 개국 70개 이상의 언어로 사람들이 좋아하는 TV 프로그램, 영화, 음악, 스포츠와 연결되는 현대적인 검색, 발견 및 탐색 경험을 지원합니다. 자세한 내용은 Gracenote.com을 방문하거나 LinkedIn에서 팔로우해 주십시오.
마크 야마다
mark.yamada@nielsen.com
현재 전 세계 SVOD 서비스의 핵심 콘텐츠로 자리 잡은 스포츠 프로그램은 주요 서비스 제공업체의 전체 프로그램 중 5%를 차지할 정도로 성장했다.
GracenoteAI 보고서에 따르면, AI 기반 엔터테인먼트 검색은 증가하고 있지만 소비자들의 AI에 대한 신뢰도는 여전히 뒤처지고 있는 것으로 나타났다.
Gracenote 메타데이터는 삼성전자가 LLM 기반 검색 및 발견 경험을 제공하는 데 기여하고 있습니다.
양식을 채워서 문의하세요!
귀하의 문의가 접수되었으며 최선을 다해 도와드리겠습니다. 즉시 메시지를 검토하여 가능한 한 빨리 답변해 드리겠습니다.