تخيل هذا: في نهاية يوم طويل، تنهار على أريكة غرفة المعيشة لتغوص في عالم البث المباشر هربًا من الواقع. وبدلاً من التمرير عبر قائمة لا نهائية من مربعات البرامج، تطلب من جهاز التحكم عن بُعد الذي يعمل بالصوت أن يبحث عن «فيلم الإثارة والجريمة المشوق الذي يتطور ببطء، والذي تدور أحداثه في بلدة صغيرة ممطرة، وقد صدر للتو».
هذا هو جمال الذكاء الاصطناعي التوليدي: اكتشاف المحتوى في سياق المحادثة وفي العالم الواقعي. لكن الجانب السلبي هو أن نماذج اللغة الكبيرة (LLMs1) التي يتم نشرها للاستخدام المؤسسي ليست مجهزة للإجابة على الأسئلة بنفس الطريقة التي تستجيب بها روبوتات الدردشة الشهيرة مثل «جيميني» و«تشات جي بي». ويرجع ذلك إلى أنها لا تمتلك أي معرفة خارج نطاق بيانات التدريب الأولية الخاصة بها.

في المثال أعلاه، ستكون المعلومات المتعلقة بفيلم جديد خارج نطاق بيانات تدريب نموذج اللغة الكبير (LLM) غير المُدرَّب على بيانات محددة. لذا، بدلاً من اقتراح فيلم مغمور، سيقوم المساعد المدعوم بالذكاء الاصطناعي باختلاق حبكة بثقة، أو دمج عناصر من فيلمين متشابهين في الاسم، أو التوصية بفيلم لا تمتلك خدمتك حتى حقوق توزيعه.
في عالم الذكاء الاصطناعي، تُعد الردود غير المثالية من النتائج الجانبية المعروفة للتكنولوجيا التي تستند في استجاباتها إلى الاحتمالات. غير أن روبوتات الدردشة الشائعة تستفيد من ارتباطها بمصادر بيانات خارجية موثوقة (مثل «التأسيس») لدعم ردودها. وهذا ليس مع نموذجات اللغة الكبيرة (LLMs) الخاصة بالمؤسسات. فهي لا تعرف سوى ما تم تدريبها عليه. ونتيجة لذلك، غالبًا ما لا تعرف كيف ترد، أو أنها ببساطة تختلق الإجابات (مثل «الهلوسة»).
على سبيل المثال، كشفت Gracenote حديثة Gracenote أن نماذج اللغة الكبيرة (LLMs) غير المدربة على بيانات محددة تواجه صعوبة في تقديم أي معلومات عن الأفلام التي عُرضت لأول مرة خلال العامين الماضيين، بغض النظر عن إيرادات شباك التذاكر والتغطية التي حظيت بها في المطبوعات الترفيهية الشهيرة. ومن الأمثلة على ذلك أفلام «GOAT» و«Mercy» و«Send Help» و«Solo Mio» و«It Was Just an Accident».

ومع ذلك، فإن مجرد عدم امتلاك نموذج اللغة الكبير (LLM) للإجابة الصحيحة لا يعني أنه سيعترف بعدم معرفته. ففي دراستنا، التي شملت 2,600 من أفضل البرامج التلفزيونية والأفلام في 13 دولة، قام نموذج اللغة الكبير غير المدعوم ببيانات حقيقية باختلاق 100% من المعلومات الواردة في الإجابات الخاصة بـ 506 عنوانًا (20% من العناوين المشمولة في الدراسة).
لربط المشاهدين بما يرغبون في مشاهدته، تحتاج نماذج اللغة الكبيرة (LLMs) إلى ما هو أكثر من المعلومات في الوقت الفعلي والقدرة على مطابقة سمات البيانات الوصفية. وسيتوقف تلبية توقعات العملاء المتزايدة مع تزايد استخدام الذكاء الاصطناعي على قدرة الخدمة على توفير معلومات شاملة حول آلاف العناوين الموجودة ضمن كتالوجات الفيديو الفردية. وفي هذا الصدد، فإن نماذج اللغة الكبيرة غير المدعمة ببيانات لا ترقى إلى مستوى هذه المهمة.

لتقييم الأداء العام لنموذج اللغة الكبير (LLM) غير المرتبط ببيانات مرجعية، قمنا بتعيين درجات جودة للنتائج الكاملة المقدمة لجميع العناوين البالغ عددها 2,600 عنوانًا. وتعكس هذه الدرجات (صفر، منخفضة، متوسطة، وعالية الجودة) مزيجًا من تقييمين منفصلين: مطابقة سمات البيانات الوصفية مع البيانات المرجعية، ودقة الحقائق الواردة في الردود.
وعلى مستوى العناوين البالغ عددها 2,600 عنوان، كانت النسب الإجمالية للنتائج ذات الجودة الصفرية والمنخفضة والمتوسطة مرتفعة جدًّا، حيث تراوحت بين 77% و91%. ولم يُعتبر سوى أقل من ثلث النتائج ذات جودة عالية. أما في هولندا والمكسيك، فلم يُعتبر سوى أقل من 10% من النتائج ذات جودة عالية.
في ظل تزايد تجزئة المحتوى وإرهاق المستخدمين من الاشتراكات، سيتوقف النجاح في مجال الترفيه المرئي بشكل متزايد على تجربة المستخدم. وفي هذا الصدد، تمتلك نماذج اللغة الكبيرة (LLMs) القدرة على التخفيف من الإحباط المتزايد بشأن اكتشاف المحتوى — ولكن ليس إذا قدمت نتائج سيئة. وفي كثير من الأحيان، لا سيما في حالات الاستخدام المؤسسي، لن تتمكن نماذج اللغة الكبيرة غير المرتكزة على بيانات موثوقة من تقديم النتائج الموثوقة في الوقت الفعلي التي ستحدد معايير النجاح، مع تزايد حجم قوائم المحتوى وزيادة لامركزية التوزيع.
لمزيد من المعلومات، قم بتنزيل دراستنا الحديثة دراستنا الأخيرة حول استجابات نماذج اللغة الكبيرة غير المبررة.
بدون أساس سليم، لا تستطيع النماذج اللغوية الضخمة تقديم نتائج بحث واكتشاف دقيقة لمشاهدي التلفزيون.
يتجاوز عدد البرامج الرياضية المتوفرة عبر مزودي خدمات الفيديو حسب الطلب (SVOD) العالميين الآن 38.5 ألف برنامج.
نماذج اللغة الكبيرة (LLMs) بعيدة كل البعد عن الكمال، وفي عالم الترفيه، تظن أنها تعرف أكثر مما تعرفه في الواقع.
املأ النموذج للاتصال بنا!
لقد تم استلام استفسارك، وفريقنا حريص على مساعدتك. سنقوم بمراجعة رسالتك على الفور والرد عليك في أقرب وقت ممكن.