4 دقائق للقراءة | 17 يونيو 2026

لماذا لا تستطيع نماذج اللغة الكبيرة غير المرتبطة ببيانات معينة حل مشكلة اكتشاف المحتوى

لماذا لا تستطيع نماذج اللغة الكبيرة غير المرتبطة ببيانات معينة حل مشكلة اكتشاف المحتوى
الذكاء الاصطناعي اكتشاف المحتوى

تخيل هذا: في نهاية يوم طويل، تنهار على أريكة غرفة المعيشة لتغوص في عالم البث المباشر هربًا من الواقع. وبدلاً من التمرير عبر قائمة لا نهائية من مربعات البرامج، تطلب من جهاز التحكم عن بُعد الذي يعمل بالصوت أن يبحث عن «فيلم الإثارة والجريمة المشوق الذي يتطور ببطء، والذي تدور أحداثه في بلدة صغيرة ممطرة، وقد صدر للتو».

هذا هو جمال الذكاء الاصطناعي التوليدي: اكتشاف المحتوى في سياق المحادثة وفي العالم الواقعي. لكن الجانب السلبي هو أن نماذج اللغة الكبيرة (LLMs1) التي يتم نشرها للاستخدام المؤسسي ليست مجهزة للإجابة على الأسئلة بنفس الطريقة التي تستجيب بها روبوتات الدردشة الشهيرة مثل «جيميني» و«تشات جي بي». ويرجع ذلك إلى أنها لا تمتلك أي معرفة خارج نطاق بيانات التدريب الأولية الخاصة بها.

في المثال أعلاه، ستكون المعلومات المتعلقة بفيلم جديد خارج نطاق بيانات تدريب نموذج اللغة الكبير (LLM) غير المُدرَّب على بيانات محددة. لذا، بدلاً من اقتراح فيلم مغمور، سيقوم المساعد المدعوم بالذكاء الاصطناعي باختلاق حبكة بثقة، أو دمج عناصر من فيلمين متشابهين في الاسم، أو التوصية بفيلم لا تمتلك خدمتك حتى حقوق توزيعه.

عندما لا يكون «جيد بما فيه الكفاية» كافياً في الواقع

في عالم الذكاء الاصطناعي، تُعد الردود غير المثالية من النتائج الجانبية المعروفة للتكنولوجيا التي تستند في استجاباتها إلى الاحتمالات. غير أن روبوتات الدردشة الشائعة تستفيد من ارتباطها بمصادر بيانات خارجية موثوقة (مثل «التأسيس») لدعم ردودها. وهذا ليس مع نموذجات اللغة الكبيرة (LLMs) الخاصة بالمؤسسات. فهي لا تعرف سوى ما تم تدريبها عليه. ونتيجة لذلك، غالبًا ما لا تعرف كيف ترد، أو أنها ببساطة تختلق الإجابات (مثل «الهلوسة»).

على سبيل المثال، كشفت Gracenote حديثة Gracenote أن نماذج اللغة الكبيرة (LLMs) غير المدربة على بيانات محددة تواجه صعوبة في تقديم أي معلومات عن الأفلام التي عُرضت لأول مرة خلال العامين الماضيين، بغض النظر عن إيرادات شباك التذاكر والتغطية التي حظيت بها في المطبوعات الترفيهية الشهيرة. ومن الأمثلة على ذلك أفلام «GOAT» و«Mercy» و«Send Help» و«Solo Mio» و«It Was Just an Accident».

ومع ذلك، فإن مجرد عدم امتلاك نموذج اللغة الكبير (LLM) للإجابة الصحيحة لا يعني أنه سيعترف بعدم معرفته. ففي دراستنا، التي شملت 2,600 من أفضل البرامج التلفزيونية والأفلام في 13 دولة، قام نموذج اللغة الكبير غير المدعوم ببيانات حقيقية باختلاق 100% من المعلومات الواردة في الإجابات الخاصة بـ 506 عنوانًا (20% من العناوين المشمولة في الدراسة).

للحصول على نتائج عالية الجودة، تكمن التفاصيل في البيانات

لربط المشاهدين بما يرغبون في مشاهدته، تحتاج نماذج اللغة الكبيرة (LLMs) إلى ما هو أكثر من المعلومات في الوقت الفعلي والقدرة على مطابقة سمات البيانات الوصفية. وسيتوقف تلبية توقعات العملاء المتزايدة مع تزايد استخدام الذكاء الاصطناعي على قدرة الخدمة على توفير معلومات شاملة حول آلاف العناوين الموجودة ضمن كتالوجات الفيديو الفردية. وفي هذا الصدد، فإن نماذج اللغة الكبيرة غير المدعمة ببيانات لا ترقى إلى مستوى هذه المهمة.

لتقييم الأداء العام لنموذج اللغة الكبير (LLM) غير المرتبط ببيانات مرجعية، قمنا بتعيين درجات جودة للنتائج الكاملة المقدمة لجميع العناوين البالغ عددها 2,600 عنوانًا. وتعكس هذه الدرجات (صفر، منخفضة، متوسطة، وعالية الجودة) مزيجًا من تقييمين منفصلين: مطابقة سمات البيانات الوصفية مع البيانات المرجعية، ودقة الحقائق الواردة في الردود. 

وعلى مستوى العناوين البالغ عددها 2,600 عنوان، كانت النسب الإجمالية للنتائج ذات الجودة الصفرية والمنخفضة والمتوسطة مرتفعة جدًّا، حيث تراوحت بين 77% و91%. ولم يُعتبر سوى أقل من ثلث النتائج ذات جودة عالية. أما في هولندا والمكسيك، فلم يُعتبر سوى أقل من 10% من النتائج ذات جودة عالية.

في ظل تزايد تجزئة المحتوى وإرهاق المستخدمين من الاشتراكات، سيتوقف النجاح في مجال الترفيه المرئي بشكل متزايد على تجربة المستخدم. وفي هذا الصدد، تمتلك نماذج اللغة الكبيرة (LLMs) القدرة على التخفيف من الإحباط المتزايد بشأن اكتشاف المحتوى — ولكن ليس إذا قدمت نتائج سيئة. وفي كثير من الأحيان، لا سيما في حالات الاستخدام المؤسسي، لن تتمكن نماذج اللغة الكبيرة غير المرتكزة على بيانات موثوقة من تقديم النتائج الموثوقة في الوقت الفعلي التي ستحدد معايير النجاح، مع تزايد حجم قوائم المحتوى وزيادة لامركزية التوزيع.

لمزيد من المعلومات، قم بتنزيل دراستنا الحديثة دراستنا الأخيرة حول استجابات نماذج اللغة الكبيرة غير المبررة.

ملاحظة

  1. تعد نماذج اللغة الكبيرة (LLMs) نوعًا من الذكاء الاصطناعي التوليدي الذي يتم تدريبه على كميات هائلة من البيانات لفهم اللغة وتوليدها بطريقة تشبه اللغة البشرية.

أحدث الرؤى

ثغرات في منطق الذكاء الاصطناعي

بدون أساس سليم، لا تستطيع النماذج اللغوية الضخمة تقديم نتائج بحث واكتشاف دقيقة لمشاهدي التلفزيون.

10 يونيو 2026
سيصبح المحتوى الرياضي على خدمات البث حسب الطلب العالمية منافسًا قويًا لمجموعات الأفلام قريبًا

يتجاوز عدد البرامج الرياضية المتوفرة عبر مزودي خدمات الفيديو حسب الطلب (SVOD) العالميين الآن 38.5 ألف برنامج.

28 مايو 2026
الهلوسة: ما هي المخاطر؟

نماذج اللغة الكبيرة (LLMs) بعيدة كل البعد عن الكمال، وفي عالم الترفيه، تظن أنها تعرف أكثر مما تعرفه في الواقع.

29 أبريل 2026

تواصل معنا

املأ النموذج للاتصال بنا!











    255 من 255 حرف (أحرف) متبقية
















    من خلال مشاركة معلومات الاتصال الخاصة بك معنا، فإنك تقر بأنك قد قرأت بيان الخصوصية الخاص بنا وأنك توافق على تلقي اتصالات حول أعمال Gracenote ومنتجات/خدمات الشركة والفعاليات التي قد تهمك. مع ذلك، إذا غيرت رأيك في أي وقت، يمكنك إلغاء اشتراكك في مراسلاتنا باتباع التعليمات الواردة في البريد الإلكتروني الذي تتلقاه منا.

    شكراً لتواصلك معنا!

    لقد تم استلام استفسارك، وفريقنا حريص على مساعدتك. سنقوم بمراجعة رسالتك على الفور والرد عليك في أقرب وقت ممكن.