"ديب سيك" تكشف عن طريقة ترشيحها للبيانات وتدريب نماذجها

تحذر من مخاطر الهلوسة والإساءة

المصدر: الرياض - العربية Business
نشر في: آخر تحديث:
وضع القراءة
100% حجم الخط
4 دقائق للقراءة

كشفت شركة الذكاء الاصطناعي الصينية الناشئة "ديب سيك" النقاب عن كيفية ترشيحها للبيانات لتدريب نماذجها، مُثيرةً بذلك مخاوف بشأن مخاطر "الهلوسة" و"الإساءة".

وفي وثيقة نُشرت يوم الاثنين، صرّحت الشركة الناشئة، ومقرها هانغتشو، بأنها "لطالما أولت أمن الذكاء الاصطناعي الأولوية"، وقررت الإفصاح عن هذه المعلومات لمساعدة الناس على استخدام نماذجها، في وقت تُكثّف فيه بكين الرقابة على هذا القطاع.

وأضافت الشركة أن البيانات في مرحلة ما قبل التدريب جُمعت "بشكل رئيسي" من معلومات متاحة للجمهور على الإنترنت، بالإضافة إلى بيانات جهات خارجية مُصرّح لها، وأن "ديب سيك" لم تكن تنوي جمع أي بيانات شخصية، بحسب تقرير نشره موقع "scmp" واطلعت عليه "العربية Business".

قالت شركة ديب سيك بأنها طبقت فلاتر آلية لإزالة البيانات الخام التي تحتوي على "خطاب كراهية، وإباحية، وعنف، ورسائل غير مرغوب فيها، ومحتويات قد تنتهك حقوق الملكية الفكرية".

وفي الوقت نفسه، طبقت الشركة كشفًا خوارزميًا مع مراجعة بشرية لتحديد "التحيزات الإحصائية الكامنة في مجموعات البيانات واسعة النطاق" لتخفيف تأثيرها على قيم النماذج.

وأكدت الشركة، التي أسسها عالم الحاسوب ليانغ وينفنغ، التزامها بتقليل "الوهم" في نماذجها من خلال البحث وتقنيات مثل التوليد المعزز بالاسترجاع، لكنها أضافت أن هذه المشكلة لا تزال "لا مفر منها".

وقالت الشركة: "لا يزال الذكاء الاصطناعي في مراحله الأولى، والتكنولوجيا لا تزال غير ناضجة... في هذه المرحلة، لا يمكننا ضمان عدم تسبب نماذجنا في هلوسات".

وأكدت الشركة أن نماذجها تتنبأ بالإجابات بدلاً من استرجاعها بناءً على توجيهات المستخدم.

وُجهت انتقادات لشركات الذكاء الاصطناعي، مثل "OpenAI" و"ديب سيك" بسبب هلوسات روبوتات الدردشة الخاصة بها، حيث تُنتج نتائج غير صحيحة أو مضللة.

ومع ازدياد قوة نماذج الذكاء الاصطناعي الأساسية، برزت بعض المخاوف بشأن احتمالية الإصابة بالذهان الناجم عن الذكاء الاصطناعي، بالإضافة إلى مشاكل أخرى ناجمة عن الاعتماد المفرط على روبوتات الدردشة.

تعرّضت شركة ديب سيك لانتقادات محلية بسبب ارتفاع معدلات الهلوسة لديها، كما أن ظهور نماذج بديلة قد أضعف شعبيتها.

ووفقًا لموقع "Aicpb"، الذي يتتبع شعبية منتجات الذكاء الاصطناعي، انخفض عدد الزيارات الشهرية لموقع "ديب سيك" على مدار خمسة أشهر متتالية، ليصل إجماليها إلى 345 مليون زيارة في يوليو.

تزامن هذا الانخفاض في عدد المستخدمين مع فضائح معلومات مضللة بارزة. ففي أوائل يوليو، انتشرت شائعة على الإنترنت مفادها أن روبوت الدردشة الخاص بشركة ديب سيك قد شهّر بشخصية صينية مشهورة.

في منشور على "وي شات"، ذكرت شركة ديب سيك أنها تسعى لمعالجة "الارتباك العام، والتعريف الخاطئ، والمعلومات المضللة" من خلال تصنيف المحتوى المُولّد بواسطة الذكاء الاصطناعي، مع منع المستخدمين من "حذف أو التلاعب أو تزوير أو إخفاء تصنيفات هذا المحتوى المُولّد بشكل خبيث".

وقال جلعاد أبيري، أستاذ القانون المشارك في كلية القانون العابر للحدود الوطنية بجامعة بكين، إن "ديب سيك" كنموذج رائد يعتمد على النصوص فقط، ستكون حالة مثيرة للاهتمام تستحق المتابعة.

قال: "نسخ النص البسيط يُلغي أي بيانات وصفية - النص المُصدَّر فقط هو الذي يحتفظ بالوسم". "هذا يجعل الوسم أقل فعالية في سياق روبوتات الدردشة، حيث يُمثل تعديل المحتوى التحدي الرئيسي".

جميع نماذج الذكاء الاصطناعي الصينية الرائدة تقريبًا مفتوحة المصدر، مما يعني أنها متاحة للجميع للاستخدام والتعديل والتوزيع.

إلى جانب الهلوسة، حددت "ديب سيك" إساءة استخدام الذكاء الاصطناعي كفئة خطر أخرى.

وحددت تحديدًا قضايا الخصوصية، وانتهاك حقوق النشر، وأمن البيانات، وسلامة المحتوى، والتحيز والتمييز.

في حين أن الذكاء الاصطناعي بحد ذاته تقنية محايدة، إلا أن مخاطره تنبع من تطبيقه العملي، ويجب مراعاتها في سياقات تطبيقه والغرض المقصود منه، كما ذكرت الشركة، مضيفةً أنها تعمل على تقليل هذه المخاطر.

قال سكوت سينجر، الباحث الزائر في برنامج التكنولوجيا والشؤون الدولية في مؤسسة كارنيغي للسلام الدولي، بأن وثيقة "ديب سيك" تتوافق مع معظم آراء الصناعة الصينية بشأن مخاطر سلامة الذكاء الاصطناعي الرائدة، من حيث تركيزها على المخاطر قصيرة المدى وقضايا خصوصية البيانات بدلاً من المخاطر الكارثية.

الأكثر قراءة مواضيع شائعة

تم اختيار مواضيع "العربية" الأكثر قراءة بناءً على إجمالي عدد المشاهدات اليومية. اقرأ المواضيع الأكثر شعبية كل يوم من هنا.

  • وضع القراءة
    100% حجم الخط