فتحت شركتا "OpenAI" و"أنثروبيك" نماذجهما المدعومة بالذكاء الاصطناعي لفترة وجيزة أمام اختبارات سلامة مشتركة، في محاولة لتقييم المخاطر وتعزيز الشفافية.
وقال فويتشيك زاريمبا، المؤسس المشارك لـ "OpenAI"، إن الصناعة دخلت مرحلة حاسمة، حيث يستخدم ملايين الأشخاص يوميًا هذه النماذج، مؤكدًا الحاجة إلى معايير موحدة للسلامة رغم المنافسة الشديدة على المواهب والموارد.
التقرير البحثي الذي نُشر الأربعاء كشف عن تعاون محدود، منح خلاله كل طرف الآخر وصولًا إلى واجهة برمجة التطبيقات (API) الخاصة بنماذجه، باستثناء نموذج GPT-5 الذي لم يُطرح بعد، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".
ولكن قامت "أنثروبيك" أنهت سريعًا وصول فريق "OpenAI" بدعوى انتهاك شروط الاستخدام، وهو ما نفاه زاريمبا، مؤكدًا أن حدة المنافسة ستبقى قائمة حتى مع وجود تعاون في مجالات السلامة.
نتائج مقلقة حول الهلوسة والتملق
الاختبارات أظهرت تباينًا في أداء النماذج: إذ رفضت نماذج "كلود" التابعة لـ "أنثروبيك" الإجابة على أسئلة بنسبة تصل إلى 70% عند غياب المعلومات الكافية، مقابل معدلات رفض أقل بكثير لدى نماذج "OpenAI"، لكنها وقعت في فخ "الهلوسة" عبر تقديم إجابات غير دقيقة.
كما برزت مشكلة أخرى وُصفت بـ"التملق"، حيث أظهرت بعض النماذج استعدادًا لتأييد سلوكيات خطرة أو مضطربة لإرضاء المستخدم، وهو ما أثار مخاوف إضافية بشأن الاستخدام الآمن لهذه التكنولوجيا.
قضية قضائية تزيد الضغوط
تزامنت الأبحاث مع دعوى قضائية رفعها والدان ضد "OpenAI"، اتهما فيها شات جي بي تي بتقديم نصائح ساهمت في انتحار ابنهما البالغ من العمر 16 عامًا.
الحادثة اعتُبرت مثالًا مأساويًا على مخاطر "التملق" غير المنضبط في روبوتات الدردشة.
شدد زاريمبا على أن المستقبل يجب أن يشمل تعاونًا أعمق بين المختبرات الرائدة لاختبار النماذج القادمة، فيما أكد نيكولاس كارليني، باحث السلامة في "أنثروبيك"، أن الشركة تسعى لتوسيع نطاق هذا التعاون بشكل منتظم.
من جهتها أعلنت "OpenAI" أنها حسّنت أداء نماذجها في النسخة الجديدة GPT-5، خصوصًا في التعامل مع قضايا الصحة النفسية وحالات الطوارئ.