اتهامات جديدة.. هل استخدمت "OpenAI" كتب "O’Reilly" المدفوعة في تدريب نماذجها؟

خبراء ذكاء اصطناعي كشفوا المستور باختبارات بسيطة

المصدر: الرياض - العربية Business
نشر في: آخر تحديث:
وضع القراءة
100% حجم الخط
دقيقتان للقراءة

يواجه عملاق الذكاء الاصطناعي "OpenAI" مجددًا اتهامات باستغلال محتوى محمي بحقوق الطبع والنشر في تدريب نماذجه المتطورة.

فقد كشفت ورقة بحثية حديثة صادرة عن منظمة مراقبة الذكاء الاصطناعي أن "OpenAI" ربما اعتمدت على كتب مدفوعة من "O’Reilly Media" دون الحصول على ترخيص رسمي.

نماذج الذكاء الاصطناعي هي أنظمة تنبؤ متقدمة، تُدرّب على كميات هائلة من البيانات، مثل الكتب والأفلام والمحتوى الإلكتروني، لتتمكن من توليد نصوص ورسومات بناءً على أنماط محددة.

لكن استخدام بيانات غير مصرح بها يثير تساؤلات قانونية وأخلاقية حول ممارسات الشركات المطورة لهذه النماذج، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

دراسة جديدة تكشف المستور

وفقًا للدراسة التي أجراها مشروع إفصاحات الذكاء الاصطناعي، وهي منظمة غير ربحية شارك في تأسيسها الناشر الشهير تيم أوريلي والخبير الاقتصادي إيلان شتراوس، فإن نموذج GPT-4o الخاص بشركة OpenAI أظهر قدرة غير عادية على التعرف على محتوى كتب O’Reilly المدفوعة مقارنةً بالإصدارات السابقة من نماذج الشركة.

وأشارت الورقة البحثية إلى أن شركة O’Reilly لم توقّع أي اتفاقية ترخيص مع OpenAI، مما يزيد من احتمالية استخدام هذه البيانات بشكل غير قانوني.

تقنية متطورة لكشف التجاوزات

استخدم الباحثون تقنية متخصصة تُعرف باسم "هجوم استدلال العضوية" (DE-COP) لكشف ما إذا كان GPT-4o قد دُرّب على نصوص محمية بحقوق الطبع والنشر.

وتبيّن أن هذا النموذج تعرّف على محتوى الكتب المدفوعة بمعدلات أعلى بكثير من نموذج GPT-3.5 Turbo، مما يشير إلى احتمال دمج هذه الكتب في بيانات التدريب.

ردود فعل وتحركات قانونية محتملة

في حين أن الدراسة لا تقدم دليلًا قاطعًا على انتهاك "OpenAI" لحقوق الملكية الفكرية، إلا أنها تثير شكوكًا قوية حول ممارساتها.

وتواجه الشركة بالفعل عدة دعاوى قضائية تتعلق باستخدام بيانات محمية بحقوق النشر في تطوير نماذجها، ما قد يؤدي إلى مزيد من التدقيق القانوني خلال الفترة المقبلة.

استراتيجية "OpenAI" في الحصول على البيانات

على الرغم من هذه الاتهامات، لا تُخفي "OpenAI" سعيها للحصول على بيانات تدريب عالية الجودة، إذ أبرمت بالفعل اتفاقيات مع ناشري أخبار وشبكات تواصل اجتماعي ومؤسسات إعلامية.

كما توفر الشركة آليات للإبلاغ عن المحتوى المحمي، لكنها لا تزال غير كافية لمنع المخاوف المتزايدة بشأن ممارساتها.

الأكثر قراءة مواضيع شائعة

تم اختيار مواضيع "العربية" الأكثر قراءة بناءً على إجمالي عدد المشاهدات اليومية. اقرأ المواضيع الأكثر شعبية كل يوم من هنا.

  • وضع القراءة
    100% حجم الخط