"مايكروسوفت" تكشف ضعف وكلاء الذكاء الاصطناعي في اختبار السوق الافتراضي

واجهوا صعوبات كبيرة في التعامل مع المهام المقعدة

المصدر: الرياض - العربية Business
نشر في: آخر تحديث:
وضع القراءة
100% حجم الخط
دقيقتان للقراءة

كشفت شركة مايكروسوفت عن نتائج بحث جديد أجرته بالتعاون مع جامعة ولاية أريزونا، أظهر أن وكلاء الذكاء الاصطناعي الحالية ما زالوا يواجهون صعوبات كبيرة في التعامل مع المهام المعقدة والتعاون الذاتي، رغم التقدم الهائل في قدراتهم.

وأطلقت الشركة بيئة محاكاة جديدة أطلقت عليها اسم "Magentic Marketplace"، وهي منصة تجريبية مصممة لاختبار سلوك وكلاء الذكاء الاصطناعي في بيئات تحاكي الأسواق الحقيقية.

يتفاعل وكلاء العملاء، في هذه البيئة الافتراضية، مع وكلاء يمثلون مطاعم وشركات، حيث يحاول كل منهم الفوز بطلب المستخدم أو تنفيذ مهمة محددة، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

وشملت التجارب الأولى 100 وكيل عميل مقابل 300 وكيل تجاري، مع إتاحة الشفرة البرمجية للمشروع بشكل مفتوح المصدر لتشجيع الباحثين حول العالم على إعادة الاختبارات أو تطويرها.

وقالت إيس كامار، المديرة التنفيذية لمختبر "AI Frontiers" في "مايكروسوفت": "نريد أن نفهم بعمق كيف سيتغير العالم عندما تبدأ هذه الوكلاء في التفاعل والتفاوض فيما بينها، لأن ذلك سيكون أساس مستقبل الذكاء الاصطناعي."

جاءت نتائج الاختبارات مفاجئة، إذ كشفت عن نقاط ضعف واضحة في عدد من النماذج الرائدة مثل GPT-4o وGPT-5 وGemini 2.5-Flash.

تمكنت بعض الوكلاء التجارية من خداع وكلاء العملاء وإقناعهم بشراء منتجات معينة عبر أساليب تلاعب رقمية بسيطة، ما كشف هشاشة آليات التقييم لدى النماذج.

كما لاحظ الباحثون أن أداء الوكلاء تراجع كلما زادت الخيارات المعروضة عليهم، حيث بدت النماذج "مربكة" وغير قادرة على اتخاذ قرارات فعالة في ظل وفرة المعلومات.

وأوضحت كامار: "كنا نتوقع أن تساعدنا هذه النماذج في التعامل مع كمٍّ كبير من الخيارات، لكن ما وجدناه هو أنها تتشتت وتفقد كفاءتها بسرعة."

كما واجهت النماذج صعوبة في التعاون لتحقيق هدف مشترك، إذ لم تتمكن من تحديد أدوارها بوضوح أثناء العمل الجماعي، وحتى عند إعطائها تعليمات تفصيلية، أظهرت ضعفاً في التنسيق الذاتي، مما يشير إلى حاجة هذه النماذج إلى تطوير قدرات التعاون الفطرية.

وختمت كامار بالقول: "يمكننا أن نوجه هذه النماذج خطوة بخطوة، لكن عندما نختبر قدراتها التعاونية، نتوقع منها أن تملك هذه المهارة دون تدخل بشري مباشر."

ويشير هذا البحث إلى أن الطريق نحو الوكلاء الذكيين المستقلين بالكامل لا يزال طويلاً، وأن الشركات المطورة مطالبة ببناء نماذج أكثر وعياً وسلوكاً إنسانياً قبل أن تصبح هذه الأنظمة قادرة فعلاً على العمل بشكل ذاتي وآمن.

الأكثر قراءة مواضيع شائعة

تم اختيار مواضيع "العربية" الأكثر قراءة بناءً على إجمالي عدد المشاهدات اليومية. اقرأ المواضيع الأكثر شعبية كل يوم من هنا.

  • وضع القراءة
    100% حجم الخط