كشفت شركة مايكروسوفت عن نتائج بحث جديد أجرته بالتعاون مع جامعة ولاية أريزونا، أظهر أن وكلاء الذكاء الاصطناعي الحالية ما زالوا يواجهون صعوبات كبيرة في التعامل مع المهام المعقدة والتعاون الذاتي، رغم التقدم الهائل في قدراتهم.
وأطلقت الشركة بيئة محاكاة جديدة أطلقت عليها اسم "Magentic Marketplace"، وهي منصة تجريبية مصممة لاختبار سلوك وكلاء الذكاء الاصطناعي في بيئات تحاكي الأسواق الحقيقية.
يتفاعل وكلاء العملاء، في هذه البيئة الافتراضية، مع وكلاء يمثلون مطاعم وشركات، حيث يحاول كل منهم الفوز بطلب المستخدم أو تنفيذ مهمة محددة، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".
وشملت التجارب الأولى 100 وكيل عميل مقابل 300 وكيل تجاري، مع إتاحة الشفرة البرمجية للمشروع بشكل مفتوح المصدر لتشجيع الباحثين حول العالم على إعادة الاختبارات أو تطويرها.
وقالت إيس كامار، المديرة التنفيذية لمختبر "AI Frontiers" في "مايكروسوفت": "نريد أن نفهم بعمق كيف سيتغير العالم عندما تبدأ هذه الوكلاء في التفاعل والتفاوض فيما بينها، لأن ذلك سيكون أساس مستقبل الذكاء الاصطناعي."
جاءت نتائج الاختبارات مفاجئة، إذ كشفت عن نقاط ضعف واضحة في عدد من النماذج الرائدة مثل GPT-4o وGPT-5 وGemini 2.5-Flash.
تمكنت بعض الوكلاء التجارية من خداع وكلاء العملاء وإقناعهم بشراء منتجات معينة عبر أساليب تلاعب رقمية بسيطة، ما كشف هشاشة آليات التقييم لدى النماذج.
كما لاحظ الباحثون أن أداء الوكلاء تراجع كلما زادت الخيارات المعروضة عليهم، حيث بدت النماذج "مربكة" وغير قادرة على اتخاذ قرارات فعالة في ظل وفرة المعلومات.
وأوضحت كامار: "كنا نتوقع أن تساعدنا هذه النماذج في التعامل مع كمٍّ كبير من الخيارات، لكن ما وجدناه هو أنها تتشتت وتفقد كفاءتها بسرعة."
كما واجهت النماذج صعوبة في التعاون لتحقيق هدف مشترك، إذ لم تتمكن من تحديد أدوارها بوضوح أثناء العمل الجماعي، وحتى عند إعطائها تعليمات تفصيلية، أظهرت ضعفاً في التنسيق الذاتي، مما يشير إلى حاجة هذه النماذج إلى تطوير قدرات التعاون الفطرية.
وختمت كامار بالقول: "يمكننا أن نوجه هذه النماذج خطوة بخطوة، لكن عندما نختبر قدراتها التعاونية، نتوقع منها أن تملك هذه المهارة دون تدخل بشري مباشر."
ويشير هذا البحث إلى أن الطريق نحو الوكلاء الذكيين المستقلين بالكامل لا يزال طويلاً، وأن الشركات المطورة مطالبة ببناء نماذج أكثر وعياً وسلوكاً إنسانياً قبل أن تصبح هذه الأنظمة قادرة فعلاً على العمل بشكل ذاتي وآمن.