IBM Research تطلق معيارًا مفتوحًا لمقارنة وكلاء الذكاء الاصطناعي: الجودة والتكلفة معًا
معيار Open Agent Leaderboard الجديد من IBM Research يقيس أداء أنظمة الوكلاء الكاملة وليس النماذج فقط، مع الإفصاح عن التكلفة لكل مهمة. النتائج الأولية تظهر أن اختيار الوكيل (Agent) لا يقل أهمية عن اختيار النموذج.