فيديو: AI21 Maestro: حين يتعلم الوكيل الذكي كيف يقرر بنفسه لتحسين الأداء والتكلفة

تعتمد الأنظمة الوكيلية حاليًا على قواعد ثابتة تهدر الكفاءة. AI21 تقدم Maestro الذي يتعلم التنبؤ بالنجاح والتكلفة والزمن لاتخاذ قرارات تشغيلية ذكية، محققًا نتائج متطورة على المعايير الصعبة.

إذا كنت تعتقد أن بناء وكيل ذكي (Agent) يقتصر على اختيار نموذج لغوي كبير وربطه ببعض الأدوات، فأنت لست وحدك. كثير من المطورين يبدؤون بهذه الطريقة، لكن سرعان ما يكتشفون أن الوكيل يهدر الوقت والمال ويتخذ قرارات بطيئة أو خاطئة. السبب؟ معظم الأنظمة الوكيلية اليوم تعتمد على قواعد ثابتة مكتوبة يدويًا (hardcoded heuristics) لإدارة تدفق التنفيذ — أي نموذج يستخدم؟ أي أداة؟ متى نزيد وقت التفكير؟ هذه القواعد الصلبة تؤدي إلى تسرب في الكفاءة الثلاثية: التكلفة، زمن الاستجابة، والدقة.

مشكلة القواعد الثابتة

في الأنظمة الوكيلية التقليدية، يقرر المطور سلفًا — عبر تعليمات if-else أو قواعد عمل — متى يستخدم نموذجًا ضخمًا أو صغيرًا، أو متى يلجأ إلى اختبار مكثف. لكن الواقع أن كل سياق (مهمة، مدخل، حالة النظام) يختلف، والقاعدة الثابتة لا تستطيع التكيف. النتيجة: إما أن تختار نموذجًا قويًا دائمًا فترتفع التكلفة والزمن، أو تختار نموذجًا ضعيفًا فتنخفض الدقة. هذا ما يُعرف بـ تسرب الكفاءة (efficiency leakage).

AI21 Maestro: قرار ديناميكي مبني على التعلم

في جلسة AI Dev 26 x SF الأخيرة، عرض Or Dagan من AI21 حلاً مختلفًا جذريًا اسمه Maestro. بدلاً من القواعد الثابتة، يعمل Maestro كنظام توجيه (orchestrator) يتعلم — من التجربة — التنبؤ باحتمالات النجاح والتكلفة وزمن الاستجابة لكل إجراء محتمل في كل سياق. الإجراءات قد تشمل: أي نموذج ندعو؟ أي أداة نستخدم؟ هل نزيد وقت التفكير (test-time compute scaling)؟

هذا يعني أن Maestro لا يتبع قواعد جاهزة، بل يبني نموذجًا تنبؤيًا ديناميكيًا يعرف أي مسار في فضاء الإجراءات (action space) من المرجح أن يحقق أفضل توازن بين الدقة والتكلفة والسرعة. عند تنفيذ كل خطوة، ينظر Maestro إلى السياق الحالي ويختار الإجراء الأمثل، وليس الإجراء المحدد مسبقًا.

نتائج متطورة على المعايير الصعبة

بحسب العرض، حقق Maestro نتائج متطورة (state-of-the-art) على معايير وكيلية صعبة، كما وصل إلى حدود باريتو (Pareto frontier) — أي أنه لا يمكن تحسين أي من المقاييس الثلاثة (دقة، تكلفة، زمن) دون التضحية بمقياس آخر. هذا يعني أن Maestro قادر على تقديم أفضل أداء ممكن في ظل القيود الواقعية، وهو ما يصعب تحقيقه بالقواعد الثابتة.

الأثر العملي على المطورين

بالنسبة لمن يبنون تطبيقات وكيلية جاهزة للإنتاج، فإن Maestro يقدم فكرة رئيسية: لا تحاول تصميم كل قرار مسبقًا، بل اجعل النظام يتعلم كيف يتخذ القرار المناسب في الوقت الحقيقي. هذا يقلل الحاجة إلى هندسة القواعد المعقدة، ويحسن كفاءة الموارد بشكل كبير.

لكن النقطة التي تحتاج متابعة: Maestro نفسه يحتاج إلى تدريب على بيانات وكيلية (log التفاعلات) حتى يتعلم التنبؤات. هذا يعني أن المطورين سيحتاجون إلى مرحلة تجميع بيانات أو استخدام نموذج أساسي مدرب مسبقًا. كما لم يوضح العرض بالتفصيل ما إذا كان Maestro متاحًا كخدمة أو كإطار مفتوح المصدر — لذا من المفيد متابعة AI21 للحصول على تفاصيل النشر.

خلاصة عملية

التوجه الجديد الذي يمثله AI21 Maestro يغير طريقة تفكيرنا في تحسين الوكلاء. بدلاً من ضبط القواعد يدويًا (prompt engineering + heuristics)، يمكننا بناء طبقة توجيه ذكية تتعلم وتتكيف. إذا كنت تعمل على وكيل إنتاجي، اسأل نفسك: هل قراري ثابت أم يمكنني جعله يتعلم من السياق؟ الجواب قد يوفر عليك تكاليف غير متوقعة ويحسن تجربة المستخدم النهائي بشكل ملحوظ.

مصدر المقطع

نشر المقطع على قناة DeepLearningAI في YouTube، وتم اختياره لأنه حديث ومرتبط بموضوعات عليها طلب في الذكاء الاصطناعي.