بساطة تطوير الوكيل في Anthropic تتفوق على التعقيد

تعريف الوكيل الذكي

تتعدد مفاهيم الوكلاء الأذكياء، حيث يراها البعض بمثابة "مدبرة منزل شاملة" قادرة على التفكير بشكل مستقل، واتخاذ القرارات الذاتية، واستخدام الأدوات لإنجاز المهام المعقدة. بينما يرى البعض الآخر أنها "موظفة ملتزمة" تنفذ إجراءات عمل محددة مسبقًا. تصنف شركة Anthropic كلا هذين النوعين تحت مسمى الأنظمة الذكية، مع التمييز بين تدفقات العمل والوكلاء الأذكياء:

تدفقات العمل: هي أنظمة تقوم بتنظيم نماذج اللغة الكبيرة (LLM) والأدوات من خلال مسارات كود محددة مسبقًا.
الوكلاء الأذكياء: هي أنظمة تقوم فيها نماذج اللغة الكبيرة (LLM) بتوجيه عملياتها واستخدام الأدوات بشكل ديناميكي، مما يتيح لها التحكم الذاتي في كيفية إنجاز المهام.

متى يتم اختيار الوكيل الذكي؟

تنصح شركة Anthropic باتباع مبدأ "البساطة أولاً" عند تطوير تطبيقات الذكاء الاصطناعي. ليس من الضروري بناء أنظمة ذكية معقدة في جميع الحالات. على الرغم من قوة الأنظمة الذكية، إلا أنها قد تؤدي إلى إبطاء الاستجابة وزيادة التكاليف. يجب على المطورين الموازنة بين الوظائف والكفاءة.

تدفقات العمل: مناسبة للمهام الواضحة التي تتطلب إمكانية التنبؤ والاتساق.
الوكلاء الأذكياء: أكثر ملاءمة للمشاهد الكبيرة التي تتطلب المرونة واتخاذ القرارات المدفوعة بالنموذج.

في العديد من التطبيقات، يكفي استخدام مطالبات جيدة مع البحث وأمثلة السياق، وتوجيه الأسئلة مباشرة إلى النموذج الكبير.

استخدام الأطر

تتوفر حاليًا العديد من الأطر التي تساعد المطورين على بناء وكلاء الذكاء الاصطناعي، مثل:

LangGraph من LangChain
إطار عمل AI Agent من Amazon Bedrock
أداة بناء تدفقات عمل النماذج الكبيرة بالسحب والإفلات Rivet
أداة GUI لبناء واختبار تدفقات العمل المعقدة Vellum

تعمل هذه الأطر على تبسيط عملية التطوير، ولكنها تزيد أيضًا من طبقات التجريد في الكود، مما يجعل المنطق الأساسي أقل شفافية، ويزيد من صعوبة التصحيح، وقد يؤدي إلى إدخال حلول معقدة بشكل مفرط في سيناريوهات بسيطة.

تقترح Anthropic أن يبدأ المطورون باستخدام واجهات برمجة التطبيقات (API) الخاصة بالنماذج الكبيرة مباشرةً. يمكن تحقيق العديد من الأنماط ببضعة أسطر من التعليمات البرمجية فقط. إذا تم اختيار استخدام إطار عمل، فمن الضروري فهم مبادئه الأساسية. يعد الفهم غير الكافي للآليات الأساسية للإطار سببًا رئيسيًا لمشاكل التطوير.

يوفر كتاب الطبخ الخاص بـ Anthropic أمثلة محددة.

وحدات البناء وتدفقات العمل والوكلاء الأذكياء

وحدات البناء الأساسية: نماذج لغة كبيرة محسنة

الوحدة الأساسية لبناء الأنظمة الذكية هي نماذج اللغة الكبيرة المحسنة، التي تمتلك قدرات مثل البحث والذاكرة. يمكن لنماذج Anthropic استخدام هذه القدرات بشكل فعال، مثل إنشاء استعلامات البحث، واختيار الأدوات، وتحديد المعلومات التي يجب الاحتفاظ بها.

عند توسيع الوظائف، يجب التركيز على:

تخصيص الوظائف وفقًا لسيناريو التطبيق المحدد.
ضمان توفير واجهات بسيطة وذات وثائق كاملة للنموذج.

يعمل بروتوكول سياق النموذج الذي أصدرته Anthropic مؤخرًا على تبسيط تكامل نماذج الذكاء الاصطناعي مع نظام الأدوات التابع لجهات خارجية.

تدفقات العمل: سلاسل المطالبات

تقوم سلاسل المطالبات بتقسيم المهام المعقدة إلى خطوات متعددة، حيث تستدعي كل خطوة نموذجًا كبيرًا مرة واحدة، وتعتمد الخطوات اللاحقة على نتائج الخطوة السابقة. يمكن للمطورين إضافة نقاط تفتيش في المراحل المتوسطة لضمان سير العملية كما هو متوقع.

تعتبر سلاسل المطالبات مناسبة للسيناريوهات التي يمكن فيها تقسيم المهام المعقدة بوضوح إلى سلسلة من المهام الفرعية الثابتة. يركز كل نموذج على إكمال مهمة بسيطة، وعلى الرغم من أن وقت الاستجابة الإجمالي قد يكون أطول قليلاً، إلا أن الدقة ستتحسن بشكل ملحوظ.

أمثلة نموذجية:

إنشاء نسخة تسويقية أولاً، ثم ترجمتها إلى لغات أخرى.
كتابة مخطط تفصيلي للمستند وإجراء فحص للامتثال، ثم كتابة المستند الكامل بناءً على المخطط التفصيلي.

تدفقات العمل: التوجيه الذكي

تحدد تقنية التوجيه نوع المهمة المدخلة، وتخصصها للوحدة النمطية المناسبة. يتيح هذا التصميم لكل وحدة نمطية أن تكون مُحسَّنة لمهمة معينة، مما يتجنب التداخل بين أنواع المهام المختلفة. يعتبر التوجيه الذكي مناسبًا للسيناريوهات التي توجد فيها خصائص تصنيف واضحة للمهام. يمكن لنظام الذكاء الاصطناعي استخدام نموذج لغة كبير أو خوارزميات تقليدية لتحديد نوع المهمة بدقة وتوجيهها.

أمثلة نموذجية:

في أنظمة خدمة العملاء، يتم توجيه الاستفسارات العامة، وطلبات استرداد الأموال، والدعم الفني إلى العمليات المناسبة.
يتم تخصيص المشكلات البسيطة والشائعة للنماذج الأصغر، بينما يتم تخصيص المشكلات الصعبة والنادرة للنماذج الأكثر قوة، لتحسين التكلفة والسرعة.

تدفقات العمل: التوازي

يمكن لنماذج اللغة الكبيرة معالجة المهام في وقت واحد، وتجميع المخرجات برمجيًا. خصائص تدفق العمل المتوازي:

تقسيم المهام: تقسيم المهام إلى مهام فرعية يمكن تشغيلها بالتوازي، ثم دمج النتائج في النهاية.
آلية التصويت: تشغيل المهمة نفسها عدة مرات، واختيار أفضل نتيجة أو دمج إجابات متعددة.

تعتبر الطريقة المتوازية فعالة للغاية عندما يمكن تنفيذ المهام الفرعية بالتوازي لزيادة السرعة، أو عندما تكون هناك حاجة إلى محاولات متعددة الزوايا للحصول على نتائج أكثر ثقة. بالنسبة للمهام المعقدة، فإن جعل كل استدعاء يركز على معالجة جانب معين سيحقق نتائج أفضل.

أمثلة نموذجية:

تقسيم المهام:
- الحماية الأمنية: يعالج نموذج واحد طلب المستخدم، بينما يقوم نموذج آخر بمراجعة المحتوى.
- تقييم الأداء: تقييم نماذج مختلفة لمؤشرات أداء النظام.
آلية التصويت:
- فحص أمان الكود: تكتشف نماذج فحص متعددة ثغرات الكود معًا.
- مراجعة المحتوى: تقوم نماذج متعددة بتقييم سلامة المحتوى من زوايا مختلفة.

تدفقات العمل: القائد - المنفذ

يقوم نموذج لغة كبير مركزي بتقسيم المهام بشكل ديناميكي، وتخصيصها لنماذج التنفيذ، وتلخيص النتائج.

يكون تدفق العمل هذا مناسبًا للمهام المعقدة التي يصعب تحديد خطواتها المحددة مسبقًا. تقسيم المهام ليس ثابتًا، ولكن يتم تحديده ديناميكيًا بواسطة نظام الذكاء الاصطناعي وفقًا للحالة.

أمثلة نموذجية:

تطبيقات البرمجة التي تتطلب إجراء تعديلات معقدة على ملفات متعددة.
مهام البحث التي تتطلب جمع وتحليل المعلومات ذات الصلة من مصادر متعددة.

تدفقات العمل: التقييم - التحسين

يستدعي نموذج لغة كبير (LLM) لإنشاء استجابة، ويقدم نموذج آخر تقييمًا وملاحظات، مما يشكل حلقة.

يكون تدفق العمل هذا فعالًا بشكل خاص عندما توجد معايير تقييم واضحة، وعندما يمكن أن يحقق التحسين التكراري قيمة كبيرة. يمكن لنموذج اللغة الكبير (LLM) تقديم ملاحظات، على غرار عملية المراجعة المتكررة التي يقوم بها الكتاب البشريون.

أمثلة نموذجية:

الترجمة الأدبية: يقوم نموذج التقييم باكتشاف الاختلافات اللغوية التي فاتتها الترجمة وتقديم اقتراحات للتعديل.
البحث المعقد: يحدد نموذج التقييم ما إذا كانت هناك حاجة إلى مواصلة البحث المتعمق.

الوكلاء الأذكياء

ظهر الوكلاء الأذكياء مع نضوج نماذج اللغة الكبيرة في القدرات الرئيسية مثل فهم المدخلات المعقدة، والتفكير التخطيطي، واستخدام الأدوات، واستعادة الأخطاء.

يبدأ عمل الوكيل الذكي بأمر أو مناقشة تفاعلية من المستخدم البشري. بمجرد تحديد المهمة، يخطط الوكيل الذكي ويعمل بشكل مستقل، وقد يحتاج إلى طلب المزيد من المعلومات من البشر أو السماح للبشر باتخاذ قرارات.

في كل خطوة من خطوات التنفيذ، من الضروري الحصول على "الحقيقة" من البيئة. يمكن للوكيل الذكي التوقف عند نقاط التفتيش أو عند مواجهة عوائق للحصول على ملاحظات بشرية. عادةً ما تنتهي المهام عند الانتهاء، ولكنها تتضمن أيضًا شروط توقف.

يمكن للوكلاء الأذكياء التعامل مع المهام المعقدة، ولكن تنفيذها عادةً ما يكون بسيطًا، وعادةً ما يكون مجرد نموذج لغة كبير يستخدم الأدوات في حلقة بناءً على التعليقات البيئية. لذلك، فإن تصميم مجموعة الأدوات وتوثيقها بشكل واضح وشامل أمر بالغ الأهمية.

الوكلاء الأذكياء مناسبون للمشكلات المفتوحة، التي يصعب التنبؤ بعدد الخطوات المطلوبة فيها، ولا يمكن ترميز المسارات الثابتة فيها. تجعل الاستقلالية الذاتية للوكلاء الأذكياء خيارًا مثاليًا لتوسيع نطاق المهام في بيئة موثوق بها. تعني الاستقلالية الذاتية للوكلاء الأذكياء تكاليف أعلى، وقد يكون هناك خطر تراكم الأخطاء. يوصى بإجراء اختبارات مكثفة في بيئة الاختبار المعزولة، ووضع تدابير حماية مناسبة.

أمثلة على تطبيقات الوكلاء الأذكياء:

وكيل كود لحل مهام SWE-bench التي تتضمن تحرير ملفات متعددة بناءً على وصف المهمة.
وظيفة "استخدام الكمبيوتر" في Anthropic، حيث يستخدم Claude الكمبيوتر لإكمال المهام.

التجميع والتخصيص

هذه الوحدات ليست إلزامية، ويمكن للمطورين تشكيلها ودمجها وفقًا لحالات الاستخدام. يكمن مفتاح النجاح في قياس الأداء وتحقيق التحسين التكراري. لا ينبغي التفكير في إضافة التعقيد إلا عندما تكون الحلول الأبسط غير قابلة للتحقيق. لا يكمن النجاح في مجال نماذج اللغة الكبيرة في بناء الأنظمة الأكثر تعقيدًا، بل في بناء الأنظمة التي تناسب الاحتياجات. ابدأ بمطالبات بسيطة، وحسِّنها بتقييمات شاملة، وأضف أنظمة الوكلاء الذكية متعددة الخطوات فقط عندما تكون الحلول الأبسط غير قابلة للتحقيق.

عند نشر الوكلاء الأذكياء، يجب اتباع المبادئ التالية:

الحفاظ على بساطة تصميم الوكيل الذكي.
إعطاء الأولوية لضمان شفافية الوكيل الذكي، مع عرض كل خطوة مخطط لها بوضوح.
تصميم واجهة الوكيل الذكي - الكمبيوتر (ACI) بعناية من خلال توثيق شامل للأدوات والاختبارات.