Published on

به‌روزرسانی عامل هوش مصنوعی مایکروسافت، تغییر شکل عوامل هوشمند با معماری چند سطحی قوی‌تر

نویسندگان
  • avatar
    نام
    Ajax
    Twitter

نکات برجسته نسخه 0.4 AutoGen

مایکروسافت به‌روزرسانی قابل توجهی را برای چارچوب عامل هوش مصنوعی منبع باز خود، AutoGen، با انتشار نسخه 0.4 معرفی کرده است. این کتابخانه بازسازی‌شده دارای پایداری کد، استحکام، تطبیق‌پذیری و مقیاس‌پذیری پیشرفته‌ای است که توسعه‌دهندگان را قادر می‌سازد تا برنامه‌های عامل هوش مصنوعی پیشرفته و پیشرفته‌ای ایجاد کنند.

  • پیام‌رسانی ناهمزمان: اکنون عوامل با استفاده از پیام‌رسانی ناهمزمان ارتباط برقرار می‌کنند و آنها را قادر می‌سازد بدون انتظار برای پاسخ از سایر عوامل، به انجام وظایف بپردازند. این امر به ویژه برای برنامه‌های کاربردی مبتنی بر رویداد که در آن عوامل به محرک‌های خاص واکنش نشان می‌دهند مفید است. مدل سنتی درخواست/پاسخ نیز پشتیبانی می‌شود.

  • مدولار بودن و قابلیت گسترش: کاربران می‌توانند عوامل سفارشی، ابزارها، حافظه و مدل‌ها را برای ساخت سیستم‌های عامل متناسب با نیازهای خاص کسب‌وکار ترکیب کنند. این شامل ثبت انواع مختلف عامل و ابزار برای دستیابی به اهداف اتوماسیون خاص است.

  • قابلیت مشاهده و اشکال‌زدایی: ابزارهای داخلی برای ردیابی متریک، ردیابی پیام و اشکال‌زدایی، نظارت و کنترل تعاملات و گردش کار عامل را امکان‌پذیر می‌سازد. هر مرحله در گردش کار یک عامل - از جمله فراخوان‌های مدل بزرگ، استفاده از ابزار، خروجی‌های میانی، وضعیت‌های حافظه و الگوهای سریع - می‌تواند به وضوح ثبت شود. این برای صنایعی که نیاز به ردیابی دقیق عملیات عامل دارند، مانند مراقبت‌های بهداشتی، حقوق و امور مالی، بسیار مهم است.

  • مقیاس‌پذیری و توزیع: شبکه‌های عامل پیچیده و توزیع‌شده را می‌توان به‌گونه‌ای طراحی کرد که به‌طور یکپارچه در سراسر مرزهای سازمانی عمل کنند. یک معماری توزیع‌شده استقرار عوامل را در سرورهای مختلف یا پلتفرم‌های ابری تسهیل می‌کند و تخصیص و استفاده از منابع را بهینه می‌کند.

  • افزونه‌های داخلی و انجمن: عملکرد چارچوب با افزونه‌هایی که دارای سرویس گیرنده‌های مدل پیشرفته، عوامل، تیم‌های چند عاملی و ابزارهای گردش کار عامل هستند، افزایش می‌یابد. پشتیبانی انجمن به توسعه‌دهندگان اجازه می‌دهد تا افزونه‌های خود را مدیریت کنند، عوامل یا ابزارهای سفارشی را ایجاد و به اشتراک بگذارند. توسعه دهندگان می توانند از این افزونه ها برای نیازهای رایج استفاده کنند که پیچیدگی توسعه و موانع را کاهش می دهد.

  • پشتیبانی بین زبانی: AutoGen اکنون از قابلیت همکاری بین عوامل نوشته شده در زبان های برنامه نویسی مختلف مانند پایتون و دات نت پشتیبانی می کند. این ویژگی دامنه کاربرد AutoGen را گسترش می دهد و موانع ناشی از تفاوت زبان را از بین می برد.

فراتر از این قابلیت‌های جدید، مایکروسافت پایه AutoGen را که شامل هسته، چت عامل و افزونه‌ها می‌شود، بازسازی کرده است. هسته به عنوان پایه سیستم عامل مبتنی بر رویداد عمل می کند. چت عامل، که بر اساس هسته ساخته شده است، دارای API های پیشرفته برای مدیریت وظایف، چت های گروهی، اجرای کد و عوامل از پیش ساخته شده است. افزونه ها ادغام شخص ثالث با خدماتی مانند مجریان کد Azure و مدل های OpenAI را تسهیل می کنند.

بهبود رابط کاربری

رابط کاربری نیز دستخوش پیشرفت های قابل توجهی شده است:

  • بازخورد تعاملی از طریق رابط کاربری، به عوامل کاربر اجازه می دهد تا در طول عملیات تیمی، ورودی و راهنمایی بلادرنگ ارائه دهند.

  • تصویرسازی جریان پیام، ارائه یک رابط بصری برای درک ارتباطات عامل، ترسیم مسیرهای پیام و وابستگی ها.

  • یک رابط کشیدن و رها کردن بصری، که به کاربران اجازه می‌دهد تا با قرار دادن و پیکربندی اجزا با روابط و ویژگی‌های آنها، عوامل را طراحی کنند.

ادغام با Magentic-One

Magentic-One، یکی دیگر از عوامل هوش مصنوعی چند سطحی منبع باز مایکروسافت، اکنون در AutoGen ادغام شده است. Magentic-One دارای معماری چند لایه است که از پنج عامل هوش مصنوعی تشکیل شده است: Orchestrator، WebSurfer، FileSurfer، Coder و ComputerTerminal. هر عامل متخصص مجموعه مهارت ها و پایگاه دانش خاص خود را دارد که به آن اجازه می دهد به طور موثر در زمینه مربوطه خود کار کند. با این حال، این عوامل به صورت جداگانه کار نمی کنند. Orchestrator فعالیت های آنها را هماهنگ می کند تا اطمینان حاصل شود که سازگار هستند و اهداف کلی را برآورده می کنند.

Orchestrator مسئول برنامه ریزی وظایف، ردیابی پیشرفت و بازیابی خطا است. پس از دریافت یک وظیفه، الزامات را به طور کامل تجزیه و تحلیل می کند و وظایف فرعی را به چهار عامل دیگر اختصاص می دهد. این عوامل متخصص در رسیدگی به انواع خاصی از وظایف ماهر هستند. WebBrowser Agent مرور وب را انجام می دهد، FileNavigatorAgent ناوبری سیستم فایل محلی را مدیریت می کند، Code WriterAgent قطعه های کد پایتون را می نویسد و اجرا می کند و ComputerTerminal دستورات سطح سیستم عامل را برای پشتیبانی از وظایف سطح بالاتر اجرا می کند.

یکی از ویژگی های اساسی معماری Magentic-One، عملکرد ناهمزمان مبتنی بر رویداد است. برخلاف مدل همزمان درخواست-پاسخ، روش‌های ناهمزمان به مؤلفه‌های سیستم اجازه می‌دهند تا به‌طور همزمان اجرا شوند، ورودی‌های جدید دریافت کنند یا اقدامات را در هر زمان بدون متوقف کردن عملکردهای دیگر فعال کنند. به عنوان مثال، WebBrowserAgent می تواند بارگیری یک صفحه را زمانی شروع کند که Orchestrator وظیفه ای را برای دانلود و استخراج اطلاعات از یک صفحه وب به آن اختصاص می دهد، در حالی که Orchestrator و سایر عوامل به وظایف دیگر ادامه می دهند. هنگامی که صفحه بارگیری شد و داده های مورد نیاز استخراج شد، WebBrowserAgent به Orchestrator اطلاع می دهد و نتایج را برمی گرداند. این استراتژی Magentic-One را قادر می سازد تا منابع را به طور موثرتری مدیریت کند، زمان انتظار را کاهش دهد و به طور موثرتری به سناریوهای همزمانی بالا پاسخ دهد.

علاوه بر معماری ناهمزمان، Magentic-One با طراحی بسیار مدولار خود متمایز می شود. هر عامل یک واحد عملکردی مستقل با مسئولیت ها و تعاریف رابط واضح است. این رویکرد ساخت سیستم را ساده می کند، زیرا توسعه دهندگان می توانند بر عملکرد یک عامل واحد بدون نگرانی در مورد جزئیات تعامل با سایر اجزا تمرکز کنند. مدولار بودن همچنین استفاده مجدد از کد و اشتراک گذاری فنی را ترویج می کند و به عوامل موجود اجازه می دهد تا در پروژه های جدید مورد استفاده قرار گیرند یا با حداقل تغییرات با برنامه های مختلف سازگار شوند. طراحی مدولار Magentic-One همچنین مقیاس پذیری قابل توجهی را فراهم می کند. با پیشرفت فناوری یا تغییر الزامات تجاری، می توان عوامل جدید را اضافه کرد یا عملکردهای عامل موجود را بدون تعمیرات اساسی سیستم به روز کرد. به عنوان مثال، اگر وظیفه ای در یک دامنه خاص پیچیده تر شود، سیستم را می توان با اضافه کردن یک عامل تخصصی افزایش داد.