- Published on
بهروزرسانی عامل هوش مصنوعی مایکروسافت، تغییر شکل عوامل هوشمند با معماری چند سطحی قویتر
نکات برجسته نسخه 0.4 AutoGen
مایکروسافت بهروزرسانی قابل توجهی را برای چارچوب عامل هوش مصنوعی منبع باز خود، AutoGen، با انتشار نسخه 0.4 معرفی کرده است. این کتابخانه بازسازیشده دارای پایداری کد، استحکام، تطبیقپذیری و مقیاسپذیری پیشرفتهای است که توسعهدهندگان را قادر میسازد تا برنامههای عامل هوش مصنوعی پیشرفته و پیشرفتهای ایجاد کنند.
پیامرسانی ناهمزمان: اکنون عوامل با استفاده از پیامرسانی ناهمزمان ارتباط برقرار میکنند و آنها را قادر میسازد بدون انتظار برای پاسخ از سایر عوامل، به انجام وظایف بپردازند. این امر به ویژه برای برنامههای کاربردی مبتنی بر رویداد که در آن عوامل به محرکهای خاص واکنش نشان میدهند مفید است. مدل سنتی درخواست/پاسخ نیز پشتیبانی میشود.
مدولار بودن و قابلیت گسترش: کاربران میتوانند عوامل سفارشی، ابزارها، حافظه و مدلها را برای ساخت سیستمهای عامل متناسب با نیازهای خاص کسبوکار ترکیب کنند. این شامل ثبت انواع مختلف عامل و ابزار برای دستیابی به اهداف اتوماسیون خاص است.
قابلیت مشاهده و اشکالزدایی: ابزارهای داخلی برای ردیابی متریک، ردیابی پیام و اشکالزدایی، نظارت و کنترل تعاملات و گردش کار عامل را امکانپذیر میسازد. هر مرحله در گردش کار یک عامل - از جمله فراخوانهای مدل بزرگ، استفاده از ابزار، خروجیهای میانی، وضعیتهای حافظه و الگوهای سریع - میتواند به وضوح ثبت شود. این برای صنایعی که نیاز به ردیابی دقیق عملیات عامل دارند، مانند مراقبتهای بهداشتی، حقوق و امور مالی، بسیار مهم است.
مقیاسپذیری و توزیع: شبکههای عامل پیچیده و توزیعشده را میتوان بهگونهای طراحی کرد که بهطور یکپارچه در سراسر مرزهای سازمانی عمل کنند. یک معماری توزیعشده استقرار عوامل را در سرورهای مختلف یا پلتفرمهای ابری تسهیل میکند و تخصیص و استفاده از منابع را بهینه میکند.
افزونههای داخلی و انجمن: عملکرد چارچوب با افزونههایی که دارای سرویس گیرندههای مدل پیشرفته، عوامل، تیمهای چند عاملی و ابزارهای گردش کار عامل هستند، افزایش مییابد. پشتیبانی انجمن به توسعهدهندگان اجازه میدهد تا افزونههای خود را مدیریت کنند، عوامل یا ابزارهای سفارشی را ایجاد و به اشتراک بگذارند. توسعه دهندگان می توانند از این افزونه ها برای نیازهای رایج استفاده کنند که پیچیدگی توسعه و موانع را کاهش می دهد.
پشتیبانی بین زبانی: AutoGen اکنون از قابلیت همکاری بین عوامل نوشته شده در زبان های برنامه نویسی مختلف مانند پایتون و دات نت پشتیبانی می کند. این ویژگی دامنه کاربرد AutoGen را گسترش می دهد و موانع ناشی از تفاوت زبان را از بین می برد.
فراتر از این قابلیتهای جدید، مایکروسافت پایه AutoGen را که شامل هسته، چت عامل و افزونهها میشود، بازسازی کرده است. هسته به عنوان پایه سیستم عامل مبتنی بر رویداد عمل می کند. چت عامل، که بر اساس هسته ساخته شده است، دارای API های پیشرفته برای مدیریت وظایف، چت های گروهی، اجرای کد و عوامل از پیش ساخته شده است. افزونه ها ادغام شخص ثالث با خدماتی مانند مجریان کد Azure و مدل های OpenAI را تسهیل می کنند.
بهبود رابط کاربری
رابط کاربری نیز دستخوش پیشرفت های قابل توجهی شده است:
بازخورد تعاملی از طریق رابط کاربری، به عوامل کاربر اجازه می دهد تا در طول عملیات تیمی، ورودی و راهنمایی بلادرنگ ارائه دهند.
تصویرسازی جریان پیام، ارائه یک رابط بصری برای درک ارتباطات عامل، ترسیم مسیرهای پیام و وابستگی ها.
یک رابط کشیدن و رها کردن بصری، که به کاربران اجازه میدهد تا با قرار دادن و پیکربندی اجزا با روابط و ویژگیهای آنها، عوامل را طراحی کنند.
ادغام با Magentic-One
Magentic-One، یکی دیگر از عوامل هوش مصنوعی چند سطحی منبع باز مایکروسافت، اکنون در AutoGen ادغام شده است. Magentic-One دارای معماری چند لایه است که از پنج عامل هوش مصنوعی تشکیل شده است: Orchestrator، WebSurfer، FileSurfer، Coder و ComputerTerminal. هر عامل متخصص مجموعه مهارت ها و پایگاه دانش خاص خود را دارد که به آن اجازه می دهد به طور موثر در زمینه مربوطه خود کار کند. با این حال، این عوامل به صورت جداگانه کار نمی کنند. Orchestrator فعالیت های آنها را هماهنگ می کند تا اطمینان حاصل شود که سازگار هستند و اهداف کلی را برآورده می کنند.
Orchestrator مسئول برنامه ریزی وظایف، ردیابی پیشرفت و بازیابی خطا است. پس از دریافت یک وظیفه، الزامات را به طور کامل تجزیه و تحلیل می کند و وظایف فرعی را به چهار عامل دیگر اختصاص می دهد. این عوامل متخصص در رسیدگی به انواع خاصی از وظایف ماهر هستند. WebBrowser Agent مرور وب را انجام می دهد، FileNavigatorAgent ناوبری سیستم فایل محلی را مدیریت می کند، Code WriterAgent قطعه های کد پایتون را می نویسد و اجرا می کند و ComputerTerminal دستورات سطح سیستم عامل را برای پشتیبانی از وظایف سطح بالاتر اجرا می کند.
یکی از ویژگی های اساسی معماری Magentic-One، عملکرد ناهمزمان مبتنی بر رویداد است. برخلاف مدل همزمان درخواست-پاسخ، روشهای ناهمزمان به مؤلفههای سیستم اجازه میدهند تا بهطور همزمان اجرا شوند، ورودیهای جدید دریافت کنند یا اقدامات را در هر زمان بدون متوقف کردن عملکردهای دیگر فعال کنند. به عنوان مثال، WebBrowserAgent می تواند بارگیری یک صفحه را زمانی شروع کند که Orchestrator وظیفه ای را برای دانلود و استخراج اطلاعات از یک صفحه وب به آن اختصاص می دهد، در حالی که Orchestrator و سایر عوامل به وظایف دیگر ادامه می دهند. هنگامی که صفحه بارگیری شد و داده های مورد نیاز استخراج شد، WebBrowserAgent به Orchestrator اطلاع می دهد و نتایج را برمی گرداند. این استراتژی Magentic-One را قادر می سازد تا منابع را به طور موثرتری مدیریت کند، زمان انتظار را کاهش دهد و به طور موثرتری به سناریوهای همزمانی بالا پاسخ دهد.
علاوه بر معماری ناهمزمان، Magentic-One با طراحی بسیار مدولار خود متمایز می شود. هر عامل یک واحد عملکردی مستقل با مسئولیت ها و تعاریف رابط واضح است. این رویکرد ساخت سیستم را ساده می کند، زیرا توسعه دهندگان می توانند بر عملکرد یک عامل واحد بدون نگرانی در مورد جزئیات تعامل با سایر اجزا تمرکز کنند. مدولار بودن همچنین استفاده مجدد از کد و اشتراک گذاری فنی را ترویج می کند و به عوامل موجود اجازه می دهد تا در پروژه های جدید مورد استفاده قرار گیرند یا با حداقل تغییرات با برنامه های مختلف سازگار شوند. طراحی مدولار Magentic-One همچنین مقیاس پذیری قابل توجهی را فراهم می کند. با پیشرفت فناوری یا تغییر الزامات تجاری، می توان عوامل جدید را اضافه کرد یا عملکردهای عامل موجود را بدون تعمیرات اساسی سیستم به روز کرد. به عنوان مثال، اگر وظیفه ای در یک دامنه خاص پیچیده تر شود، سیستم را می توان با اضافه کردن یک عامل تخصصی افزایش داد.