Подобрение на AI агенти с AutoGen 0.4 и интеграция с Magentic-One

AutoGen 0.4: Подобрения и Нови Функции

Microsoft обяви значително обновление на своята open-source рамка за AI агенти, AutoGen, с пускането на версия 0.4. Тази обновена библиотека се отличава с подобрена стабилност на кода, надеждност, гъвкавост и мащабируемост, давайки възможност на разработчиците да създават авангардни, усъвършенствани приложения за AI агенти.

Асинхронни Съобщения

Агентите вече комуникират чрез асинхронни съобщения, което им позволява да продължават със задачите, без да чакат отговори от други агенти. Това е особено полезно за приложения, управлявани от събития, където агентите реагират на специфични тригери. Традиционният модел на заявка/отговор също се поддържа.

Модулност и Разширяемост

Потребителите могат да комбинират персонализирани агенти, инструменти, памет и модели, за да изградят агентски системи, съобразени със специфични бизнес нужди. Това включва регистриране на различни типове агенти и инструменти за постигане на конкретни цели за автоматизация.

Наблюдение и Отстраняване на Грешки

Вградените инструменти за проследяване на показатели, проследяване на съобщения и отстраняване на грешки позволяват наблюдение и контрол на взаимодействията и работните процеси на агентите. Всяка стъпка в работния процес на агента - включително извиквания на големи модели, използване на инструменти, междинни изходи, състояния на паметта и шаблони за подкани - може да бъде ясно записана. Това е от решаващо значение за индустрии, които изискват прецизно проследяване на операциите на агентите, като здравеопазване, право и финанси.

Мащабируемост и Разпределение

Сложни, разпределени агентски мрежи могат да бъдат проектирани да работят безпроблемно през организационни граници. Разпределената архитектура улеснява разполагането на агенти на различни сървъри или облачни платформи, оптимизирайки разпределението и използването на ресурсите.

Вградени и Обществени Разширения

Функционалността на рамката е подобрена чрез разширения, включващи усъвършенствани моделни клиенти, агенти, екипи от много агенти и инструменти за работни процеси на агенти. Обществената поддръжка позволява на разработчиците да управляват свои собствени разширения, създавайки и споделяйки персонализирани агенти или инструменти. Разработчиците могат да използват тези разширения за общи нужди, което намалява сложността на разработката и бариерите.

Кросс-езикова Поддръжка

AutoGen вече поддържа оперативна съвместимост между агенти, написани на различни езици за програмиране, като Python и .NET. Тази функция разширява обхвата на приложение на AutoGen и премахва пречки, произтичащи от езикови различия.

Освен тези нови възможности, Microsoft преструктурира основата на AutoGen, която обхваща ядрото, чата на агента и разширенията. Ядрото служи като основа за управляваната от събития агентска система. Чатът на агента, изграден върху ядрото, включва усъвършенствани API за управление на задачи, групови чатове, изпълнение на код и предварително изградени агенти. Разширенията улесняват интеграциите на трети страни с услуги като Azure code executors и OpenAI модели.

Подобрения в Потребителския Интерфейс

Потребителският интерфейс също претърпя значителни подобрения:

Интерактивна обратна връзка чрез потребителския интерфейс, позволяваща на потребителските агенти да предоставят входни данни и насоки в реално време по време на работата на екипа.
Визуализация на потока от съобщения, представяща интуитивен интерфейс за разбиране на комуникациите на агентите, картографиране на пътищата и зависимостите на съобщенията.
Визуален интерфейс за влачене и пускане, който позволява на потребителите да проектират агенти, като поставят и конфигурират компоненти с техните взаимоотношения и свойства.

Интеграция с Magentic-One

Magentic-One, друг open-source многостепенен общ AI агент от Microsoft, вече е интегриран в AutoGen. Magentic-One има многослойна архитектура, съставена от пет AI агента: Orchestrator, WebSurfer, FileSurfer, Coder и ComputerTerminal. Всеки специализиран агент има свой собствен набор от умения и база знания, което му позволява да работи ефективно в съответната си област. Тези агенти обаче не работят изолирано; Orchestrator координира дейностите им, за да гарантира, че те са последователни и отговарят на общите цели.

Архитектурата на Magentic-One

Orchestrator: Отговаря за планиране на задачи, проследяване на напредъка и възстановяване от грешки. При получаване на задача той анализира изискванията и възлага подзадачи на останалите четири агента.
Специализирани агенти:
- WebBrowserAgent: Обработва уеб сърфиране.
- FileNavigatorAgent: Управлява навигацията в локалната файлова система.
- CodeWriterAgent: Пише и изпълнява фрагменти от Python код.
- ComputerTerminal: Изпълнява команди на ниво операционна система за поддръжка на задачи от по-високо ниво.

Асинхронна и Модулна Работа

Съществена характеристика на архитектурата на Magentic-One е асинхронната работа, управлявана от събития. За разлика от синхронния модел заявка-отговор, асинхронните методи позволяват на системните компоненти да работят едновременно, като получават нови входни данни или задействат действия по всяко време, без да спират други функции. Например, WebBrowserAgent може да започне да зарежда страница, когато Orchestrator му възложи задача, включваща изтегляне и извличане на информация от уеб страница, докато Orchestrator и други агенти продължават с други задачи. След като страницата е заредена и необходимите данни са извлечени, WebBrowserAgent уведомява Orchestrator и връща резултатите. Тази стратегия позволява на Magentic-One да управлява ресурсите по-ефективно, да намалява времето за изчакване и да реагира по-ефективно на сценарии с висока паралелност.

В допълнение към асинхронната си архитектура, Magentic-One се отличава с високомодулен дизайн. Всеки агент е независима функционална единица с ясни отговорности и дефиниции на интерфейса. Този подход опростява изграждането на системата, тъй като разработчиците могат да се съсредоточат върху функцията на един агент, без да се притесняват за детайлите на взаимодействие с други компоненти. Модулността също така насърчава повторната употреба на код и техническото споделяне, което позволява съществуващите агенти да се използват в нови проекти или да се адаптират към различни приложения с минимална модификация. Модулният дизайн на Magentic-One също така осигурява значителна мащабируемост. Нови агенти могат да бъдат добавени или съществуващите агентски функции могат да бъдат актуализирани без големи системни ремонти, тъй като технологията напредва или бизнес изискванията се променят. Например, ако задача в конкретна област стане по-сложна, системата може да бъде подобрена чрез добавяне на специализиран агент.