Aktualizacja Microsoft Open AI Agent Przekształca Inteligentne Agenty Wielopoziomowa Silniejsza Architektura

AutoGen 0.4 - Najważniejsze Cechy Nowej Wersji

Microsoft ogłosił znaczącą aktualizację swojego otwartego frameworku AI Agent, AutoGen, wraz z wydaniem wersji 0.4. Ta odświeżona biblioteka charakteryzuje się zwiększoną stabilnością kodu, solidnością, wszechstronnością i skalowalnością, umożliwiając programistom tworzenie najnowocześniejszych, zaawansowanych aplikacji AI Agent.

Asynchroniczne Przesyłanie Wiadomości

Agenci teraz komunikują się za pomocą asynchronicznego przesyłania wiadomości, co pozwala im na kontynuowanie zadań bez oczekiwania na odpowiedzi od innych agentów. Jest to szczególnie korzystne w przypadku aplikacji sterowanych zdarzeniami, gdzie agenci reagują na określone wyzwalacze. Tradycyjny model żądanie/odpowiedź jest również obsługiwany.

Modułowość i Rozszerzalność

Użytkownicy mogą łączyć niestandardowych agentów, narzędzia, pamięć i modele, aby budować systemy agentów dostosowane do konkretnych potrzeb biznesowych. Obejmuje to rejestrowanie różnych typów agentów i narzędzi w celu osiągnięcia określonych celów automatyzacji.

Obserwowalność i Debugowanie

Wbudowane narzędzia do śledzenia metryk, śledzenia wiadomości i debugowania umożliwiają monitorowanie i kontrolowanie interakcji agentów i przepływów pracy. Każdy krok w przepływie pracy agenta - w tym wywołania dużych modeli, użycie narzędzi, wyniki pośrednie, stany pamięci i szablony podpowiedzi - można wyraźnie zarejestrować. Jest to kluczowe dla branż wymagających precyzyjnego śledzenia operacji agentów, takich jak opieka zdrowotna, prawo i finanse.

Skalowalność i Dystrybucja

Złożone, rozproszone sieci agentów można projektować tak, aby działały bezproblemowo w granicach organizacyjnych. Rozproszona architektura ułatwia wdrażanie agentów na różnych serwerach lub platformach chmurowych, optymalizując alokację i wykorzystanie zasobów.

Wbudowane i Społecznościowe Rozszerzenia

Funkcjonalność frameworku jest rozszerzona o rozszerzenia obejmujące zaawansowane klienty modeli, agentów, zespoły wieloagentowe i narzędzia do przepływu pracy agentów. Wsparcie społeczności pozwala programistom zarządzać własnymi rozszerzeniami, tworząc i udostępniając niestandardowych agentów lub narzędzia. Programiści mogą wykorzystywać te rozszerzenia do typowych potrzeb, co zmniejsza złożoność i bariery rozwoju.

Wsparcie Międzyjęzykowe

AutoGen obsługuje teraz interoperacyjność między agentami napisanymi w różnych językach programowania, takich jak Python i .NET. Ta funkcja rozszerza zakres zastosowania AutoGen i usuwa przeszkody wynikające z różnic językowych.

Ulepszenia Interfejsu Użytkownika

Interfejs użytkownika również przeszedł znaczące ulepszenia:

Interaktywna informacja zwrotna za pośrednictwem interfejsu użytkownika, umożliwiająca agentom użytkownika dostarczanie informacji w czasie rzeczywistym i wskazówek podczas operacji zespołowych.
Wizualizacja przepływu wiadomości, przedstawiająca intuicyjny interfejs do zrozumienia komunikacji agentów, mapowanie ścieżek wiadomości i zależności.
Wizualny interfejs przeciągnij i upuść, który pozwala użytkownikom projektować agentów poprzez umieszczanie i konfigurowanie komponentów wraz z ich relacjami i właściwościami.

Integracja z Magentic-One

Magentic-One, kolejny wielopoziomowy, ogólny agent AI o otwartym kodzie źródłowym firmy Microsoft, jest teraz zintegrowany z AutoGen. Magentic-One ma wielowarstwową architekturę składającą się z pięciu agentów AI: Orchestrator, WebSurfer, FileSurfer, Coder i ComputerTerminal. Każdy agent specjalista ma swój własny zestaw umiejętności i bazę wiedzy, co pozwala mu skutecznie pracować w swojej dziedzinie. Jednak ci agenci nie pracują w izolacji; Orchestrator koordynuje ich działania, aby zapewnić ich spójność i realizację ogólnych celów.

Rola Orchestratora i Agentów Specjalistycznych

Orchestrator jest odpowiedzialny za planowanie zadań, śledzenie postępów i odzyskiwanie błędów. Po otrzymaniu zadania dokładnie analizuje wymagania i przydziela podzadania pozostałym czterem agentom. Ci agenci specjaliści są biegli w obsłudze określonych typów zadań. Agent WebBrowser obsługuje przeglądanie internetu, Agent FileNavigator zarządza lokalną nawigacją po systemie plików, Agent CodeWriter pisze i wykonuje fragmenty kodu w języku Python, a ComputerTerminal wykonuje polecenia na poziomie systemu operacyjnego, aby wspierać zadania wyższego poziomu.

Asynchroniczna Architektura i Modułowość

Istotną cechą architektury Magentic-One jest asynchroniczna obsługa zdarzeń. W przeciwieństwie do synchronicznego modelu żądanie-odpowiedź, metody asynchroniczne pozwalają komponentom systemu działać współbieżnie, odbierając nowe dane wejściowe lub wyzwalając działania w dowolnym momencie bez wstrzymywania innych funkcji. Na przykład Agent WebBrowser może rozpocząć ładowanie strony, gdy Orchestrator przydzieli mu zadanie polegające na pobraniu i wyodrębnieniu informacji ze strony internetowej, podczas gdy Orchestrator i inni agenci kontynuują inne zadania. Po załadowaniu strony i wyodrębnieniu wymaganych danych Agent WebBrowser powiadamia Orchestratora i zwraca wyniki. Ta strategia umożliwia Magentic-One bardziej efektywne zarządzanie zasobami, skrócenie czasu oczekiwania i bardziej efektywne reagowanie na scenariusze o dużej współbieżności.

Oprócz asynchronicznej architektury Magentic-One wyróżnia się wysoce modułową konstrukcją. Każdy agent jest niezależną jednostką funkcjonalną z jasnymi obowiązkami i definicjami interfejsów. Takie podejście upraszcza konstrukcję systemu, ponieważ programiści mogą skoncentrować się na funkcji pojedynczego agenta, nie martwiąc się o szczegóły interakcji z innymi komponentami. Modułowość promuje również ponowne wykorzystanie kodu i udostępnianie techniczne, umożliwiając wykorzystanie istniejących agentów w nowych projektach lub dostosowanie ich do różnych aplikacji z minimalnymi modyfikacjami. Modułowa konstrukcja Magentic-One zapewnia również znaczną skalowalność. Nowych agentów można dodawać lub istniejące funkcje agentów można aktualizować bez większych remontów systemu, w miarę postępu technologii lub zmian wymagań biznesowych. Na przykład, jeśli zadanie w określonej domenie stanie się bardziej złożone, system można ulepszyć, dodając wyspecjalizowanego agenta.