- Published on
Microsoft AutoGen 0.4 Update: Slimmere Agenten met Multilevel Architectuur
AutoGen 0.4: Verbeteringen in een Notendop
Microsoft heeft een significante update uitgebracht voor hun open-source AI Agent framework, AutoGen, met de release van versie 0.4. Deze vernieuwde bibliotheek biedt verbeterde codestabiliteit, robuustheid, veelzijdigheid en schaalbaarheid, waardoor ontwikkelaars geavanceerde AI Agent applicaties kunnen creëren.
Asynchrone Berichten: Agenten communiceren nu met behulp van asynchrone berichten, waardoor ze taken kunnen uitvoeren zonder te wachten op antwoorden van andere agenten. Dit is vooral handig voor event-driven applicaties waar agenten reageren op specifieke triggers. Het traditionele request/response model wordt ook ondersteund.
Modulariteit en Uitbreidbaarheid: Gebruikers kunnen aangepaste agenten, tools, geheugen en modellen combineren om agentsystemen te bouwen die zijn afgestemd op specifieke bedrijfsbehoeften. Dit omvat het registreren van verschillende agenttypes en tools om specifieke automatiseringsdoelen te bereiken.
Observeerbaarheid en Debugging: Ingebouwde tools voor het bijhouden van statistieken, het traceren van berichten en debugging maken het mogelijk om agentinteracties en workflows te monitoren en te controleren. Elke stap in de workflow van een agent—inclusief grote modelaanroepen, toolgebruik, tussenliggende outputs, geheugenstatus en prompttemplates—kan duidelijk worden geregistreerd. Dit is cruciaal voor industrieën die nauwkeurige tracking van agentoperaties vereisen, zoals gezondheidszorg, recht en financiën.
Schaalbaarheid en Distributie
Complexe, gedistribueerde agentnetwerken kunnen worden ontworpen om naadloos over organisatorische grenzen heen te werken. Een gedistribueerde architectuur vergemakkelijkt de implementatie van agenten op verschillende servers of cloudplatforms, waardoor de toewijzing en het gebruik van resources worden geoptimaliseerd.
Ingebouwde en Community Extensies: De functionaliteit van het framework wordt verbeterd door extensies met geavanceerde modelclients, agenten, multi-agent teams en agent workflow tools. Community support stelt ontwikkelaars in staat om hun eigen extensies te beheren, aangepaste agenten of tools te creëren en te delen. Ontwikkelaars kunnen deze extensies gebruiken voor algemene behoeften, wat de ontwikkelingscomplexiteit en -barrières vermindert.
Cross-Language Support: AutoGen ondersteunt nu interoperabiliteit tussen agenten die in verschillende programmeertalen zijn geschreven, zoals Python en .NET. Deze functie verbreedt de toepassingsmogelijkheden van AutoGen en verwijdert obstakels als gevolg van taalverschillen.
Fundamentele Herstructurering
Naast deze nieuwe mogelijkheden heeft Microsoft de basis van AutoGen geherstructureerd, die de kern, agentchat en extensies omvat. De kern dient als basis voor het event-driven agentsysteem. De Agent chat, gebouwd op de kern, biedt geavanceerde API's voor taakbeheer, groepschats, code-uitvoering en vooraf gebouwde agenten. Extensies vergemakkelijken integraties van derden met services zoals Azure code executors en OpenAI modellen.
UI Verbeteringen
De gebruikersinterface heeft ook significante verbeteringen ondergaan:
- Interactieve feedback via de UI, waardoor gebruikersagenten real-time input en begeleiding kunnen geven tijdens teamoperaties.
- Message flow visualisatie, die een intuïtieve interface biedt om agentcommunicatie te begrijpen, met mapping van berichtenpaden en afhankelijkheden.
- Een visuele drag-and-drop interface, waarmee gebruikers agenten kunnen ontwerpen door componenten met hun relaties en eigenschappen te plaatsen en te configureren.
Integratie met Magentic-One
Magentic-One, een andere open-source multi-level algemene AI Agent van Microsoft, is nu geïntegreerd in AutoGen. Magentic-One heeft een meerlaagse architectuur die bestaat uit vijf AI Agenten: Orchestrator, WebSurfer, FileSurfer, Coder en ComputerTerminal.
- Elke gespecialiseerde agent heeft zijn eigen vaardigheden en kennisbasis, waardoor hij effectief kan werken binnen zijn respectieve vakgebied.
- De Orchestrator coördineert hun activiteiten om ervoor te zorgen dat ze consistent zijn en aan de algemene doelstellingen voldoen.
- De Orchestrator is verantwoordelijk voor taakplanning, voortgangsbewaking en foutherstel.
- De WebBrowser Agent behandelt webbrowsen.
- De FileNavigatorAgent beheert lokale bestandssysteemnavigatie.
- De CodeWriterAgent schrijft en voert Python code snippets uit.
- De ComputerTerminal voert op besturingssysteemniveau commando's uit ter ondersteuning van taken op hoger niveau.
Asynchrone en Modulaire Architectuur van Magentic-One
Een essentieel kenmerk van de Magentic-One architectuur is de asynchrone event-driven werking. In tegenstelling tot het synchrone request-response model, kunnen asynchrone methoden systeemcomponenten gelijktijdig laten werken, waarbij nieuwe inputs worden ontvangen of acties op elk moment worden geactiveerd zonder andere functies te stoppen.
Magentic-One wordt gekenmerkt door zijn zeer modulaire ontwerp. Elke agent is een onafhankelijke functionele eenheid met duidelijke verantwoordelijkheden en interface definities. Deze aanpak vereenvoudigt de systeemconstructie, omdat ontwikkelaars zich kunnen concentreren op de functie van een enkele agent zonder zich zorgen te maken over interactiedetails met andere componenten. Modulariteit bevordert ook hergebruik van code en technische uitwisseling, waardoor bestaande agenten in nieuwe projecten kunnen worden gebruikt of met minimale aanpassingen aan verschillende toepassingen kunnen worden aangepast.
Het modulaire ontwerp van Magentic-One biedt ook aanzienlijke schaalbaarheid. Nieuwe agenten kunnen worden toegevoegd of bestaande agentfuncties kunnen worden bijgewerkt zonder grote systeemrevisies, naarmate de technologie vordert of de bedrijfsvereisten veranderen.