- Published on
Pembaruan Agen AI Microsoft Membentuk Kembali Agen Cerdas Arsitektur Multi-Level yang Lebih Kuat
Sorotan Versi 0.4 AutoGen
Microsoft telah meluncurkan pembaruan signifikan pada kerangka kerja Agen AI sumber terbukanya, AutoGen, dengan rilis versi 0.4. Library yang diperbarui ini menawarkan peningkatan stabilitas kode, ketahanan, fleksibilitas, dan skalabilitas, memberdayakan pengembang untuk membuat aplikasi Agen AI mutakhir dan canggih.
Pesan Asinkron
Agen kini berkomunikasi menggunakan pesan asinkron, memungkinkan mereka untuk melanjutkan tugas tanpa menunggu respons dari agen lain. Ini sangat bermanfaat untuk aplikasi berbasis peristiwa di mana agen bereaksi terhadap pemicu tertentu. Model permintaan/respons tradisional juga didukung.
Modularitas dan Ekstensibilitas
Pengguna dapat menggabungkan agen kustom, alat, memori, dan model untuk membangun sistem agen yang disesuaikan dengan kebutuhan bisnis tertentu. Ini melibatkan pendaftaran berbagai jenis agen dan alat untuk mencapai tujuan otomatisasi tertentu.
Observabilitas dan Debugging
Alat bawaan untuk pelacakan metrik, penelusuran pesan, dan debugging memungkinkan pemantauan dan kontrol interaksi dan alur kerja agen. Setiap langkah dalam alur kerja agen—termasuk panggilan model besar, penggunaan alat, output antara, status memori, dan templat prompt—dapat direkam dengan jelas. Ini sangat penting untuk industri yang membutuhkan pelacakan operasi agen yang tepat, seperti perawatan kesehatan, hukum, dan keuangan.
Skalabilitas dan Distribusi
Jaringan agen terdistribusi yang kompleks dapat dirancang untuk beroperasi dengan mulus di seluruh batasan organisasi. Arsitektur terdistribusi memfasilitasi penerapan agen di berbagai server atau platform cloud, mengoptimalkan alokasi dan pemanfaatan sumber daya.
Ekstensi Bawaan dan Komunitas
Fungsi kerangka kerja ditingkatkan dengan ekstensi yang menampilkan klien model canggih, agen, tim multi-agen, dan alat alur kerja agen. Dukungan komunitas memungkinkan pengembang untuk mengelola ekstensi mereka sendiri, membuat dan berbagi agen atau alat kustom. Pengembang dapat menggunakan ekstensi ini untuk kebutuhan umum, yang mengurangi kompleksitas dan hambatan pengembangan.
Dukungan Lintas Bahasa
AutoGen sekarang mendukung interoperabilitas antara agen yang ditulis dalam berbagai bahasa pemrograman, seperti Python dan .NET. Fitur ini memperluas cakupan aplikasi AutoGen dan menghilangkan hambatan yang berasal dari perbedaan bahasa.
Di luar kemampuan baru ini, Microsoft telah menyusun ulang fondasi AutoGen, yang mencakup inti, obrolan agen, dan ekstensi. Inti berfungsi sebagai dasar untuk sistem agen berbasis peristiwa. Obrolan Agen, yang dibangun di atas inti, menampilkan API canggih untuk manajemen tugas, obrolan grup, eksekusi kode, dan agen bawaan. Ekstensi memfasilitasi integrasi pihak ketiga dengan layanan seperti eksekutor kode Azure dan model OpenAI.
Peningkatan UI
Antarmuka pengguna juga telah mengalami peningkatan signifikan:
- Umpan balik interaktif melalui UI, memungkinkan agen pengguna untuk memberikan masukan dan panduan real-time selama operasi tim.
- Visualisasi alur pesan, menyajikan antarmuka intuitif untuk memahami komunikasi agen, memetakan jalur pesan dan dependensi.
- Antarmuka visual drag-and-drop, yang memungkinkan pengguna untuk merancang agen dengan menempatkan dan mengonfigurasi komponen dengan hubungan dan propertinya.
Integrasi Dengan Magentic-One
Magentic-One, agen AI umum multi-level sumber terbuka lainnya oleh Microsoft, kini terintegrasi ke dalam AutoGen. Magentic-One memiliki arsitektur multi-layer yang terdiri dari lima Agen AI: Orchestrator, WebSurfer, FileSurfer, Coder, dan ComputerTerminal. Setiap agen spesialis memiliki keahlian dan basis pengetahuan sendiri, memungkinkannya bekerja secara efektif di bidangnya masing-masing. Namun, agen-agen ini tidak bekerja secara terisolasi; Orchestrator mengoordinasikan aktivitas mereka untuk memastikan bahwa mereka konsisten dan memenuhi tujuan keseluruhan.
Orchestrator bertanggung jawab atas perencanaan tugas, pelacakan kemajuan, dan pemulihan kesalahan. Setelah menerima tugas, ia menganalisis persyaratan secara menyeluruh dan menugaskan subtugas kepada empat agen lainnya. Agen spesialis ini mahir menangani jenis tugas tertentu. Agen WebBrowser menangani penjelajahan web, Agen FileNavigator mengelola navigasi sistem file lokal, Agen CodeWriter menulis dan mengeksekusi potongan kode Python, dan ComputerTerminal mengeksekusi perintah tingkat sistem operasi untuk mendukung tugas tingkat yang lebih tinggi.
Karakteristik penting dari arsitektur Magentic-One adalah operasi berbasis peristiwa asinkron. Berbeda dengan model permintaan-respons sinkron, metode asinkron memungkinkan komponen sistem berjalan secara bersamaan, menerima input baru atau memicu tindakan kapan saja tanpa menghentikan fungsi lain. Misalnya, Agen WebBrowser dapat mulai memuat halaman ketika Orchestrator menugaskannya tugas yang melibatkan pengunduhan dan ekstraksi informasi dari halaman web, sementara Orchestrator dan agen lain melanjutkan dengan tugas lain. Setelah halaman dimuat dan data yang diperlukan telah diekstraksi, Agen WebBrowser memberi tahu Orchestrator dan mengembalikan hasilnya. Strategi ini memungkinkan Magentic-One untuk mengelola sumber daya dengan lebih efisien, mengurangi waktu tunggu, dan merespons lebih efektif terhadap skenario konkurensi tinggi.
Selain arsitektur asinkronnya, Magentic-One dibedakan oleh desain modularnya yang tinggi. Setiap agen adalah unit fungsional independen dengan tanggung jawab yang jelas dan definisi antarmuka. Pendekatan ini menyederhanakan konstruksi sistem, karena pengembang dapat berkonsentrasi pada fungsi agen tunggal tanpa mengkhawatirkan detail interaksi dengan komponen lain. Modularitas juga mempromosikan penggunaan kembali kode dan berbagi teknis, memungkinkan agen yang ada untuk digunakan dalam proyek baru atau diadaptasi ke aplikasi yang berbeda dengan modifikasi minimal. Desain modular Magentic-One juga memberikan skalabilitas yang signifikan. Agen baru dapat ditambahkan atau fungsi agen yang ada dapat diperbarui tanpa perombakan sistem utama, seiring kemajuan teknologi atau perubahan persyaratan bisnis. Misalnya, jika tugas dalam domain tertentu menjadi lebih kompleks, sistem dapat ditingkatkan dengan menambahkan agen khusus.