- Published on
AutoGen 0.4: Kemas Kini Rangka Kerja Agen AI Sumber Terbuka Microsoft
Sorotan Versi 0.4 AutoGen
Microsoft telah memperkenalkan kemas kini yang ketara kepada rangka kerja Agen AI sumber terbukanya, AutoGen, dengan pelancaran versi 0.4. Pustaka yang dirombak ini menawarkan peningkatan dalam kestabilan kod, keteguhan, fleksibiliti, dan skalabiliti, membolehkan pembangun mencipta aplikasi Agen AI termaju.
Pemesejan Tak Segerak: Agen kini berkomunikasi menggunakan pemesejan tak segerak, membolehkan mereka meneruskan tugas tanpa menunggu respons daripada agen lain. Ini amat bermanfaat untuk aplikasi yang didorong oleh peristiwa di mana agen bertindak balas terhadap pencetus tertentu. Model permintaan/respons tradisional juga disokong.
Modulariti dan Kebolehluasan: Pengguna boleh menggabungkan agen tersuai, alatan, memori, dan model untuk membina sistem agen yang disesuaikan dengan keperluan perniagaan tertentu. Ini melibatkan pendaftaran pelbagai jenis agen dan alatan untuk mencapai matlamat automasi tertentu.
Kebolehperhatian dan Penyahpepijatan: Alatan terbina dalam untuk penjejakan metrik, pengesanan mesej, dan penyahpepijatan membolehkan pemantauan dan kawalan interaksi dan aliran kerja agen. Setiap langkah dalam aliran kerja agen—termasuk panggilan model besar, penggunaan alatan, output perantaraan, keadaan memori, dan templat segera—boleh direkodkan dengan jelas. Ini penting untuk industri yang memerlukan penjejakan operasi agen yang tepat, seperti penjagaan kesihatan, undang-undang dan kewangan.
Skalabiliti dan Pengagihan: Rangkaian agen teragih yang kompleks boleh direka bentuk untuk beroperasi dengan lancar merentasi sempadan organisasi. Seni bina teragih memudahkan penggunaan agen pada pelbagai pelayan atau platform awan, mengoptimumkan peruntukan dan penggunaan sumber.
Sambungan Terbina Dalam dan Komuniti: Fungsi rangka kerja dipertingkatkan dengan sambungan yang menampilkan klien model lanjutan, agen, pasukan berbilang agen dan alatan aliran kerja agen. Sokongan komuniti membolehkan pembangun mengurus sambungan mereka sendiri, mencipta dan berkongsi agen atau alatan tersuai. Pembangun boleh menggunakan sambungan ini untuk keperluan umum, yang mengurangkan kerumitan dan halangan pembangunan.
Sokongan Merentas Bahasa: AutoGen kini menyokong interoperabiliti antara agen yang ditulis dalam bahasa pengaturcaraan yang berbeza, seperti Python dan .NET. Ciri ini meluaskan skop aplikasi AutoGen dan menghapuskan halangan yang berpunca daripada perbezaan bahasa.
Di sebalik keupayaan baharu ini, Microsoft telah menstrukturkan semula asas AutoGen, yang merangkumi teras, sembang agen, dan sambungan. Teras berfungsi sebagai asas untuk sistem agen yang dipacu peristiwa. Sembang Agen, yang dibina di atas teras, menampilkan API lanjutan untuk pengurusan tugas, sembang kumpulan, pelaksanaan kod, dan agen pra-bina. Sambungan memudahkan penyepaduan pihak ketiga dengan perkhidmatan seperti pelaksana kod Azure dan model OpenAI.
Peningkatan UI
Antara muka pengguna juga telah mengalami peningkatan yang ketara:
- Maklum Balas Interaktif melalui UI, membolehkan agen pengguna memberikan input dan panduan masa nyata semasa operasi pasukan.
- Visualisasi Aliran Mesej, mempersembahkan antara muka intuitif untuk memahami komunikasi agen, memetakan laluan mesej dan kebergantungan.
- Antara Muka Seret dan Lepas Visual, yang membolehkan pengguna mereka bentuk agen dengan meletakkan dan mengkonfigurasi komponen dengan perhubungan dan sifatnya.
Penyepaduan Dengan Magentic-One
Magentic-One, satu lagi Agen AI umum berbilang peringkat sumber terbuka oleh Microsoft, kini disepadukan ke dalam AutoGen. Magentic-One mempunyai seni bina berbilang lapisan yang terdiri daripada lima Agen AI: Orchestrator, WebSurfer, FileSurfer, Coder, dan ComputerTerminal. Setiap agen pakar mempunyai set kemahiran dan pangkalan pengetahuan sendiri, membolehkannya berfungsi dengan berkesan dalam bidang masing-masing. Walau bagaimanapun, agen ini tidak berfungsi secara berasingan; Orchestrator menyelaraskan aktiviti mereka untuk memastikan ia konsisten dan memenuhi objektif keseluruhan.
Orchestrator bertanggungjawab untuk perancangan tugas, penjejakan kemajuan dan pemulihan ralat. Selepas menerima tugas, ia menganalisis sepenuhnya keperluan dan memberikan subtugas kepada empat agen lain. Agen pakar ini mahir dalam mengendalikan jenis tugas tertentu. Agen WebBrowser mengendalikan penyemakan imbas web, Agen FileNavigator mengurus navigasi sistem fail tempatan, Agen CodeWriter menulis dan melaksanakan coretan kod Python, dan ComputerTerminal melaksanakan arahan peringkat sistem pengendalian untuk menyokong tugas peringkat tinggi.
Ciri penting dalam seni bina Magentic-One ialah operasi tak segerak yang didorong oleh peristiwa. Berbeza dengan model permintaan-respons segerak, kaedah tak segerak membolehkan komponen sistem berjalan serentak, menerima input baharu atau mencetuskan tindakan pada bila-bila masa tanpa menghentikan fungsi lain. Sebagai contoh, Agen WebBrowser boleh mula memuatkan halaman apabila Orchestrator memberikan tugas yang melibatkan muat turun dan pengekstrakan maklumat daripada halaman web, manakala Orchestrator dan agen lain meneruskan tugas lain. Setelah halaman dimuatkan dan data yang diperlukan telah diekstrak, Agen WebBrowser memberitahu Orchestrator dan mengembalikan hasilnya. Strategi ini membolehkan Magentic-One mengurus sumber dengan lebih cekap, mengurangkan masa menunggu dan bertindak balas dengan lebih berkesan terhadap senario konkurensi tinggi.
Selain seni bina tak segeraknya, Magentic-One dibezakan oleh reka bentuknya yang sangat modular. Setiap agen ialah unit fungsi bebas dengan tanggungjawab yang jelas dan definisi antara muka. Pendekatan ini memudahkan pembinaan sistem, kerana pembangun boleh menumpukan pada fungsi satu agen tanpa perlu risau tentang butiran interaksi dengan komponen lain. Modulariti juga menggalakkan penggunaan semula kod dan perkongsian teknikal, membolehkan agen sedia ada digunakan dalam projek baharu atau disesuaikan dengan aplikasi yang berbeza dengan pengubahsuaian yang minimum. Reka bentuk modular Magentic-One juga menyediakan skalabiliti yang ketara. Agen baharu boleh ditambah atau fungsi agen sedia ada boleh dikemas kini tanpa rombakan sistem yang besar, apabila teknologi maju atau keperluan perniagaan berubah. Contohnya, jika tugas dalam domain tertentu menjadi lebih kompleks, sistem boleh dipertingkatkan dengan menambah agen khusus.