Published on

ไมโครซอฟท์เปิดตัว AutoGen 0.4 ยกระดับเอเจนต์ AI อัจฉริยะ

ผู้เขียน
  • avatar
    ชื่อ
    Ajax
    Twitter

AutoGen 0.4: การปรับปรุงครั้งสำคัญ

ไมโครซอฟท์ได้เปิดตัวการอัปเดตครั้งสำคัญสำหรับเฟรมเวิร์ก AI Agent แบบโอเพนซอร์ส AutoGen ด้วยการเปิดตัวเวอร์ชัน 0.4 ไลบรารีที่ได้รับการปรับปรุงนี้มีความเสถียรของโค้ด ความแข็งแกร่ง ความหลากหลาย และความสามารถในการปรับขนาดที่เพิ่มขึ้น ซึ่งช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชัน AI Agent ขั้นสูงที่ล้ำสมัยได้

การส่งข้อความแบบอะซิงโครนัส

เอเจนต์สื่อสารกันโดยใช้การส่งข้อความแบบอะซิงโครนัส ทำให้สามารถดำเนินงานต่อไปได้โดยไม่ต้องรอการตอบสนองจากเอเจนต์อื่น ๆ สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับแอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ที่เอเจนต์ตอบสนองต่อทริกเกอร์เฉพาะ นอกจากนี้ยังรองรับโมเดลการร้องขอ/การตอบสนองแบบเดิม

ความเป็นโมดูลาร์และความสามารถในการขยาย

ผู้ใช้สามารถรวมเอเจนต์ เครื่องมือ หน่วยความจำ และโมเดลที่กำหนดเองเพื่อสร้างระบบเอเจนต์ที่ปรับให้เหมาะกับความต้องการทางธุรกิจเฉพาะ ซึ่งเกี่ยวข้องกับการลงทะเบียนประเภทเอเจนต์และเครื่องมือที่แตกต่างกันเพื่อให้บรรลุเป้าหมายด้านระบบอัตโนมัติที่เฉพาะเจาะจง

การสังเกตและการดีบัก

เครื่องมือในตัวสำหรับการติดตามเมตริก การติดตามข้อความ และการดีบักช่วยให้สามารถตรวจสอบและควบคุมการโต้ตอบและเวิร์กโฟลว์ของเอเจนต์ได้ ทุกขั้นตอนในเวิร์กโฟลว์ของเอเจนต์ รวมถึงการเรียกโมเดลขนาดใหญ่ การใช้เครื่องมือ เอาต์พุตระดับกลาง สถานะหน่วยความจำ และเทมเพลตพร้อมท์ สามารถบันทึกได้อย่างชัดเจน สิ่งนี้มีความสำคัญอย่างยิ่งสำหรับอุตสาหกรรมที่ต้องการการติดตามการดำเนินงานของเอเจนต์อย่างแม่นยำ เช่น การดูแลสุขภาพ กฎหมาย และการเงิน

ความสามารถในการปรับขนาดและการกระจาย

เครือข่ายเอเจนต์แบบกระจายที่ซับซ้อนสามารถออกแบบให้ทำงานได้อย่างราบรื่นข้ามขอบเขตองค์กร สถาปัตยกรรมการกระจายช่วยอำนวยความสะดวกในการปรับใช้เอเจนต์บนเซิร์ฟเวอร์หรือแพลตฟอร์มคลาวด์ต่างๆ ซึ่งช่วยเพิ่มประสิทธิภาพการจัดสรรและการใช้ทรัพยากร

ส่วนขยายในตัวและส่วนขยายของชุมชน

ฟังก์ชันการทำงานของเฟรมเวิร์กได้รับการปรับปรุงโดยส่วนขยายที่มีไคลเอนต์โมเดลขั้นสูง เอเจนต์ ทีมเอเจนต์หลายราย และเครื่องมือเวิร์กโฟลว์ของเอเจนต์ การสนับสนุนจากชุมชนช่วยให้นักพัฒนาสามารถจัดการส่วนขยายของตนเอง สร้างและแบ่งปันเอเจนต์หรือเครื่องมือที่กำหนดเองได้ นักพัฒนาสามารถใช้ส่วนขยายเหล่านี้สำหรับความต้องการทั่วไป ซึ่งช่วยลดความซับซ้อนและอุปสรรคในการพัฒนา

การสนับสนุนข้ามภาษา

AutoGen รองรับการทำงานร่วมกันระหว่างเอเจนต์ที่เขียนด้วยภาษาโปรแกรมต่างๆ เช่น Python และ .NET คุณสมบัตินี้ขยายขอบเขตการใช้งานของ AutoGen และขจัดอุปสรรคที่เกิดจากความแตกต่างทางภาษา

การปรับปรุง UI

อินเทอร์เฟซผู้ใช้ได้รับการปรับปรุงที่สำคัญเช่นกัน:

  • ข้อเสนอแนะแบบโต้ตอบผ่าน UI ช่วยให้เอเจนต์ผู้ใช้สามารถให้ข้อมูลแบบเรียลไทม์และคำแนะนำระหว่างการทำงานของทีม
  • การแสดงภาพการไหลของข้อความ นำเสนออินเทอร์เฟซที่ใช้งานง่ายเพื่อทำความเข้าใจการสื่อสารของเอเจนต์ โดยการทำแผนที่เส้นทางและทรัพยากรของข้อความ
  • อินเทอร์เฟซแบบลากและวางด้วยภาพ ซึ่งช่วยให้ผู้ใช้สามารถออกแบบเอเจนต์โดยการวางและกำหนดค่าส่วนประกอบด้วยความสัมพันธ์และคุณสมบัติของส่วนประกอบนั้น

การผสานรวมกับ Magentic-One

Magentic-One ซึ่งเป็นเอเจนต์ AI ทั่วไปแบบหลายระดับโอเพนซอร์สอีกตัวหนึ่งของไมโครซอฟท์ ได้ถูกรวมเข้ากับ AutoGen แล้ว Magentic-One มีสถาปัตยกรรมแบบหลายชั้นที่ประกอบด้วย AI Agent ห้าตัว ได้แก่ Orchestrator, WebSurfer, FileSurfer, Coder และ ComputerTerminal เอเจนต์ผู้เชี่ยวชาญแต่ละตัวมีชุดทักษะและฐานความรู้ของตนเอง ทำให้สามารถทำงานได้อย่างมีประสิทธิภาพในสาขาของตน อย่างไรก็ตาม เอเจนต์เหล่านี้ไม่ได้ทำงานแยกกัน Orchestrator จะประสานงานกิจกรรมเพื่อให้แน่ใจว่ากิจกรรมเหล่านั้นสอดคล้องกันและตรงตามวัตถุประสงค์โดยรวม

สถาปัตยกรรมของ Magentic-One

Orchestrator มีหน้าที่รับผิดชอบในการวางแผนงาน การติดตามความคืบหน้า และการกู้คืนข้อผิดพลาด เมื่อได้รับงานแล้ว จะวิเคราะห์ข้อกำหนดอย่างละเอียดและมอบหมายงานย่อยให้กับเอเจนต์อีกสี่ตัว เอเจนต์ผู้เชี่ยวชาญเหล่านี้มีความเชี่ยวชาญในการจัดการงานประเภทเฉพาะ เอเจนต์ WebBrowser จัดการการเรียกดูเว็บ เอเจนต์ FileNavigator จัดการการนำทางระบบไฟล์ในเครื่อง เอเจนต์ CodeWriter เขียนและดำเนินการโค้ด Python และ ComputerTerminal ดำเนินการคำสั่งระดับระบบปฏิบัติการเพื่อรองรับงานระดับสูง

การทำงานแบบอะซิงโครนัสและโมดูลาร์

ลักษณะสำคัญของสถาปัตยกรรม Magentic-One คือการทำงานแบบอะซิงโครนัสที่ขับเคลื่อนด้วยเหตุการณ์ เมื่อเทียบกับโมเดลการร้องขอ/การตอบสนองแบบซิงโครนัส วิธีการแบบอะซิงโครนัสช่วยให้ส่วนประกอบของระบบทำงานพร้อมกันได้ โดยรับอินพุตใหม่หรือทริกเกอร์การดำเนินการเมื่อใดก็ได้โดยไม่หยุดการทำงานอื่น ๆ ตัวอย่างเช่น เอเจนต์ WebBrowser สามารถเริ่มโหลดหน้าได้เมื่อ Orchestrator มอบหมายงานที่เกี่ยวข้องกับการดาวน์โหลดและแยกข้อมูลจากหน้าเว็บ ในขณะที่ Orchestrator และเอเจนต์อื่น ๆ ดำเนินการต่อด้วยงานอื่น ๆ เมื่อหน้าโหลดและมีการดึงข้อมูลที่จำเป็นแล้ว เอเจนต์ WebBrowser จะแจ้งให้ Orchestrator ทราบและส่งคืนผลลัพธ์ กลยุทธ์นี้ทำให้ Magentic-One สามารถจัดการทรัพยากรได้อย่างมีประสิทธิภาพมากขึ้น ลดเวลารอ และตอบสนองต่อสถานการณ์ที่มีการทำงานพร้อมกันสูงได้อย่างมีประสิทธิภาพมากขึ้น

นอกจากสถาปัตยกรรมแบบอะซิงโครนัสแล้ว Magentic-One ยังโดดเด่นด้วยการออกแบบโมดูลาร์สูง เอเจนต์แต่ละตัวเป็นหน่วยการทำงานอิสระที่มีความรับผิดชอบและคำจำกัดความของอินเทอร์เฟซที่ชัดเจน วิธีการนี้ทำให้การสร้างระบบง่ายขึ้น เนื่องจากนักพัฒนาสามารถมุ่งเน้นไปที่ฟังก์ชันของเอเจนต์เดียวได้โดยไม่ต้องกังวลเกี่ยวกับรายละเอียดการโต้ตอบกับส่วนประกอบอื่น ๆ ความเป็นโมดูลาร์ยังส่งเสริมการนำโค้ดกลับมาใช้ใหม่และการแบ่งปันทางเทคนิค ทำให้สามารถใช้เอเจนต์ที่มีอยู่แล้วในโครงการใหม่ หรือปรับให้เข้ากับแอปพลิเคชันต่างๆ ได้โดยมีการปรับเปลี่ยนน้อยที่สุด การออกแบบโมดูลาร์ของ Magentic-One ยังให้ความสามารถในการปรับขนาดที่สำคัญอีกด้วย เอเจนต์ใหม่สามารถเพิ่มหรือฟังก์ชันของเอเจนต์ที่มีอยู่สามารถอัปเดตได้โดยไม่ต้องปรับปรุงระบบครั้งใหญ่ เมื่อเทคโนโลยีมีความก้าวหน้าหรือความต้องการทางธุรกิจเปลี่ยนแปลงไป ตัวอย่างเช่น หากงานในโดเมนเฉพาะมีความซับซ้อนมากขึ้น ระบบสามารถปรับปรุงได้โดยการเพิ่มเอเจนต์เฉพาะทาง