Pembangunan Ejen Anthropic: Kesederhanaan Mengatasi Kerumitan

Definisi Ejen Pintar

Konsep ejen pintar adalah pelbagai. Sesetengah orang melihatnya sebagai 'pengurus serba boleh' yang mampu berfikir secara bebas, membuat keputusan autonomi, dan menggunakan alat untuk menyelesaikan tugas-tugas yang kompleks. Yang lain menganggapnya sebagai 'pekerja patuh' yang hanya melaksanakan proses kerja yang telah ditetapkan. Anthropic menggabungkan kedua-duanya sebagai sistem pintar, tetapi membezakan antara aliran kerja dan ejen:

Aliran Kerja: Sistem yang menyusun model bahasa besar (LLM) dan alat melalui laluan kod yang telah ditetapkan.
Ejen Pintar: Sistem yang dipandu secara dinamik oleh LLM dalam proses dan penggunaan alatnya, yang membolehkan ia mengawal cara tugas diselesaikan secara autonomi.

Bila Menggunakan Ejen Pintar

Anthropic mencadangkan prinsip 'mudah jika boleh' dalam pembangunan aplikasi AI. Tidak semua senario memerlukan sistem pintar yang kompleks. Sistem pintar memang berkuasa, tetapi boleh menyebabkan respons yang lebih lambat dan kos yang lebih tinggi. Pembangun perlu menyeimbangkan antara fungsi dan kecekapan.

Aliran Kerja: Sesuai untuk tugas yang jelas dan memerlukan kebolehramalan dan konsistensi.
Ejen Pintar: Lebih sesuai untuk senario yang besar yang memerlukan fleksibiliti dan keputusan yang dipacu model.

Untuk banyak aplikasi, menggunakan arahan yang baik dengan carian dan contoh konteks, bertanya terus kepada model besar biasanya sudah memadai.

Penggunaan Rangka Kerja

Terdapat pelbagai rangka kerja yang membantu pembangun membina ejen pintar AI, seperti:

LangGraph dari LangChain
Rangka kerja Ejen AI dari Amazon Bedrock
Alat pembinaan aliran kerja model besar seret dan lepas Rivet
Alat GUI Vellum untuk membina dan menguji aliran kerja yang kompleks

Rangka kerja ini memudahkan proses pembangunan, tetapi juga menambah lapisan abstrak pada kod, menjadikan logik asas kurang telus, meningkatkan kesukaran penyahpepijatan, dan berpotensi membawa penyelesaian yang terlalu kompleks dalam senario yang mudah.

Anthropic mencadangkan pembangun bermula dengan menggunakan API model besar secara langsung. Banyak corak boleh dicapai hanya dengan beberapa baris kod. Jika anda memilih untuk menggunakan rangka kerja, pastikan anda memahami prinsip asasnya. Kurangnya pemahaman tentang mekanisme asas rangka kerja adalah punca utama masalah pembangunan.

Buku masakan Anthropic menyediakan contoh khusus.

Blok Pembinaan, Aliran Kerja, dan Ejen Pintar

Blok Pembinaan Asas: LLM yang Dipertingkatkan

Blok pembinaan asas sistem pintar ialah LLM yang dipertingkatkan, dengan keupayaan seperti carian dan ingatan. Model Anthropic boleh menggunakan keupayaan ini secara aktif, seperti menjana pertanyaan carian, memilih alat, dan memutuskan maklumat yang hendak disimpan.

Apabila mengembangkan fungsi, fokus pada:

Menyesuaikan fungsi berdasarkan senario aplikasi khusus
Memastikan antara muka yang mudah dan didokumentasikan dengan baik untuk model

Protokol konteks model Anthropic yang baru-baru ini dikeluarkan memudahkan integrasi model AI dengan ekosistem alat pihak ketiga.

Aliran Kerja: Rantai Arahan

Rantai arahan membahagikan tugas kompleks kepada beberapa langkah, setiap langkah memanggil model besar sekali, dan langkah seterusnya diproses berdasarkan keputusan langkah sebelumnya. Pembangun boleh menambah titik semakan di tengah untuk memastikan proses berjalan seperti yang diharapkan.

Rantai arahan sesuai untuk senario di mana tugas kompleks boleh dibahagikan dengan jelas kepada satu siri subtugas tetap. Setiap model menumpukan pada menyelesaikan tugas yang mudah, dan walaupun masa tindak balas keseluruhan mungkin sedikit lebih lama, ketepatan akan meningkat dengan ketara.

Contoh aplikasi biasa:

Menjana salinan pemasaran terlebih dahulu, kemudian menterjemahkannya ke dalam bahasa lain.
Menulis garis besar dokumen terlebih dahulu dan menjalankan pemeriksaan pematuhan, kemudian menulis dokumen lengkap berdasarkan garis besar.

Aliran Kerja: Pengasingan Pintar

Teknologi pengasingan menentukan jenis tugas input dan memberikannya kepada modul yang sesuai. Reka bentuk ini membolehkan setiap modul dioptimumkan untuk tugas tertentu, mengelakkan gangguan antara jenis tugas yang berbeza. Pengasingan pintar sesuai untuk senario di mana tugas mempunyai ciri-ciri klasifikasi yang jelas. Sistem AI boleh menggunakan model bahasa besar atau algoritma tradisional untuk mengenal pasti jenis tugas dengan tepat dan mengasingkannya.

Contoh aplikasi biasa:

Dalam sistem perkhidmatan pelanggan, arahkan pertanyaan umum, permintaan bayaran balik, dan sokongan teknikal kepada proses yang sesuai.
Berikan soalan mudah dan biasa kepada model yang lebih kecil, dan soalan yang sukar dan jarang kepada model yang lebih berkuasa untuk mengoptimumkan kos dan kelajuan.

Aliran Kerja: Selari

Model bahasa besar boleh memproses tugas secara serentak dan menggabungkan output secara pemrograman. Ciri-ciri aliran kerja selari:

Segmentasi Tugas: Memecahkan tugas kepada subtugas yang boleh dijalankan secara selari dan menggabungkan hasilnya pada akhirnya.
Mekanisme Pengundian: Menjalankan tugas yang sama beberapa kali, memilih hasil terbaik atau menggabungkan beberapa jawapan.

Kaedah selari sangat berkesan apabila subtugas boleh dilaksanakan secara selari untuk meningkatkan kelajuan, atau apabila percubaan dari pelbagai sudut diperlukan untuk mendapatkan hasil yang lebih yakin. Untuk tugas yang kompleks, adalah lebih baik untuk memfokuskan setiap panggilan pada pemprosesan aspek tertentu.

Contoh aplikasi biasa:

Segmentasi Tugas:
- Perlindungan Keselamatan: Satu model memproses permintaan pengguna, yang lain menjalankan semakan kandungan.
- Penilaian Prestasi: Model yang berbeza menilai metrik prestasi sistem.
Mekanisme Pengundian:
- Pemeriksaan Keselamatan Kod: Beberapa model pengesanan bersama-sama menemui kelemahan kod.
- Semakan Kandungan: Beberapa model menilai keselamatan kandungan dari perspektif yang berbeza.

Aliran Kerja: Pemimpin - Pelaksana

Model bahasa besar pusat membahagikan tugas secara dinamik, memberikannya kepada model pelaksana, dan mengumpulkan hasilnya.

Aliran kerja ini sesuai untuk tugas kompleks yang langkah-langkah khususnya sukar ditentukan terlebih dahulu. Pembahagian tugas tidak tetap, tetapi diputuskan secara dinamik oleh sistem AI berdasarkan keadaan.

Contoh aplikasi biasa:

Aplikasi pengaturcaraan yang memerlukan pengubahsuaian kompleks kepada berbilang fail.
Tugas carian yang memerlukan pengumpulan dan analisis maklumat yang berkaitan daripada pelbagai sumber.

Aliran Kerja: Penilaian - Pengoptimuman

Satu panggilan LLM menjana respons, dan yang lain memberikan penilaian dan maklum balas, membentuk gelung.

Aliran kerja ini amat berkesan apabila terdapat kriteria penilaian yang jelas, dan apabila penghalusan berulang boleh membawa nilai yang ketara. LLM boleh memberikan maklum balas, sama seperti proses penulis manusia menyemak dan menyunting berulang kali.

Contoh aplikasi biasa:

Terjemahan Sastera: Model penilaian menemui perbezaan bahasa yang tertinggal dalam terjemahan dan memberikan cadangan pengubahsuaian.
Carian Kompleks: Model penilaian memutuskan sama ada perlu meneruskan carian yang lebih mendalam.

Ejen Pintar

Ejen pintar muncul dengan kematangan LLM dalam keupayaan utama seperti memahami input kompleks, perancangan penaakulan, penggunaan alat, dan pemulihan ralat.

Kerja ejen pintar bermula dengan arahan pengguna manusia atau perbincangan interaktif. Setelah tugas jelas, ejen pintar akan merancang dan beroperasi secara bebas, mungkin perlu meminta lebih banyak maklumat daripada manusia atau meminta manusia membuat keputusan.

Adalah penting untuk mendapatkan 'keadaan sebenar' daripada persekitaran pada setiap langkah proses pelaksanaan. Ejen pintar boleh berhenti di titik semakan atau apabila menghadapi sekatan untuk mendapatkan maklum balas manusia. Tugas biasanya ditamatkan selepas selesai, tetapi juga biasanya termasuk syarat berhenti.

Ejen pintar mampu mengendalikan tugas yang kompleks, tetapi pelaksanaannya biasanya mudah, biasanya hanya model bahasa besar yang menggunakan alat berdasarkan maklum balas persekitaran dalam gelung. Oleh itu, adalah penting untuk mereka bentuk set alat dan dokumentasinya dengan jelas dan teliti.

Ejen pintar sesuai untuk soalan terbuka yang bilangan langkah yang diperlukan sukar diramal dan laluan tetap tidak boleh dikodkan secara keras. Autonomi ejen pintar menjadikannya pilihan yang ideal untuk mengembangkan tugas dalam persekitaran yang dipercayai. Autonomi ejen pintar bermakna kos yang lebih tinggi, dan terdapat risiko pengumpulan ralat. Adalah disyorkan untuk menjalankan ujian yang luas dalam persekitaran kotak pasir dan menetapkan langkah perlindungan yang sesuai.

Contoh aplikasi ejen pintar:

Ejen kod untuk menyelesaikan tugas SWE-bench yang melibatkan penyuntingan berbilang fail berdasarkan penerangan tugas.
Fungsi 'Penggunaan Komputer' Anthropic, di mana Claude menggunakan komputer untuk menyelesaikan tugas.

Gabungan dan Penyesuaian

Blok pembinaan ini tidak preskriptif, dan pembangun boleh membentuk dan menggabungkannya berdasarkan kes penggunaan. Kunci kejayaan ialah mengukur prestasi dan melaksanakannya secara berulang. Kerumitan hanya perlu dipertimbangkan apabila penyelesaian yang lebih mudah tidak dapat dicapai. Kejayaan dalam bidang LLM bukan terletak pada membina sistem yang paling kompleks, tetapi pada membina sistem yang memenuhi keperluan. Mulakan dengan arahan mudah, optimumkannya dengan penilaian yang menyeluruh, dan hanya tambahkan sistem ejen berbilang langkah apabila penyelesaian yang lebih mudah tidak dapat dicapai.

Apabila menggunakan ejen pintar, prinsip berikut perlu dipatuhi:

Pastikan reka bentuk ejen pintar mudah.
Utamakan ketelusan ejen pintar, dan tunjukkan dengan jelas setiap langkah yang dirancang.
Bina antara muka ejen-komputer (ACI) dengan teliti melalui dokumentasi alat yang komprehensif dan ujian.