Pentingnya Kesederhanaan dalam Pengembangan Agen AI: Analisis Anthropic

Definisi Agen Cerdas

Konsep agen cerdas sangat beragam. Beberapa orang melihatnya sebagai "pengurus serba bisa" yang mampu berpikir mandiri, membuat keputusan otonom, dan menggunakan alat untuk menyelesaikan tugas-tugas kompleks. Sementara yang lain menganggapnya sebagai "pegawai patuh" yang menjalankan alur kerja yang telah ditentukan sebelumnya. Anthropic mengelompokkan keduanya sebagai sistem cerdas, dan membedakan antara alur kerja dan agen:

Alur Kerja: Sistem yang mengatur model bahasa besar (LLM) dan alat melalui jalur kode yang telah ditentukan.
Agen Cerdas: Sistem yang alur dan penggunaan alatnya dipandu secara dinamis oleh LLM, yang dapat secara otonom mengontrol bagaimana tugas diselesaikan.

Kapan Memilih Agen Cerdas

Anthropic menyarankan agar dalam pengembangan aplikasi AI, prinsip "jika bisa sederhana, jangan dibuat rumit" harus diikuti. Tidak semua skenario memerlukan pembangunan sistem cerdas yang kompleks. Sistem cerdas memang kuat, tetapi dapat menyebabkan respons yang lebih lambat dan peningkatan biaya. Pengembang perlu menyeimbangkan antara fungsi dan efisiensi.

Alur Kerja: Cocok untuk tugas-tugas yang jelas yang memerlukan prediktabilitas dan konsistensi.
Agen Cerdas: Lebih cocok untuk skenario skala besar yang memerlukan fleksibilitas dan pengambilan keputusan berbasis model.

Untuk banyak aplikasi, penggunaan prompt yang baik dengan dukungan pengambilan dan contoh konteks, biasanya sudah cukup untuk mengajukan pertanyaan langsung ke model besar.

Penggunaan Framework

Saat ini, ada berbagai framework yang membantu pengembang membangun agen cerdas AI, misalnya:

LangGraph dari LangChain
Framework Agen AI dari Amazon Bedrock
Alat pembuat alur kerja model besar drag-and-drop Rivet
Alat GUI Vellum untuk membangun dan menguji alur kerja yang kompleks

Framework ini menyederhanakan proses pengembangan, tetapi juga meningkatkan lapisan abstraksi kode, membuat logika dasar kurang transparan, meningkatkan kesulitan debugging, dan dapat menyebabkan pengenalan solusi yang terlalu kompleks dalam skenario sederhana.

Anthropic menyarankan pengembang untuk memulai dengan menggunakan API model besar secara langsung. Banyak pola dapat diimplementasikan hanya dengan beberapa baris kode. Jika Anda memilih untuk menggunakan framework, pastikan Anda memahami prinsip-prinsip dasarnya. Kurangnya pemahaman tentang mekanisme dasar framework adalah penyebab utama masalah pengembangan.

Cookbook dari Anthropic menyediakan contoh-contoh konkret.

Blok Bangunan, Alur Kerja, dan Agen Cerdas

Blok Bangunan Dasar: LLM yang Ditingkatkan

Blok bangunan dasar dari sistem cerdas adalah LLM yang ditingkatkan, yang memiliki kemampuan seperti pengambilan dan memori. Model Anthropic dapat secara aktif menggunakan kemampuan ini, misalnya, menghasilkan kueri pencarian, memilih alat, dan memutuskan informasi apa yang akan disimpan.

Saat memperluas fungsionalitas, fokuslah pada:

Menyesuaikan fungsionalitas dengan skenario aplikasi spesifik
Memastikan antarmuka yang sederhana dan terdokumentasi dengan baik untuk model

Protokol konteks model yang baru-baru ini dirilis oleh Anthropic menyederhanakan integrasi model AI dengan ekosistem alat pihak ketiga.

Alur Kerja: Rantai Prompt

Rantai prompt memecah tugas kompleks menjadi beberapa langkah, dengan setiap langkah memanggil model besar sekali, dan langkah-langkah selanjutnya diproses berdasarkan hasil langkah sebelumnya. Pengembang dapat menambahkan titik pemeriksaan di tengah untuk memastikan proses berjalan sesuai harapan.

Rantai prompt cocok untuk skenario di mana tugas kompleks dapat dipecah dengan jelas menjadi serangkaian sub-tugas tetap. Setiap model berfokus pada penyelesaian tugas sederhana, meskipun waktu respons keseluruhan mungkin sedikit lebih lama, akurasi akan meningkat secara signifikan.

Contoh aplikasi tipikal:

Pertama, hasilkan teks pemasaran, lalu terjemahkan ke bahasa lain.
Pertama, tulis kerangka dokumen dan lakukan pemeriksaan kepatuhan, lalu tulis dokumen lengkap berdasarkan kerangka tersebut.

Alur Kerja: Pemilahan Cerdas

Teknologi pemilahan menentukan jenis tugas input dan menugaskannya ke modul yang sesuai. Desain ini memungkinkan setiap modul dioptimalkan untuk tugas tertentu, menghindari gangguan antara berbagai jenis tugas. Pemilahan cerdas cocok untuk skenario di mana tugas memiliki karakteristik klasifikasi yang jelas. Sistem AI dapat secara akurat mengidentifikasi jenis tugas dan melakukan pemilahan melalui model bahasa besar atau algoritma tradisional.

Contoh aplikasi tipikal:

Dalam sistem layanan pelanggan, arahkan pertanyaan umum, permintaan pengembalian dana, dan dukungan teknis ke proses yang sesuai.
Tugaskan pertanyaan umum sederhana ke model yang lebih kecil, dan tugaskan pertanyaan sulit dan jarang terjadi ke model yang lebih kuat untuk mengoptimalkan biaya dan kecepatan.

Alur Kerja: Paralel

Model bahasa besar dapat memproses tugas secara bersamaan dan mengagregasi output secara terprogram. Karakteristik alur kerja paralel:

Segmentasi Tugas: Memecah tugas menjadi sub-tugas yang dapat dijalankan secara paralel, dan akhirnya mengintegrasikan hasilnya.
Mekanisme Pemungutan Suara: Menjalankan tugas yang sama beberapa kali, memilih hasil terbaik atau menggabungkan beberapa jawaban.

Metode paralel sangat efektif ketika sub-tugas dapat dijalankan secara paralel untuk meningkatkan kecepatan, atau ketika diperlukan banyak sudut pandang untuk mendapatkan hasil dengan tingkat kepercayaan yang lebih tinggi. Untuk tugas kompleks, memfokuskan setiap panggilan pada pemrosesan aspek tertentu akan memberikan hasil yang lebih baik.

Contoh aplikasi tipikal:

Segmentasi Tugas:
- Keamanan: Satu model memproses permintaan pengguna, dan yang lain melakukan peninjauan konten.
- Evaluasi Kinerja: Model yang berbeda mengevaluasi indikator kinerja sistem.
Mekanisme Pemungutan Suara:
- Pemeriksaan Keamanan Kode: Beberapa model deteksi bersama-sama menemukan kerentanan kode.
- Peninjauan Konten: Beberapa model mengevaluasi keamanan konten dari berbagai sudut pandang.

Alur Kerja: Pemimpin — Pelaksana

Model bahasa besar pusat secara dinamis memecah tugas, menugaskannya ke model pelaksana, dan meringkas hasilnya.

Alur kerja ini cocok untuk tugas-tugas kompleks yang langkah-langkah spesifiknya sulit untuk ditentukan sebelumnya. Pemecahan tugas tidak tetap, tetapi diputuskan secara dinamis oleh sistem AI berdasarkan situasi.

Contoh aplikasi tipikal:

Aplikasi pemrograman yang memerlukan modifikasi kompleks pada beberapa file.
Tugas pencarian yang memerlukan pengumpulan dan analisis informasi relevan dari berbagai sumber.

Alur Kerja: Evaluasi — Optimasi

Satu panggilan LLM menghasilkan respons, dan yang lain memberikan evaluasi dan umpan balik, membentuk siklus.

Alur kerja ini sangat efektif ketika ada kriteria evaluasi yang jelas, dan penyempurnaan iteratif dapat menghasilkan nilai yang signifikan. LLM dapat memberikan umpan balik, mirip dengan proses revisi berulang oleh penulis manusia.

Contoh aplikasi tipikal:

Terjemahan Sastra: Model evaluasi menemukan perbedaan bahasa yang terlewatkan dalam terjemahan dan memberikan saran modifikasi.
Pencarian Kompleks: Model evaluasi menentukan apakah pencarian lebih lanjut diperlukan.

Agen Cerdas

Agen cerdas muncul dengan kematangan LLM dalam kemampuan utama seperti memahami input kompleks, perencanaan penalaran, penggunaan alat, dan pemulihan kesalahan.

Pekerjaan agen cerdas dimulai dengan perintah atau diskusi interaktif dari pengguna manusia. Setelah tugas jelas, agen cerdas akan merencanakan dan beroperasi secara independen, mungkin perlu meminta lebih banyak informasi dari manusia atau meminta manusia untuk membuat keputusan.

Di setiap langkah dalam proses eksekusi, sangat penting untuk mendapatkan "situasi sebenarnya" dari lingkungan. Agen cerdas dapat berhenti di titik pemeriksaan atau ketika menemui hambatan untuk mendapatkan umpan balik manusia. Tugas biasanya dihentikan setelah selesai, tetapi juga sering kali mencakup kondisi penghentian.

Agen cerdas mampu menangani tugas-tugas kompleks, tetapi implementasinya biasanya sederhana, biasanya hanya model bahasa besar yang menggunakan alat dalam siklus berdasarkan umpan balik lingkungan. Oleh karena itu, merancang set alat dan dokumentasinya dengan jelas dan cermat sangat penting.

Agen cerdas cocok untuk pertanyaan terbuka, yang jumlah langkah yang diperlukan sulit diprediksi dan jalur tetap tidak dapat di-hardcode. Otonomi agen cerdas menjadikannya pilihan ideal untuk memperluas tugas di lingkungan yang terpercaya. Otonomi agen cerdas berarti biaya yang lebih tinggi, dan mungkin ada risiko akumulasi kesalahan. Disarankan untuk melakukan pengujian ekstensif di lingkungan sandbox dan menetapkan tindakan perlindungan yang sesuai.

Contoh aplikasi agen cerdas:

Agen kode untuk menyelesaikan tugas SWE-bench yang melibatkan pengeditan beberapa file berdasarkan deskripsi tugas.
Fitur "Penggunaan Komputer" Anthropic, di mana Claude menggunakan komputer untuk menyelesaikan tugas.

Kombinasi dan Kustomisasi

Blok bangunan ini tidak preskriptif, dan pengembang dapat membentuk dan menggabungkannya sesuai dengan kasus penggunaan. Kunci keberhasilan adalah mengukur kinerja dan mengimplementasikan iterasi. Kerumitan hanya boleh dipertimbangkan ketika solusi yang lebih sederhana tidak dapat diterapkan. Keberhasilan di bidang LLM tidak terletak pada pembangunan sistem yang paling kompleks, tetapi pada pembangunan sistem yang sesuai dengan kebutuhan. Mulailah dengan prompt sederhana, optimalkan dengan evaluasi yang komprehensif, dan hanya tambahkan sistem agen multi-langkah ketika solusi yang lebih sederhana tidak dapat diterapkan.

Saat menerapkan agen cerdas, prinsip-prinsip berikut harus diikuti:

Pertahankan kesederhanaan desain agen cerdas.
Prioritaskan untuk memastikan transparansi agen cerdas, dengan menunjukkan setiap langkah yang direncanakan dengan jelas.
Buat antarmuka agen-komputer (ACI) dengan hati-hati melalui dokumentasi alat dan pengujian yang komprehensif.