- Published on
Model O3 OpenAI: Lonjakan dalam Penaakulan dan Kejayaan ARC AGI
Pengenalan kepada Model O3 OpenAI
Model O3 OpenAI telah diumumkan sebagai satu kejayaan dalam bidang kecerdasan buatan, terutamanya dalam penaakulan. Ia menandakan satu lonjakan yang tidak dijangka berbanding model-model sebelumnya, khususnya model o1. Pengumuman ini dibuat di penghujung acara pelancaran 12 hari OpenAI dan telah menarik perhatian ramai pemerhati industri. Model ini dijangka akan tersedia untuk umum pada akhir Januari 2025, bermula dengan versi o3-mini.
Sorotan Utama Model O3
Beberapa sorotan utama yang membezakan model O3 daripada pendahulunya termasuk:
- Peningkatan dalam ARC AGI: Model ini adalah yang pertama melepasi kadar penyelesaian 85% dalam Anugerah ARC AGI, satu pencapaian yang luar biasa dalam set data awam.
- Lonjakan dalam Frontier Math: Prestasi dalam penanda aras Frontier Math meningkat daripada 2% kepada 25%, menunjukkan peningkatan kualitatif yang besar.
- Kemajuan dalam Pengaturcaraan: Model O3 menunjukkan peningkatan yang ketara dalam semua penanda aras pengaturcaraan terkemuka, seperti SWE-Bench-Verified.
- Kos yang Lebih Rendah: Model o3-mini menawarkan prestasi yang lebih baik daripada o1 dengan kos yang lebih rendah, menjadikannya lebih mudah diakses oleh pengguna yang lebih luas.
Kepentingan Konsensus Berulang
Satu aspek penting yang sering diabaikan dalam model o1 adalah peranan konsensus berulang. Data menunjukkan bahawa untuk mencapai prestasi optimum, tidak boleh hanya bergantung pada satu aliran output. Sebaliknya, konsensus daripada pelbagai penjanaan adalah penting. Ini terpakai kepada semua peringkat pengiraan penaakulan.
Tiada Bukti Mengenai Perubahan Seni Bina
Tidak ada bukti yang menunjukkan bahawa model o3 telah mengubah seni bina penaakulan dengan menambah carian pokok. Semua dakwaan mengenai perkara ini adalah khabar angin. Peraturan teras undang-undang penskalaan penaakulan ialah bahawa pensampelan kandungan yang lebih banyak daripada penjanaan aliran tunggal yang sama boleh membawa kepada peningkatan prestasi.
Peranan Pembelajaran Pengukuhan (RL)
Tahun ini, pembelajaran pengukuhan (RL) dan kaedah yang berkaitan telah menegaskan semula diri mereka sebagai teras kecerdasan buatan. OpenAI telah memajukan perkembangan terkini dalam melatih model bahasa untuk menggunakan o1 untuk penaakulan. Model-model ini akan bermula dengan o3-mini dan dijangka akan tersedia untuk umum pada akhir Januari 2025.
Perbandingan dengan Model Sebelumnya
Model O3 telah mengatasi model-model tercanggih sebelumnya seperti Gemini 1.5 Pro dan Claude 3.5 Sonnet New dalam pelbagai bidang. Ini menandakan satu langkah ke hadapan yang signifikan dalam kemampuan model AI.
Penilaian Kualitatif dalam Frontier Math
Ulasan daripada pemenang Pingat Fields seperti Terence Tao dan Timothy Gowers menunjukkan betapa mencabarnya penanda aras Frontier Math. Mereka menyatakan bahawa soalan-soalan tersebut sangat sukar dan kelihatan di luar kemampuan AI untuk beberapa tahun akan datang.
Pencapaian dalam Pengaturcaraan
Dalam bidang pengaturcaraan, model O3 telah mencapai skor 71.7% yang luar biasa dalam SWE-Bench Verified dan menunjukkan hasil yang luas dalam Codeforces. Model ini juga mencapai tahap Grandmaster Antarabangsa dalam perlumbaan pengaturcaraan, meletakkannya dalam 200 teratas pengaturcara pertandingan manusia di seluruh dunia.
Penyelesaian Cabaran ARC AGI
Cabaran ARC AGI, yang direka untuk mengukur kecerdasan buatan yang lebih dekat dengan kecerdasan manusia, telah diselesaikan dengan berkesan oleh model O3. Model ini telah mencapai ketepatan 87% dalam set data awam, jauh melebihi model-model sebelumnya.
Kos dan Seni Bina O3
Walaupun butiran khusus mengenai seni bina dan kos model O3 belum didedahkan sepenuhnya, beberapa perkara boleh disimpulkan. Model ini nampaknya mendapat manfaat daripada model asas yang lebih besar dan menggunakan pendekatan pensampelan berulang untuk meningkatkan prestasi.
Kepentingan Undang-undang Penskalaan Penaakulan
Undang-undang penskalaan penaakulan menunjukkan bahawa prestasi boleh dipertingkatkan dengan mengambil sampel lebih banyak kandungan daripada penjanaan aliran tunggal yang sama. Ini adalah prinsip utama yang menyokong keberkesanan model O3.
Masa Depan Model Penaakulan
Model o1 dan model yang serupa dengannya dijangka akan menjadi alat lalai dalam kotak alat kecerdasan buatan untuk masa yang lama. Kemajuan pesat dalam model penaakulan ini membuka jalan untuk aplikasi yang lebih luas dan kemajuan dalam pelbagai bidang.
Pembelajaran Pengukuhan (RL) Kembali
Pembelajaran pengukuhan (RL) telah muncul semula sebagai kaedah teras dalam kecerdasan buatan. Perkembangan dan peningkatan dalam RLHF (Pembelajaran Pengukuhan daripada Maklum Balas Manusia) menunjukkan potensi besar untuk kemajuan masa depan dalam model AI.
Kesimpulan
Model O3 OpenAI menandakan satu langkah besar ke hadapan dalam keupayaan penaakulan AI. Dengan pencapaian yang luar biasa dalam penanda aras yang mencabar dan penyelesaian cabaran ARC AGI, model ini menetapkan piawaian baharu untuk kecerdasan buatan. Kemajuan berterusan dalam bidang ini menjanjikan masa depan yang menarik untuk kecerdasan buatan dan aplikasinya.