Published on

Kimi k1.5 Model Saingi OpenAI o1: Pencapaian AI Terkini

Pengarang
  • avatar
    Nama
    Ajax
    Twitter

Pengenalan kepada Kimi k1.5: Satu Lompatan dalam Kecerdasan Buatan

Dalam dunia kecerdasan buatan (AI) yang sentiasa berkembang, satu pencapaian penting telah dicapai dengan pengenalan model multimodal Kimi k1.5 oleh Moonshot AI. Model terobosan ini telah menunjukkan tahap prestasi yang menyaingi versi penuh o1 OpenAI, satu pencapaian yang sebelum ini tidak dapat dicapai oleh mana-mana entiti lain di luar OpenAI. Perkembangan ini menandakan bab baharu dalam usaha mencapai keupayaan AI yang lebih maju, mempamerkan potensi inovasi domestik dalam menghadapi persaingan global.

Keupayaan Komprehensif Kimi k1.5

Model Kimi k1.5 menonjol kerana keupayaannya yang komprehensif dalam pelbagai domain, termasuk matematik, pengekodan, dan penaakulan multimodal. Prestasinya dalam bidang ini bukan sahaja setanding dengan versi penuh o1 tetapi, dalam aspek tertentu, melebihi prestasinya. Khususnya, varian kimi-k1.5-short muncul sebagai model rantai-pemikiran (CoT) pendek terkini (SOTA), mengatasi GPT-4o dan Claude 3.5 Sonnet dengan perbezaan yang mengejutkan sebanyak 550%. Kemajuan yang signifikan ini menggariskan keupayaan luar biasa model dan potensinya untuk mentakrifkan semula penanda aras untuk prestasi AI.

Semangat Kolaboratif Moonshot AI

Pencapaian Moonshot AI bukan sekadar pencapaian teknikal tetapi juga bukti kepada ketelusan dan semangat kolaboratif yang sering kali kurang dalam landskap AI yang kompetitif. Dengan menerbitkan laporan teknikal mereka, Moonshot AI menjemput komuniti teknologi yang lebih luas untuk meneliti, belajar daripada, dan menyumbang kepada kerja mereka. Langkah ini menggariskan kepercayaan mereka bahawa perjalanan ke arah kecerdasan buatan umum (AGI) adalah usaha kolektif, yang memerlukan penyertaan pelbagai bakat dan perspektif.

Status SOTA Kimi k1.5 dalam Pelbagai Bidang

Ujian komprehensif model Kimi k1.5 mendedahkan status SOTAnya dalam beberapa bidang utama. Dalam mod long-CoT, ia sepadan dengan prestasi keluaran rasmi OpenAI o1 dalam matematik, pengekodan, dan penaakulan multimodal. Skornya pada penanda aras seperti AIME (77.5), MATH 500 (96.2), Codeforces (persentil ke-94), dan MathVista (74.9) menunjukkan kehebatannya. Pencapaian ini menandakan contoh pertama sebuah syarikat di luar OpenAI mencapai tahap prestasi penuh o1.

Tambahan pula, dalam mod short-CoT, model Kimi k1.5 telah menunjukkan prestasi SOTA global, jauh mengatasi GPT-4o dan Claude 3.5 Sonnet. Skornya pada AIME (60.8), MATH500 (94.6), dan LiveCodeBench (47.3) adalah bukti keupayaannya yang luar biasa dalam penaakulan rantai-pemikiran pendek. Keputusan ini bukan sekadar nombor; ia mewakili perubahan paradigma dalam keupayaan model AI multimodal.

Pendekatan Inovatif dalam Pembangunan Kimi k1.5

Pembangunan model Kimi k1.5 bukanlah satu kebetulan tetapi hasil daripada pendekatan yang disengajakan dan inovatif. Pasukan di Moonshot AI menyedari bahawa hanya meningkatkan parameter semasa pra-latihan tidak akan menghasilkan keputusan yang diinginkan. Mereka beralih ke arah pasca-latihan berasaskan pembelajaran pengukuhan sebagai bidang utama untuk penambahbaikan. Pendekatan ini membolehkan model mengembangkan data latihannya melalui penerokaan berasaskan ganjaran, dengan itu meningkatkan keupayaan pengkomputerannya.

Laporan teknikal memperincikan penerokaan pasukan terhadap teknik latihan pembelajaran pengukuhan (RL), resipi data multimodal, dan pengoptimuman infrastruktur. Rangka kerja RL mereka, terutamanya, adalah mudah dan berkesan, mengelakkan teknik yang lebih kompleks seperti carian pokok Monte Carlo dan fungsi nilai. Mereka juga memperkenalkan teknik long2short, yang memanfaatkan model Long-CoT untuk meningkatkan prestasi model Short-CoT.

Elemen Kritikal dalam Rangka Kerja RL

Dua elemen kritikal menyokong rangka kerja RL pasukan: penskalaan konteks panjang dan pengoptimuman dasar yang dipertingkatkan. Dengan menskalakan tetingkap konteks kepada 128k, mereka memerhatikan peningkatan berterusan dalam prestasi model. Mereka juga menggunakan rollout separa untuk meningkatkan kecekapan latihan, menggunakan semula trajektori lama untuk mengambil sampel yang baharu. Pasukan itu juga memperoleh formula pembelajaran pengukuhan dengan long-CoT, menggunakan varian penurunan cermin dalam talian untuk pengoptimuman dasar yang teguh.

Teknik long2short

Teknik long2short melibatkan beberapa kaedah, termasuk penggabungan model, pensampelan penolakan terpendek, DPO, dan long2short RL. Penggabungan model menggabungkan model long-CoT dan short-CoT untuk mencapai kecekapan token yang lebih baik. Pensampelan penolakan terpendek memilih respons terpendek yang betul untuk penalaan halus. DPO menggunakan pasangan respons pendek dan panjang untuk data latihan. Long2short RL melibatkan fasa latihan yang berasingan dengan penalti panjang.

Visi Masa Depan Moonshot AI

Melihat ke hadapan, Moonshot AI komited untuk mempercepatkan peningkatan model pembelajaran pengukuhan siri-knya. Mereka berhasrat untuk memperkenalkan lebih banyak modaliti, keupayaan yang lebih luas, dan keupayaan umum yang dipertingkatkan. Visi bercita-cita tinggi ini meletakkan mereka sebagai pemain utama dalam landskap AI global, bersedia untuk mencabar penguasaan pemain yang mantap seperti OpenAI.

Kimi k1.5: Simbol Inovasi Domestik

Model Kimi k1.5 lebih daripada sekadar pencapaian teknologi; ia adalah simbol potensi inovasi domestik dalam sektor AI. Dengan prestasi luar biasa dan perkongsian terbuka butiran latihannya, Kimi k1.5 menetapkan standard baharu untuk pembangunan AI di seluruh dunia. Jangkaan untuk pelancarannya adalah tinggi, dan impaknya dijangka mendalam.