- Published on
கிமி கே1.5 ஓபன்ஏஐ ஓ1 முழு மல்டிமாடல் மாடலுக்கு இணையாக உள்ளது
செயற்கை நுண்ணறிவில் ஒரு புதிய மைல்கல்
செயற்கை நுண்ணறிவுத் துறையில், மூன்ஷாட் AI நிறுவனம் கிமி கே1.5 மல்டிமாடல் மாடலை அறிமுகப்படுத்தியுள்ளது. இந்த மாடல், ஓபன்ஏஐ நிறுவனத்தின் ஓ1 முழு பதிப்பிற்கு இணையாக செயல்பட்டு, செயற்கை நுண்ணறிவுத் துறையில் ஒரு புதிய மைல்கல்லை எட்டியுள்ளது. ஓபன்ஏஐ நிறுவனத்தைத் தவிர வேறு எந்த நிறுவனமும் இதுவரை இந்த சாதனையை எட்டியதில்லை. இந்த வளர்ச்சி, உலகளாவிய போட்டியில் உள்நாட்டு கண்டுபிடிப்புகளின் திறனை எடுத்துக்காட்டுகிறது.
கிமி கே1.5 மாடலின் சிறப்பம்சங்கள்
கிமி கே1.5 மாடல், கணிதம், கோடிங் மற்றும் மல்டிமாடல் ரீசனிங் போன்ற பல்வேறு துறைகளில் சிறந்து விளங்குகிறது. இந்த துறைகளில் இதன் செயல்திறன் ஓ1 முழு பதிப்பிற்கு இணையாக மட்டுமல்லாமல், சில அம்சங்களில் அதை விட அதிகமாகவும் உள்ளது. குறிப்பாக, கிமி-கே1.5-ஷார்ட் மாறுபாடு, GPT-4o மற்றும் கிளாட் 3.5 சோனெட்டை விட 550% அதிகமாக செயல்பட்டு, அதிநவீன குறுகிய சங்கிலி சிந்தனை (CoT) மாடலாக உருவெடுத்துள்ளது. இந்த முன்னேற்றம், AI செயல்திறனுக்கான தரநிலைகளை மறுவரையறை செய்யும் திறனைக் கொண்டுள்ளது.
வெளிப்படைத்தன்மை மற்றும் ஒத்துழைப்பு
மூன்ஷாட் AI நிறுவனத்தின் இந்த சாதனை, தொழில்நுட்ப மைல்கல் மட்டுமல்ல, AI துறையில் நிலவும் போட்டி மனப்பான்மைக்கு மத்தியில் வெளிப்படைத்தன்மை மற்றும் ஒத்துழைப்பு உணர்வை எடுத்துக்காட்டுகிறது. மூன்ஷாட் AI நிறுவனம், தனது தொழில்நுட்ப அறிக்கையை வெளியிடுவதன் மூலம், தொழில்நுட்ப சமூகத்தை தங்கள் பணியை ஆய்வு செய்யவும், கற்றுக்கொள்ளவும், பங்களிக்கவும் அழைக்கிறது. செயற்கை பொது நுண்ணறிவுக்கான பயணம் ஒரு கூட்டு முயற்சி என்றும், பல்வேறு திறமைகள் மற்றும் கண்ணோட்டங்களின் பங்கேற்பு அவசியம் என்றும் அவர்கள் நம்புகின்றனர்.
சோதனைகளின் முடிவுகள்
கிமி கே1.5 மாடலின் விரிவான சோதனைகள், பல முக்கிய பகுதிகளில் அதன் அதிநவீன நிலையை வெளிப்படுத்துகின்றன. நீண்ட-CoT முறையில், கணிதம், கோடிங் மற்றும் மல்டிமாடல் ரீசனிங் ஆகியவற்றில் ஓபன்ஏஐ ஓ1 இன் அதிகாரப்பூர்வ வெளியீட்டின் செயல்திறனுடன் இது பொருந்துகிறது. AIME (77.5), MATH 500 (96.2), Codeforces (94வது பெர்சென்டைல்) மற்றும் MathVista (74.9) போன்ற அளவுகோல்களில் இதன் மதிப்பெண்கள், அதன் திறமையை எடுத்துக்காட்டுகின்றன. ஓபன்ஏஐ நிறுவனத்தைத் தவிர, வேறு ஒரு நிறுவனம் ஓ1 செயல்திறன் நிலையை அடைவது இதுவே முதல் முறை.
மேலும், குறுகிய-CoT முறையில், கிமி கே1.5 மாடல் உலகளாவிய SOTA செயல்திறனை வெளிப்படுத்தியுள்ளது, GPT-4o மற்றும் கிளாட் 3.5 சோனெட்டை விட கணிசமாக அதிகமாக செயல்படுகிறது. AIME (60.8), MATH500 (94.6) மற்றும் LiveCodeBench (47.3) ஆகியவற்றில் இதன் மதிப்பெண்கள், குறுகிய சங்கிலி சிந்தனை ரீசனிங்கில் அதன் சிறப்பான திறன்களை நிரூபிக்கின்றன. இந்த முடிவுகள் வெறும் எண்கள் மட்டுமல்ல, மல்டிமாடல் AI மாடல்களின் திறன்களில் ஒரு புதிய மாற்றத்தை பிரதிபலிக்கின்றன.
புதுமையான அணுகுமுறை
கிமி கே1.5 மாடலின் வளர்ச்சி, தற்செயலான அதிர்ஷ்டம் அல்ல, மாறாக ஒரு திட்டமிட்ட மற்றும் புதுமையான அணுகுமுறையின் விளைவாகும். மூன்ஷாட் AI குழு, முன்-பயிற்சியின் போது அளவுருக்களை அதிகரிப்பது மட்டும் விரும்பிய முடிவுகளைத் தராது என்பதை உணர்ந்தது. எனவே, அவர்கள் வலுவூட்டல் கற்றல் அடிப்படையிலான பிந்தைய பயிற்சிக்கு முக்கியத்துவம் அளித்தனர். இந்த அணுகுமுறை, வெகுமதி அடிப்படையிலான ஆய்வின் மூலம் பயிற்சி தரவை விரிவுபடுத்தவும், கணக்கீட்டு திறன்களை அதிகரிக்கவும் உதவுகிறது.
வலுவூட்டல் கற்றல் கட்டமைப்பு
தொழில்நுட்ப அறிக்கை, வலுவூட்டல் கற்றல் (RL) பயிற்சி நுட்பங்கள், மல்டிமாடல் தரவு ரெசிபிகள் மற்றும் உள்கட்டமைப்பு மேம்பாடு ஆகியவற்றில் குழுவின் ஆய்வுகளை விவரிக்கிறது. அவர்களின் RL கட்டமைப்பு, மான்டே கார்லோ ட்ரீ சர்ச் மற்றும் மதிப்பு செயல்பாடுகள் போன்ற சிக்கலான நுட்பங்களைத் தவிர்த்து, நேரடியான மற்றும் பயனுள்ள அணுகுமுறையைக் கொண்டுள்ளது. மேலும், அவர்கள் லாங்2ஷார்ட் நுட்பத்தை அறிமுகப்படுத்தினர், இது குறுகிய-CoT மாடல்களின் செயல்திறனை மேம்படுத்த லாங்-CoT மாடல்களைப் பயன்படுத்துகிறது.
முக்கிய கூறுகள்
குழுவின் RL கட்டமைப்பிற்கு இரண்டு முக்கிய கூறுகள் அடிப்படையாக உள்ளன: நீண்ட சூழல் அளவிடுதல் மற்றும் மேம்படுத்தப்பட்ட கொள்கை தேர்வுமுறை. சூழல் சாளரத்தை 128k ஆக அளவிடுவதன் மூலம், மாடல் செயல்திறனில் தொடர்ச்சியான முன்னேற்றத்தை அவர்கள் கண்டறிந்தனர். பயிற்சி திறனை மேம்படுத்த, பழைய பாதைகளை மீண்டும் பயன்படுத்துவதன் மூலம் புதிய பாதைகளை மாதிரியாகப் பயன்படுத்துகின்றனர். மேலும், நீண்ட-CoT உடன் வலுவூட்டல் கற்றல் சூத்திரத்தை அவர்கள் உருவாக்கியுள்ளனர், இது வலுவான கொள்கை தேர்வுமுறைக்கு ஆன்லைன் மிரர் டிசென்ட்டின் மாறுபாட்டைப் பயன்படுத்துகிறது.
லாங்2ஷார்ட் நுட்பம்
லாங்2ஷார்ட் நுட்பத்தில், மாடல் இணைத்தல், குறுகிய நிராகரிப்பு மாதிரி, DPO மற்றும் லாங்2ஷார்ட் RL போன்ற பல முறைகள் உள்ளன. மாடல் இணைத்தல், சிறந்த டோக்கன் திறனை அடைய லாங்-CoT மற்றும் ஷார்ட்-CoT மாடல்களை ஒருங்கிணைக்கிறது. குறுகிய நிராகரிப்பு மாதிரி, சிறந்த ட்யூனிங்கிற்காக குறுகிய சரியான பதிலை தேர்ந்தெடுக்கிறது. DPO, பயிற்சி தரவுகளுக்காக குறுகிய மற்றும் நீண்ட பதில்களைப் பயன்படுத்துகிறது. லாங்2ஷார்ட் RL, நீள அபராதத்துடன் ஒரு தனி பயிற்சி கட்டத்தை உள்ளடக்கியது.
எதிர்கால இலக்குகள்
மூன்ஷாட் AI நிறுவனம், தனது k-தொடர் வலுவூட்டல் கற்றல் மாடல்களை மேம்படுத்துவதில் உறுதியாக உள்ளது. அவர்கள் அதிக முறைகள், பரந்த திறன்கள் மற்றும் மேம்படுத்தப்பட்ட பொது திறன்களை அறிமுகப்படுத்த திட்டமிட்டுள்ளனர். இந்த லட்சிய பார்வை, ஓபன்ஏஐ போன்ற நிறுவப்பட்ட நிறுவனங்களின் ஆதிக்கத்தை சவால் செய்யக்கூடிய ஒரு முக்கிய வீரராக அவர்களை நிலைநிறுத்துகிறது.
உள்நாட்டு கண்டுபிடிப்பின் அடையாளம்
கிமி கே1.5 மாடல் ஒரு தொழில்நுட்ப சாதனை மட்டுமல்ல, AI துறையில் உள்நாட்டு கண்டுபிடிப்பின் திறனுக்கான அடையாளமாகும். அதன் சிறப்பான செயல்திறன் மற்றும் பயிற்சி விவரங்களை வெளிப்படையாகப் பகிர்வதன் மூலம், கிமி கே1.5 உலகெங்கிலும் AI மேம்பாட்டிற்கான ஒரு புதிய தரத்தை அமைக்கிறது. இதன் வெளியீட்டிற்கான எதிர்பார்ப்பு அதிகமாக உள்ளது, மேலும் இதன் தாக்கம் ஆழமானதாக இருக்கும் என்று எதிர்பார்க்கப்படுகிறது.