- Published on
Miundo Mipya ya OpenAI: O3 na O3-Mini
Utangulizi wa Miundo ya O3 na O3-Mini
OpenAI hivi karibuni imetangaza miundo yake mipya ya akili bandia, O3 na O3-Mini, huku ikiruka jina la O2 kutokana na masuala ya kisheria yanayohusiana na alama ya biashara. Miundo hii inawakilisha hatua kubwa mbele katika uwezo wa akili bandia, haswa katika uwezo wa kufikiri, kutatua matatizo magumu, na kufanya hesabu. O3 inajulikana kwa uwezo wake mkuu wa kufikiri na inakaribia kufikia kiwango cha AGI (Artificial General Intelligence), huku O3-Mini ikitoa suluhisho nyepesi, la haraka, na lenye gharama nafuu kwa kazi za kila siku.
O3: Muundo Wenye Nguvu Zaidi wa Kufikiri
Utendaji
O3 imefanya vizuri sana katika majaribio mbalimbali yanayoangalia uwezo wa kufikiri. Katika hesabu, imefikia alama ya 96.7% katika shindano la AIME, ikiwashinda wataalamu wa binadamu na miundo mingine ya awali ya akili bandia. Pia, imepata alama ya 2727 kwenye CodeForces, na kuiweka miongoni mwa programu bora 200 duniani. Zaidi ya hayo, O3 imepata alama ya 87.5% kwenye kipimo cha ARC-AGI, ikiwa imevuka kiwango cha binadamu cha 85%.
Sifa Muhimu
Muundo wa O3 unatoa maboresho makubwa katika uhandisi wa programu, hesabu, na kufikiri kisayansi. Pia, imefanya vizuri sana katika jaribio la FrontierMath, ambalo ni jaribio gumu sana la hesabu. Uwezo wake wa kufikiri wa hali ya juu na uwezo wa kujumlisha umedhihirishwa na utendaji wake bora kwenye kipimo cha ARC-AGI.
Athari
Ujio wa O3 ni hatua kubwa mbele katika uwezo wa akili bandia, na kuifanya ikaribie zaidi kufikia AGI. Hii inasisitiza uwezekano wa akili bandia katika kutatua matatizo magumu katika nyanja mbalimbali.
O3-Mini: Haraka na Gharama Nafuu Zaidi
Sifa
O3-Mini ni toleo dogo, la haraka, na lenye gharama nafuu zaidi la O3. Inatoa njia tatu za muda wa kufanya kazi (chini, kati, juu) kwa ajili ya kushughulikia kazi kwa urahisi. Inafaa kwa mazingira yenye rasilimali chache na kazi za kila siku.
Uwezo
O3-Mini inafanya vizuri katika hesabu za msingi, kuandika programu, na kazi za kufikiri kwa ujumla. Imeonyesha uwezo wa kuandika na kutekeleza programu, ikiwa ni pamoja na wito wa API na ushirikiano wa kiolesura cha mtumiaji. Pia, inaweza kufanya majaribio ya kujaribu, kama inavyoonyeshwa na utendaji wake kwenye hifadhidata ya GPQA.
Matumizi
O3-Mini ni bora kwa miradi ya kati na midogo, programu za msingi, uchambuzi wa data, na madhumuni ya kielimu. Inatoa chaguo linalopatikana zaidi kwa watumiaji wenye rasilimali ndogo za kompyuta.
Matukio Muhimu ya Siku 12 ya OpenAI
OpenAI ilifanya matukio ya siku 12 ambapo ilitangaza maendeleo mbalimbali katika miundo na zana zake za akili bandia:
- Siku ya 1: Toleo kamili la muundo wa o1 na akili iliyoboreshwa, kasi, na msaada wa pembejeo za aina nyingi; mpango wa usajili wa ChatGPT Pro.
- Siku ya 2: Utangulizi wa Reinforcement Learning Fine-Tuning (RFT) kwa utendaji bora wa muundo.
- Siku ya 3: Sora Turbo, muundo wa haraka wa kutengeneza video na azimio la juu na vipengele vya kuhariri.
- Siku ya 4: Zana ya Canvas iliyoboreshwa na vipengele vipya na kiolesura kinachofaa mtumiaji.
- Siku ya 5: Unganisho la ChatGPT na vifaa vya Apple (iOS, iPadOS, macOS).
- Siku ya 6: Hali ya juu ya sauti ya ChatGPT iliyoimarishwa na uelewa wa video wa wakati halisi.
- Siku ya 7: Uzinduzi wa "Miradi" kwa ajili ya kusimamia mazungumzo na faili.
- Siku ya 8: Utoaji kamili wa Utafutaji wa ChatGPT na kasi iliyoboreshwa, usahihi, na utafutaji wa sauti.
- Siku ya 9: Utoaji wa API ya o1 na utambuzi bora wa kuona na mwingiliano wa sauti wa wakati halisi.
- Siku ya 10: Ushirikiano wa WhatsApp na huduma ya 1-800-CHAT-GPT.
- Siku ya 11: Toleo la ChatGPT la kompyuta ya mezani na ufikiaji wa programu mbalimbali.
- Siku ya 12: Utoaji wa miundo ya o3 na o3-mini.
Dhana Muhimu Zilizoelezwa
- AIME (American Invitational Mathematics Examination): Shindano gumu la hisabati kwa wanafunzi wa shule za upili nchini Marekani.
- CodeForces: Jukwaa maarufu kwa mashindano ya programu.
- ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence): Kipimo kilichoundwa kupima uwezo wa AI wa kujumlisha na kufikiri katika hali mpya.
- GPQA (General Purpose Question Answering): Hifadhidata ya maswali magumu ya chaguo nyingi katika nyanja mbalimbali za kisayansi.
- FrontierMath: Kipimo kigumu sana cha hisabati kilichoandaliwa na wataalamu wa hisabati wa ngazi ya juu.
Hitimisho
Kutolewa kwa o3 na o3-mini kunaashiria hatua muhimu mbele katika maendeleo ya AI. Wakati o3 imebuniwa kwa kazi ngumu na mazingira ya utendaji wa hali ya juu, o3-mini inatoa suluhisho linalopatikana zaidi na lenye gharama nafuu kwa matumizi ya kila siku. Matukio ya siku 12 ya OpenAI yanaonyesha dhamira yao ya kusukuma mipaka ya AI na kuiunganisha katika nyanja mbalimbali za maisha. Safari kuelekea AGI inaendelea, na miundo hii inawakilisha hatua muhimu.