- Published on
o1 Sio Mfumo wa Gumzo: Mabadiliko ya Mtazamo Baada ya Altman na Brockman
Uelewa Potofu Kuhusu o1
Makala hii inazungumzia kuhusu mfumo wa o1, ambapo watumiaji wengi walidhani ni mfumo wa gumzo. Hata hivyo, baada ya chapisho la blogu lenye kichwa "o1 sio mfumo wa gumzo (na hilo ndilo jambo kuu)" kupata umaarufu, ilifahamika kuwa o1 haikukusudiwa kuwa mfumo wa gumzo. Hii ilivutia hata umakini wa Mkurugenzi Mkuu wa OpenAI, Sam Altman, na Rais Greg Brockman.
Uzoefu wa Ben Hylak na o1
Ben Hylak, ambaye alikuwa mhandisi wa programu katika SpaceX na mbunifu wa mwingiliano wa Apple VisionOS, alieleza uzoefu wake wenye kufadhaisha na o1. Aligundua kuwa majibu yake yalikuwa ya polepole, mara nyingi yanapingana, na kujazwa na michoro ya usanifu na orodha za faida na hasara zisizoombwa. Hylak alihisi kuwa o1 ilikuwa "takataka."
- Majibu yalichukua hadi dakika 5.
- Majibu yalikuwa yanapingana na hayakuwa na maana.
- Mfumo ulitoa michoro na orodha zisizoombwa.
Ufadhaiko huu ulimpelekea kuandika kwenye mitandao ya kijamii akieleza kukata tamaa kwake, akisema kuwa o1 pro ilikuwa "mbaya sana," na matokeo yake yalikuwa "karibu upuuzi." Alitoa mfano wa kuomba ushauri wa kurekebisha msimbo, ambapo mfumo ulipendekeza kuunganisha faili, kutoa msimbo ambao haukuunganisha faili, na kisha kurukia hitimisho lisilohusiana.
Mabadiliko ya Mtazamo
Uzoefu wa Hylak haukuwa wa wote. Baadhi ya watumiaji waligundua kuwa o1 ilikuwa na ufanisi mkubwa, jambo lililosababisha majadiliano zaidi. Kupitia majadiliano haya, Hylak aligundua kosa lake: alikuwa akitumia o1 kama mfumo wa gumzo wakati haikukusudiwa kufanya kazi hivyo.
Altman alikaribisha mabadiliko haya ya mtazamo, akisema ilikuwa "ya kuvutia kuona mitazamo ya watu ikibadilika wanapojifunza jinsi ya kutumia o1 (pamoja na toleo la pro)." Greg Brockman alikubaliana naye kwa kusisitiza kuwa o1 ni mfumo tofauti na unahitaji mbinu tofauti kwa utendaji bora.
o1 Kama Jenereta ya Ripoti
Makala inapendekeza kuwa badala ya mfumo wa gumzo, o1 inapaswa kuonekana kama "jenereta ya ripoti." Ikiwa imepatiwa muktadha wa kutosha na mahitaji wazi ya matokeo, o1 inaweza kutoa suluhu kwa ufanisi. Muhimu ni jinsi mfumo unavyotumiwa.
Kutoka Ujumbe Rahisi hadi Mipango Kamili
Wakati wa kutumia mifumo ya gumzo ya kawaida, watumiaji huanza na maswali rahisi na kuongeza muktadha inapohitajika. Hata hivyo, o1 haitafuti muktadha wa ziada. Badala yake, watumiaji wanahitaji kutoa muktadha mwingi mwanzoni, au mara kumi ya muktadha ambao ungetumia kwa ujumbe wa kawaida.
- Toa maelezo yote ya suluhu zilizojaribiwa.
- Jumuisha nakala kamili za schema ya hifadhidata.
- Eleza biashara, kiwango, na istilahi maalum za kampuni.
Inashauriwa kutumia o1 kama mfanyakazi mpya, ukitoa taarifa zote muhimu tangu mwanzo.
Kuzingatia Matokeo Yanayohitajika
Baada ya kutoa muktadha mwingi, watumiaji lazima waeleze wazi matokeo wanayotaka. Tofauti na mifumo mingine ambapo watumiaji wanaweza kubainisha tabia au mchakato wa kufikiri, kwa o1, unapaswa kuzingatia tu "nini" unataka, sio "jinsi" mfumo unapaswa kufanya. Hii inaruhusu o1 kupanga na kutekeleza hatua zinazohitajika kwa kujitegemea, na kusababisha matokeo ya haraka na yenye ufanisi zaidi.
Nguvu na Udhaifu wa o1
o1 ina ubora katika maeneo kadhaa:
- Kuchakata faili nzima: Inaweza kushughulikia msimbo mrefu na muktadha mwingi, mara nyingi ikikamilisha faili nzima bila makosa.
- Kupunguza uongo: o1 ni sahihi katika lugha maalum za maswali, kama ClickHouse na New Relic.
- Utambuzi wa kimatibabu: o1 inaweza kutoa utambuzi sahihi wa awali kulingana na picha na maelezo.
- Kueleza dhana: Ina ujuzi wa kueleza dhana ngumu za uhandisi kupitia mifano.
- Kutoa mipango ya usanifu: o1 inaweza kuunda mipango mingi, kulinganisha, na kuorodhesha faida na hasara.
- Tathmini: Inaonyesha uwezo kama chombo cha kutathmini matokeo.
Hata hivyo, o1 pia ina mapungufu:
- Kuandika kwa mitindo maalum: Inatoa ripoti kwa mtindo wa kitaaluma au wa kibiashara, na inatatizika kubadilika kwa mitindo maalum.
- Kujenga programu nzima: Ingawa ni hodari katika kutoa faili nzima, haiwezi kujenga programu kamili ya SaaS kupitia marudio. Hata hivyo, inaweza kukamilisha vipengele vyote, hasa vipengele vya mbele au utendaji rahisi wa nyuma.
Umuhimu wa Ucheleweshaji
Makala inasema kuwa ucheleweshaji hubadilisha mtazamo wetu wa bidhaa, ikitoa mifano kama barua pepe dhidi ya ujumbe wa maandishi, na ujumbe wa sauti dhidi ya simu. Hylak anafananisha o1 na barua pepe badala ya mfumo wa gumzo, kutokana na ucheleweshaji katika majibu yake. Ucheleweshaji huu unaruhusu aina mpya za bidhaa ambazo hunufaika na akili ya nyuma ya muda mrefu. Swali linakuwa: ni kazi gani watu wako tayari kusubiri dakika 5, saa, siku, au hata siku 3-5 za kazi?
Ni muhimu kutambua kuwa o1-preview na o1-mini huunga mkono utiririshaji lakini si uzalishaji uliopangwa au ujumbe wa mfumo, wakati o1 huunga mkono uzalishaji uliopangwa na ujumbe wa mfumo lakini si utiririshaji. Kuelewa tofauti hizi kutakuwa muhimu kwa wasanidi programu wakati wa kubuni bidhaa mwaka 2025.