Published on

ओपनएआयचे नवीन मॉडेल: ओ३ आणि ओ३-मिनी

लेखक
  • avatar
    नाव
    Ajax
    Twitter

ओपनएआयचे नवीन मॉडेल: ओ३ आणि ओ३-मिनी

ओपनएआयने (OpenAI) त्यांचे नवीन मॉडेल, ओ३ (o3) आणि ओ३-मिनी (o3-mini) सादर केले आहेत. कंपनीने 'ओ२' हे मॉडेल ट्रेडमार्कच्या (trademark) वादामुळे वगळले आहे. ओ३ हे मॉडेल अत्यंत शक्तिशाली असून ते मानवी बुद्धिमत्तेच्या जवळपास पोहोचले आहे. हे मॉडेल जटिल विचार प्रक्रिया आणि समस्या सोडवण्यासाठी उत्कृष्ट आहे. दुसरीकडे, ओ३-मिनी हे मॉडेल लहान, जलद आणि कमी खर्चात उपलब्ध आहे, जे रोजच्या कामांसाठी अधिक सोयीचे आहे. या दोन्ही मॉडेलमुळे कृत्रिम बुद्धिमत्ता (Artificial Intelligence) क्षेत्रात मोठी प्रगती झाली आहे, विशेषत: गणित, कोडिंग (coding) आणि अमूर्त समस्या सोडवण्यात.

पार्श्वभूमी

कृत्रिम सामान्य बुद्धिमत्ता (AGI): ही एक काल्पनिक पातळी आहे जिथे कृत्रिम बुद्धिमत्ता कोणतीही बौद्धिक क्रिया करू शकते, जी माणूस करू शकतो.

ओपनएआयचा १२ दिवसांचा कार्यक्रम: या कार्यक्रमात, ओपनएआयने त्यांच्या विविध कृत्रिम बुद्धिमत्ता मॉडेल आणि साधनांमधील प्रगती दर्शवली.

ट्रेडमार्कचा मुद्दा: 'ओ२' मॉडेल वगळण्याचे कारण म्हणजे ब्रिटिश दूरसंचार कंपनी 'O2' सोबत ट्रेडमार्कचा वाद टाळणे.

मुख्य माहिती

१. ओ३: सर्वात शक्तिशाली मॉडेल

  • कार्यक्षमता:
    • गणितीय विचारामध्ये उत्कृष्ट, एआयएमई (AIME) गणित स्पर्धेत ९६.७% गुण मिळवले, जे मागील मॉडेल आणि मानवी तज्ञांपेक्षा जास्त आहेत.
    • कोडफोर्सेसमध्ये (CodeForces) २७२७ गुण मिळवले, ज्यामुळे ते जागतिक स्तरावर २०० सर्वोत्तम प्रोग्रामरमध्ये आहेत.
    • एआरसी-एजीआय (ARC-AGI) बेंचमार्कवर ८७.५% गुण मिळवले, जे मानवी थ्रेशोल्ड ८५% पेक्षा जास्त आहेत.
  • मुख्य वैशिष्ट्ये:
    • सॉफ्टवेअर अभियांत्रिकी (software engineering), गणित आणि वैज्ञानिक विचारामध्ये लक्षणीय सुधारणा दर्शवते.
    • फ्रंटियरमॅथ (FrontierMath) बेंचमार्कवर उत्कृष्ट कामगिरी, जी एक अत्यंत कठीण गणितीय चाचणी आहे.
    • अमूर्त विचार आणि सामान्यीकरणामध्ये उल्लेखनीय क्षमता, जी एआरसी-एजीआय बेंचमार्कच्या कामगिरीवरून दिसून येते.
  • परिणाम:
    • कृत्रिम बुद्धिमत्तेच्या क्षमतेत मोठी झेप, जी एजीआयच्या जवळ जात आहे.
    • विविध क्षेत्रांतील जटिल समस्या सोडवण्यासाठी कृत्रिम बुद्धिमत्तेची क्षमता दर्शवते.

२. ओ३-मिनी: जलद आणि कमी खर्चिक

  • वैशिष्ट्ये:
    • ओ३ चे लहान, जलद आणि कमी खर्चिक मॉडेल.
    • लवचिक कार्य हाताळणीसाठी तीन अनुमान वेळ मोड (कमी, मध्यम, उच्च) देते.
    • कमी संसाधने असलेल्या वातावरणात आणि रोजच्या कामांसाठी उपयुक्त.
  • क्षमता:
    • गणित, कोडिंग आणि सामान्य विचार कार्यांमध्ये चांगली कामगिरी करते.
    • एपीआय कॉल (API calls) आणि यूजर इंटरफेस इंटिग्रेशन (user interface integration) सह कोड तयार करण्याची आणि चालवण्याची क्षमता दर्शविली.
    • जीपीक्यूए (GPQA) डेटासेटवरील कामगिरीनुसार, स्वतःची चाचणी करू शकते.
  • उपयोग:
    • मध्यम आणि लहान प्रकल्प, मूलभूत प्रोग्रामिंग, डेटा विश्लेषण आणि शैक्षणिक उद्देशांसाठी आदर्श.
    • मर्यादित संगणकीय संसाधने असलेल्या वापरकर्त्यांसाठी अधिक सुलभ पर्याय.

३. ओपनएआयच्या १२ दिवसांतील कार्यक्रमाचे मुख्य मुद्दे

  • पहिला दिवस: ओ१ मॉडेलचे पूर्ण व्हर्जन (full version), सुधारित बुद्धिमत्ता, वेग आणि मल्टी-मॉडल इनपुट सपोर्ट (multi-modal input support); चॅटजीपीटी प्रो (ChatGPT Pro) सबस्क्रिप्शन योजना.
  • दुसरा दिवस: मॉडेलची कार्यक्षमता सुधारण्यासाठी रीइन्फोर्समेंट लर्निंग फाइन-ट्यूनिंग (RFT) ची ओळख.
  • तिसरा दिवस: सोरा टर्बो (Sora Turbo), एक जलद व्हिडिओ जनरेशन मॉडेल (video generation model) उच्च रिझोल्यूशन आणि संपादन वैशिष्ट्यांसह.
  • चौथा दिवस: नवीन वैशिष्ट्ये आणि वापरकर्ता-अनुकूल इंटरफेससह (user-friendly interface) अपग्रेड केलेले कॅनव्हास (Canvas) साधन.
  • पाचवा दिवस: ॲपल (Apple) उपकरणांमध्ये (iOS, iPadOS, macOS) चॅटजीपीटीचे एकत्रीकरण.
  • सहावा दिवस: रिअल-टाइम व्हिडिओ आकलन (real-time video understanding) सह चॅटजीपीटीचा प्रगत व्हॉइस मोड (advanced voice mode).
  • सातवा दिवस: संभाषणे आणि फाइल्स व्यवस्थापित करण्यासाठी 'प्रोजेक्ट्स' (Projects) चा प्रारंभ.
  • आठवा दिवस: सुधारित वेग, अचूकता आणि व्हॉइस सर्चसह (voice search) चॅटजीपीटी सर्चचे पूर्ण प्रकाशन.
  • नववा दिवस: कार्यक्षम व्हिज्युअल रिकॉग्निशन (visual recognition) आणि रिअल-टाइम व्हॉइस इंटरॅक्शनसह (real-time voice interaction) ओ१ एपीआय (API) प्रकाशन.
  • दहावा दिवस: व्हॉट्सॲप (WhatsApp) एकत्रीकरण १-८००-चॅट-जीपीटी (1-800-CHAT-GPT) सेवेसह.
  • अकरावा दिवस: क्रॉस-ॲप्लिकेशन ॲक्सेससह (cross-application access) चॅटजीपीटी डेस्कटॉप आवृत्ती.
  • बारावा दिवस: ओ३ आणि ओ३-मिनी मॉडेलचे प्रकाशन.

मुख्य संकल्पना

  • एआयएमई (AIME): अमेरिकेतील हायस्कूल विद्यार्थ्यांसाठी एक अत्यंत कठीण गणितीय स्पर्धा.
  • कोडफोर्सेस (CodeForces): स्पर्धात्मक प्रोग्रामिंग स्पर्धेसाठी एक लोकप्रिय मंच.
  • एआरसी-एजीआय (ARC-AGI): कृत्रिम बुद्धिमत्तेची नवीन परिस्थितीत सामान्यीकरण आणि तर्क करण्याची क्षमता मोजण्यासाठी डिझाइन केलेले बेंचमार्क.
  • जीपीक्यूए (GPQA): विविध वैज्ञानिक क्षेत्रांतील आव्हानात्मक बहुपर्यायी प्रश्नांचा डेटासेट.
  • फ्रंटियरमॅथ (FrontierMath): उच्च गणितज्ञांनी विकसित केलेले एक अत्यंत कठीण गणितीय बेंचमार्क.

ओ३ आणि ओ३-मिनी मॉडेलचे प्रकाशन हे कृत्रिम बुद्धिमत्तेच्या विकासातील एक महत्त्वाचे पाऊल आहे, जे विचार करण्याच्या क्षमतेमध्ये उल्लेखनीय प्रगती दर्शवते. ओ३ हे मॉडेल जटिल कार्ये आणि उच्च-कार्यक्षमतेच्या वातावरणासाठी डिझाइन केलेले आहे, तर ओ३-मिनी हे रोजच्या ॲप्लिकेशन्ससाठी अधिक सुलभ आणि किफायतशीर उपाय आहे. ओपनएआयचा १२ दिवसांचा कार्यक्रम कृत्रिम बुद्धिमत्तेच्या सीमा वाढवण्यासाठी आणि जीवनातील विविध पैलूंमध्ये त्याचा वापर करण्यासाठी त्यांची बांधिलकी दर्शवतो. एजीआयच्या दिशेने वाटचाल सुरू आहे आणि हे मॉडेल एक महत्त्वाचा टप्पा आहेत.