Published on

o1 चॅट मॉडेल नाही एक रिपोर्ट जनरेटर

लेखक
  • avatar
    नाव
    Ajax
    Twitter

o1: एक सामान्य चॅट मॉडेल नाही

हा लेख o1 मॉडेलच्या अलीकडील चर्चेवर प्रकाश टाकतो, हे स्पष्ट करतो की ते चॅट मॉडेल म्हणून डिझाइन केलेले नाही, जरी अनेक वापरकर्त्यांनी सुरुवातीला त्याला तसेच समजले. "o1 हे चॅट मॉडेल नाही (आणि हाच मुद्दा आहे)" या ब्लॉग पोस्टनंतर हे सत्य समोर आले, ज्याने OpenAI चे CEO सॅम अल्टमन आणि अध्यक्ष ग्रेग ब्रॉकमन यांचे लक्ष वेधून घेतले.

गैरसमज आणि निराशा

स्पेसएक्सचे माजी सॉफ्टवेअर इंजिनियर आणि ऍपल व्हिजनओएससाठी इंटरॅक्शन डिझायनर असलेल्या बेन हिलाक यांनी o1 सोबतचा त्यांचा निराशाजनक अनुभव सांगितला. त्यांना त्याचे प्रतिसाद हळू, अनेकदा विसंगत आणि न मागितलेल्या आर्किटेक्चर आकृत्या आणि फायदे-तोटे यांच्या याद्यांनी भरलेले आढळले. हिलाकची प्रतिक्रिया होती की o1 म्हणजे 'कचरा' आहे.

  • हिलाकला प्रतिसादासाठी 5 मिनिटे प्रतीक्षा करावी लागली.
  • प्रतिक्रिया अनेकदा परस्परविरोधी आणि अर्थहीन होत्या.
  • मॉडेलने न मागितलेल्या आकृत्या आणि याद्या पुरवल्या.

त्यांच्या निराशामुळे त्यांनी सोशल मीडियावर पोस्ट केल्या, ज्यात o1 प्रो 'खूप वाईट' आणि त्याचे आउटपुट 'जवळपास निरर्थक' असल्याचे म्हटले. त्यांनी रिफॅक्टरिंग सल्ल्यासाठी विचारले असता, मॉडेलने फाइल्स मर्ज करण्याचा सल्ला दिला, कोड पुरवला ज्याने फाइल्स मर्ज केल्या नाहीत आणि नंतर असंबंधित निष्कर्षांवर उडी मारली, असे उदाहरण दिले.

दृष्टिकोनात बदल

हिलाकचा अनुभव सार्वत्रिक नव्हता. काही वापरकर्त्यांना o1 अत्यंत प्रभावी आढळले, ज्यामुळे अधिक चर्चा झाली. या संवादातून, हिलाकला आपली चूक लक्षात आली: तो o1 ला चॅट मॉडेल म्हणून वापरत होता, तर ते तसे काम करण्यासाठी बनवलेले नव्हते.

या दृष्टिकोनातील बदलाचे अल्टमन यांनी स्वागत केले, ज्यांनी नमूद केले की "o1 (प्रो आवृत्तीसह) कसे वापरावे हे शिकल्यावर लोकांच्या दृष्टिकोन कसा बदलतो हे पाहणे मनोरंजक आहे." ग्रेग ब्रॉकमन यांनी यावर जोर दिला की o1 हे एक वेगळे मॉडेल आहे आणि इष्टतम कार्यक्षमतेसाठी वेगळ्या दृष्टिकोनाची आवश्यकता आहे.

o1: एक रिपोर्ट जनरेटर

लेखात असे म्हटले आहे की, चॅट मॉडेलऐवजी o1 ला "रिपोर्ट जनरेटर" म्हणून पाहिले पाहिजे. पुरेसा संदर्भ आणि स्पष्ट आउटपुट आवश्यकता दिल्यास, o1 प्रभावीपणे उपाय देऊ शकते. महत्त्वाचे म्हणजे मॉडेल कसे वापरले जाते.

प्रॉम्प्ट्स ते संक्षिप्त माहिती

सामान्य चॅट मॉडेल वापरताना, वापरकर्ते अनेकदा साध्या प्रश्नांनी सुरुवात करतात आणि आवश्यकतेनुसार संदर्भ जोडतात, सतत संवाद साधतात. तथापि, o1 अतिरिक्त संदर्भ शोधत नाही. त्याऐवजी, वापरकर्त्यांनी भरपूर संदर्भ सुरुवातीलाच देणे आवश्यक आहे, ज्याला 'भरपूर' माहिती किंवा मानक प्रॉम्प्टसाठी वापरल्या जाणार्‍या संदर्भापेक्षा दहापट जास्त संदर्भ देणे आवश्यक आहे.

  • प्रयत्न केलेल्या उपायांचे सर्व तपशील द्या.
  • संपूर्ण डेटाबेस स्कीमा डंप समाविष्ट करा.
  • कंपनी-विशिष्ट व्यवसाय, प्रमाण आणि शब्दावली स्पष्ट करा.

o1 ला नवीन कर्मचारी म्हणून वागवण्याची शिफारस केली जाते, ज्यामध्ये सुरुवातीपासूनच सर्व आवश्यक माहिती दिली जाते.

इच्छित आउटपुटवर लक्ष केंद्रित करा

भरपूर संदर्भ दिल्यानंतर, वापरकर्त्यांनी इच्छित आउटपुट स्पष्टपणे परिभाषित केले पाहिजे. इतर मॉडेल्समध्ये वापरकर्ते व्यक्तिरेखा किंवा विचार प्रक्रिया निर्दिष्ट करू शकतात, तर o1 मध्ये, तुम्ही फक्त 'काय' हवे आहे यावर लक्ष केंद्रित केले पाहिजे, 'कसे' मॉडेलने ते करावे यावर नाही. हे o1 ला आवश्यक पाऊले स्वतंत्रपणे योजनाबद्ध करण्यास आणि कार्यान्वित करण्यास अनुमती देते, ज्यामुळे जलद आणि अधिक कार्यक्षम परिणाम मिळतात.

o1 ची बलस्थाने आणि कमतरता

o1 अनेक क्षेत्रांमध्ये उत्कृष्ट आहे:

  • संपूर्ण फाइल्सवर प्रक्रिया करणे: हे मोठ्या कोड ब्लॉक्स आणि विस्तृत संदर्भ हाताळू शकते, अनेकदा कमी त्रुटींसह संपूर्ण फाइल्स पूर्ण करते.
  • भ्रम कमी करणे: o1 कस्टम क्वेरी भाषांसारख्या (उदा. ClickHouse आणि New Relic) क्षेत्रांमध्ये अचूक आहे, तर इतर मॉडेल वाक्यरचना मिसळू शकतात.
  • वैद्यकीय निदान: o1 प्रतिमा आणि वर्णनांवर आधारित आश्चर्यकारकपणे अचूक प्राथमिक निदान देऊ शकते.
  • संकल्पना स्पष्ट करणे: हे उदाहरणांद्वारे जटिल अभियांत्रिकी संकल्पना स्पष्ट करण्यात कुशल आहे.
  • आर्किटेक्चर योजना तयार करणे: o1 अनेक योजना तयार करू शकते, त्यांची तुलना करू शकते आणि फायदे आणि तोटे सूचीबद्ध करू शकते.
  • मूल्यांकन: हे निकालांचे मूल्यांकन करण्यासाठी एक प्रभावी साधन म्हणून आशादायक आहे.

तथापि, o1 मध्ये काही मर्यादा देखील आहेत:

  • विशिष्ट शैलींमध्ये लेखन: हे शैक्षणिक किंवा कॉर्पोरेट शैलीत अहवाल तयार करते आणि विशिष्ट टोनमध्ये जुळवून घेण्यासाठी संघर्ष करते.
  • संपूर्ण ऍप्लिकेशन्स तयार करणे: संपूर्ण फाइल्स तयार करण्यात ते तरबेज असले तरी, ते पुनरावृत्तीद्वारे संपूर्ण SaaS ऍप्लिकेशन तयार करू शकत नाही. तथापि, ते संपूर्ण वैशिष्ट्ये, विशेषतः फ्रंट-एंड किंवा साधी बॅक-एंड कार्यक्षमता पूर्ण करू शकते.

विलंबाचे महत्त्व

लेखात असे नमूद केले आहे की विलंब उत्पादनांबद्दलची आपली धारणा मूलभूतपणे बदलतो, जसे की ईमेल वि. टेक्स्ट मेसेजिंग आणि व्हॉइस मेसेज वि. फोन कॉल. हिलाक o1 ची तुलना चॅट मॉडेलऐवजी ईमेलशी करतो, कारण त्याच्या प्रतिसादात विलंब लागतो. हा विलंब उच्च-विलंब, दीर्घकाळ चालणाऱ्या पार्श्वभूमी बुद्धिमत्तेचा फायदा घेणाऱ्या नवीन प्रकारच्या उत्पादनांना अनुमती देतो. मग प्रश्न असा आहे की, लोक कोणती कामे 5 मिनिटे, एक तास, एक दिवस किंवा 3-5 व्यावसायिक दिवसांसाठी थांबायला तयार असतील?

हे लक्षात घेणे महत्त्वाचे आहे की o1-preview आणि o1-mini स्ट्रीमिंगला सपोर्ट करतात, परंतु संरचित जनरेशन किंवा सिस्टम प्रॉम्प्ट्सला नाही, तर o1 संरचित जनरेशन आणि सिस्टम प्रॉम्प्ट्सला सपोर्ट करते, परंतु स्ट्रीमिंगला नाही. 2025 मध्ये उत्पादने डिझाइन करताना विकासकांसाठी हे फरक समजून घेणे महत्त्वाचे ठरेल.