Published on

ओ1: एक विशिष्ट चैट मॉडल नहीं

लेखक
  • avatar
    नाम
    Ajax
    Twitter

ओ1: एक विशिष्ट चैट मॉडल नहीं

यह लेख ओ1 मॉडल के बारे में हालिया चर्चा पर प्रकाश डालता है, यह स्पष्ट करता है कि इसे चैट मॉडल के रूप में डिज़ाइन नहीं किया गया है, भले ही कई उपयोगकर्ताओं ने शुरू में इसे ऐसा माना था। यह खुलासा "ओ1 एक चैट मॉडल नहीं है (और यही बात है)" शीर्षक वाले एक ब्लॉग पोस्ट के बाद आया, जिसने काफी ध्यान आकर्षित किया, यहां तक कि OpenAI के सीईओ सैम ऑल्टमैन और अध्यक्ष ग्रेग ब्रॉकमैन का भी ध्यान आकर्षित किया।

गलतफहमी और निराशाएँ

स्पेसएक्स के पूर्व सॉफ्टवेयर इंजीनियर और एप्पल विजनओएस के लिए एक इंटरेक्शन डिजाइनर, बेन हाइलक ने ओ1 के साथ अपने निराशाजनक अनुभव को साझा किया। उन्होंने पाया कि इसकी प्रतिक्रियाएं धीमी, अक्सर विरोधाभासी और अनचाही आर्किटेक्चर आरेख और पेशेवरों और विपक्षों की सूचियों से भरी हुई थीं। हाइलक की प्रारंभिक प्रतिक्रिया यह थी कि ओ1 बस "कचरा" था।

  • हाइलैक को प्रतिक्रियाओं के लिए 5 मिनट तक इंतजार करना पड़ा।
  • प्रतिक्रियाएँ अक्सर आत्म-विरोधाभासी और बेतुकी होती थीं।
  • मॉडल ने बिना मांगे आरेख और सूचियाँ प्रदान कीं।

उनकी निराशा के कारण सोशल मीडिया पर अपनी निराशा व्यक्त करते हुए पोस्ट किए गए, जिसमें कहा गया कि ओ1 प्रो "वास्तव में खराब" था, और इसका आउटपुट "लगभग बकवास" था। उन्होंने रिफैक्टरिंग सलाह मांगने का उदाहरण दिया, केवल मॉडल के फ़ाइलों को मर्ज करने का सुझाव देने, कोड प्रदान करने के लिए जो फ़ाइलों को मर्ज नहीं करता था, और फिर असंबंधित निष्कर्षों पर कूदने के लिए।

दृष्टिकोण में बदलाव

हाइलैक का अनुभव सार्वभौमिक नहीं था। कुछ उपयोगकर्ताओं ने ओ1 को अत्यधिक प्रभावी पाया, जिससे आगे चर्चा हुई। इन बातचीत के माध्यम से, हाइलक ने अपनी गलती का एहसास किया: वह ओ1 को चैट मॉडल के रूप में उपयोग कर रहे थे, जब इसे इस तरह से काम करने का इरादा नहीं था।

इस दृष्टिकोण में बदलाव का ऑल्टमैन ने स्वागत किया, जिन्होंने कहा कि "ओ1 (प्रो संस्करण सहित) का उपयोग करने का तरीका सीखने पर लोगों के दृष्टिकोण को बदलते देखना दिलचस्प है।" ग्रेग ब्रॉकमैन ने इस बात को दोहराया कि ओ1 एक अलग तरह का मॉडल है और इष्टतम प्रदर्शन के लिए एक अलग दृष्टिकोण की आवश्यकता है।

ओ1: एक रिपोर्ट जनरेटर

लेख में सुझाव दिया गया है कि चैट मॉडल के बजाय, ओ1 को "रिपोर्ट जनरेटर" के रूप में देखा जाना चाहिए। पर्याप्त संदर्भ और स्पष्ट आउटपुट आवश्यकताओं को देखते हुए, ओ1 प्रभावी ढंग से समाधान प्रदान कर सकता है। कुंजी यह है कि मॉडल का उपयोग कैसे किया जाता है।

त्वरित से संक्षिप्त तक

जब विशिष्ट चैट मॉडल का उपयोग करते हैं, तो उपयोगकर्ता अक्सर सरल प्रश्नों से शुरू करते हैं और आवश्यकतानुसार संदर्भ जोड़ते हैं, और बार-बार बातचीत करते हैं। हालाँकि, ओ1 अतिरिक्त संदर्भ नहीं चाहता है। इसके बजाय, उपयोगकर्ताओं को पहले से ही बहुत सारे संदर्भ प्रदान करने की आवश्यकता है, जिसे "टन" जानकारी के रूप में वर्णित किया गया है, या मानक संकेत के लिए उपयोग किए जाने वाले संदर्भ से लगभग दस गुना अधिक।

  • प्रयास किए गए समाधानों के सभी विवरण प्रदान करें।
  • पूर्ण डेटाबेस स्कीमा डंप शामिल करें।
  • कंपनी-विशिष्ट व्यवसाय, पैमाने और शब्दावली की व्याख्या करें।

यह सलाह दी जाती है कि ओ1 को एक नए कर्मचारी की तरह व्यवहार करें, और शुरू से ही सभी आवश्यक जानकारी प्रदान करें।

वांछित आउटपुट पर ध्यान दें

व्यापक संदर्भ प्रदान करने के बाद, उपयोगकर्ताओं को वांछित आउटपुट को स्पष्ट रूप से परिभाषित करना होगा। अन्य मॉडलों के विपरीत, जहां उपयोगकर्ता व्यक्तित्व या विचार प्रक्रिया निर्दिष्ट कर सकते हैं, ओ1 के साथ, आपको केवल इस बात पर ध्यान केंद्रित करना चाहिए कि आप "क्या" चाहते हैं, न कि मॉडल को यह "कैसे" करना चाहिए। यह ओ1 को स्वतंत्र रूप से आवश्यक चरणों की योजना बनाने और उन्हें निष्पादित करने की अनुमति देता है, जिससे तेज़ और अधिक कुशल परिणाम मिलते हैं।

ओ1 की ताकत और कमजोरियाँ

ओ1 कई क्षेत्रों में उत्कृष्ट है:

  • पूरी फ़ाइलों को संसाधित करना: यह बड़े कोड ब्लॉक और व्यापक संदर्भ को संभाल सकता है, अक्सर न्यूनतम त्रुटियों के साथ पूरी फ़ाइलों को पूरा करता है।
  • मरीजों की संख्या को कम करना: ओ1 कस्टम क्वेरी भाषाओं (जैसे, क्लिकहाउस और न्यू रेलिक) जैसे क्षेत्रों में सटीक है, जबकि अन्य मॉडल सिंटैक्स को भ्रमित कर सकते हैं।
  • चिकित्सा निदान: ओ1 छवियों और विवरणों के आधार पर आश्चर्यजनक रूप से सटीक प्रारंभिक निदान प्रदान कर सकता है।
  • अवधारणाओं की व्याख्या करना: यह उदाहरणों के माध्यम से जटिल इंजीनियरिंग अवधारणाओं को समझाने में कुशल है।
  • वास्तुशिल्प योजनाएँ तैयार करना: ओ1 कई योजनाएँ बना सकता है, उनकी तुलना कर सकता है और पेशेवरों और विपक्षों की सूची बना सकता है।
  • मूल्यांकन: यह परिणामों का मूल्यांकन करने के लिए एक प्रभावी उपकरण के रूप में आशाजनक है।

हालाँकि, ओ1 की सीमाएँ भी हैं:

  • विशिष्ट शैलियों में लिखना: यह एक शैक्षणिक या कॉर्पोरेट शैली में रिपोर्ट तैयार करता है और विशिष्ट स्वरों के अनुकूल होने में संघर्ष करता है।
  • पूर्ण एप्लिकेशन बनाना: पूरी फ़ाइलें उत्पन्न करने में कुशल होने के बावजूद, यह पुनरावृत्ति के माध्यम से पूर्ण सास एप्लिकेशन नहीं बना सकता है। हालाँकि, यह पूरी सुविधाएँ, विशेष रूप से फ्रंट-एंड या सरल बैक-एंड कार्यक्षमताएँ पूरी कर सकता है।

देरी का महत्व

लेख में कहा गया है कि देरी उत्पादों के बारे में हमारी धारणा को मौलिक रूप से बदल देती है, ईमेल बनाम टेक्स्ट मैसेजिंग और वॉयस मैसेज बनाम फोन कॉल जैसे उदाहरणों का हवाला दिया गया है। हाइलक ने ओ1 को चैट मॉडल के बजाय ईमेल के समान बताया है, क्योंकि इसकी प्रतिक्रियाओं में देरी होती है। यह देरी उच्च-विलंबता, लंबी-चलने वाली पृष्ठभूमि खुफिया जानकारी से लाभान्वित होने वाले नए प्रकार के उत्पादों की अनुमति देती है। फिर सवाल यह उठता है कि लोग किन कार्यों के लिए 5 मिनट, एक घंटा, एक दिन या यहां तक कि 3-5 व्यावसायिक दिनों तक इंतजार करने को तैयार हैं?

यह ध्यान रखना महत्वपूर्ण है कि ओ1-प्रीव्यू और ओ1-मिनी स्ट्रीमिंग का समर्थन करते हैं लेकिन संरचित पीढ़ी या सिस्टम संकेतों का नहीं, जबकि ओ1 संरचित पीढ़ी और सिस्टम संकेतों का समर्थन करता है लेकिन स्ट्रीमिंग का नहीं। 2025 में उत्पादों को डिजाइन करते समय डेवलपर्स के लिए इन अंतरों को समझना महत्वपूर्ण होगा।