Published on

एनवीडिया की विशिष्टताओं से परे क्रांति: जेन्सन हुआंग का विघटनकारी दृष्टिकोण

लेखक
  • avatar
    नाम
    Ajax
    Twitter

एनवीडिया की विशिष्टताओं से परे क्रांति: जेन्सन हुआंग का विघटनकारी दृष्टिकोण

2025 में CES में, जब जेन्सन हुआंग अपनी प्रतिष्ठित मगरमच्छ की चमड़े की जैकेट में दिखाई दिए, तो लोगों को एनवीडिया के नए कदमों की उम्मीद कम थी, और उनकी आकर्षक जैकेट पर अधिक ध्यान था। हालाँकि, भाषण की सामग्री कपड़ों की तुलना में कहीं अधिक प्रभावशाली थी, और जारी की गई नवीन तकनीकों ने एनवीडिया के अपने सम्मेलनों में परिणामों को भी पार कर लिया। तो, एनवीडिया वास्तव में क्या बाधित कर रहा है? आइए गहराई से जानें।

RTX ब्लैकवेल सीरीज़ GPU: नई पीढ़ी का 'रसायन'

एनवीडिया ने RTX ब्लैकवेल सीरीज़ GPU जारी किया, जिसमें RTX 5090 ग्राफिक्स कार्ड सबसे अधिक ध्यान आकर्षित करने वाला है। हालांकि हम यहां इसके शक्तिशाली मापदंडों का विस्तार नहीं करेंगे, यह उल्लेख करना महत्वपूर्ण है कि इस श्रृंखला में सबसे कमजोर 5070 ग्राफिक्स कार्ड में पिछली पीढ़ी के 4090 के बराबर प्रदर्शन है, जबकि कीमत एक तिहाई कम है।

यह सर्वविदित है कि उपभोक्ता-ग्रेड ग्राफिक्स कार्ड विशेष रूप से स्थानीय रूप से तैनात ओपन-सोर्स मॉडल के लिए उपयुक्त हैं। RTX 5090 को इसलिए नई पीढ़ी का "रसायन उपकरण" माना जाता है।

ब्लैक फॉरेस्ट स्टूडियो ने एनवीडिया के साथ मिलकर FLUX मॉडल को अनुकूलित किया है, जिससे 50 श्रृंखला ग्राफिक्स कार्ड पर अनुमान गति में काफी सुधार हुआ है। 5090 पर DEV मॉडल की अनुमान गति 4090 की तुलना में दोगुनी है। इसके अलावा, FLUX मॉडल का FP4 मात्रात्मक प्रारूप फरवरी में लॉन्च किया जाएगा।

बाजार में 5090 के प्री-सेल येलो कैटल पहले ही दिखाई दे चुके हैं, जो दर्शाता है कि इस वर्ष AI डिज़ाइन, AI स्टूडियो, AI कॉमिक्स और AI लघु नाटक जैसे क्षेत्रों में स्टूडियो में विस्फोटक वृद्धि होगी।

प्रोजेक्ट डिजिट्स: डेस्कटॉप क्लाउड प्लेटफॉर्म का बड़ा मॉडल क्रांति

यदि पेंटिंग सॉफ़्टवेयर को स्थानीय रूप से तैनात किया जा सकता है, तो क्या 13B से अधिक के मापदंडों वाले बड़े मॉडल भी हो सकते हैं? हुआंग ने सकारात्मक उत्तर दिया। एनवीडिया ने "प्रोजेक्ट डिजिट्स" डेस्कटॉप क्लाउड प्लेटफॉर्म कंप्यूटर लॉन्च किया, जो डेस्क पर 200 बिलियन मापदंडों के साथ बड़े मॉडल को चला सकता है, और केवल एक मानक पावर आउटलेट की आवश्यकता होती है।

डेस्कटॉप सिस्टम पर बड़े मॉडल के विकास या अनुमान को पूरा करने के बाद, इसे निर्बाध रूप से त्वरित क्लाउड या डेटा केंद्र में तैनात किया जा सकता है। यह व्यक्तिगत प्रशिक्षण सेटों के आधार पर समर्पित मॉडल के विस्फोट की संभावना प्रदान करता है। भविष्य में, डेवलपर्स स्थानीय रूप से 8-13B मॉडल तैनात कर सकते हैं, जिससे व्यक्तिगत रचनाकारों के बीच स्टेबल डिफ्यूजन के लोकप्रिय होने के दिनों को फिर से दोहराया जा सकता है। उनके लिए, $3,000 की लागत भी दुर्गम नहीं है।

NVIDIA GB200 NVL72: डेटा सेंटर सुपर चिप

एनवीडिया ने NVIDIA GB200 NVL72 लॉन्च किया, जो 72 ब्लैकवेल GPU, 1.4 exaFLOPS कंप्यूटिंग क्षमता और 130 ट्रिलियन ट्रांजिस्टर से लैस एक डेटा सेंटर सुपर चिप है। हुआंग ने तो इसे कैप्टन अमेरिका की ढाल भी बताया।

इस चिप की शक्ति यह है कि हुआंग के हाथ में ऐसी 6 चिप्स हैं, जिनकी कंप्यूटिंग शक्ति कई चीनी AI कंपनियों और कार कंपनियों की स्वायत्त ड्राइविंग के लिए पूरे कंप्यूटर रूम के बराबर है। तुलना के लिए, ली ऑटो की बुद्धिमान ड्राइविंग की कुल कंप्यूटिंग शक्ति 8.1 EFLOPS है। इस तरह की सुपर चिप्स से लैस डेटा केंद्रों के लगातार पूरा होने के साथ, अगली पीढ़ी के भाषा बड़े मॉडल, एंड-टू-एंड स्वायत्त ड्राइविंग, और रोबोट के विश्व मॉडल अब कंप्यूटिंग शक्ति की कमी से ग्रस्त नहीं होंगे।

कॉसमॉस मॉडल: AI को भौतिक दुनिया को समझने दें

एनवीडिया ने कॉसमॉस मॉडल जारी किया, एक विश्व मॉडल विकास मंच जो "AI को भौतिक दुनिया को समझने के लिए सिखाता है।" इसमें विश्व आधार मॉडल, टोकननाइज़र और वीडियो प्रोसेसिंग वर्कफ़्लो शामिल हैं, जो रोबोटिक्स और AV प्रयोगशालाओं के लिए एक आशीर्वाद है।

कॉसमॉस पाठ, छवियों या वीडियो से संकेत स्वीकार कर सकता है और आभासी दुनिया की स्थिति उत्पन्न कर सकता है, जिसका अर्थ है कि मशीनें अंततः मस्तिष्क में दुनिया का निर्माण और समझ सकती हैं। एक ओपन-सोर्स, ओपन-वेट वीडियो वर्ल्ड मॉडल के रूप में, इसे 20 मिलियन घंटे के वीडियो पर प्रशिक्षित किया जाता है, जिसमें 4 बिलियन से 14 बिलियन तक का भार होता है।

हालांकि विश्व मॉडल की कई परिभाषाएँ हैं, लेकिन कॉसमॉस की 4D सिमुलेशन क्षमता इसकी विशिष्टता है। इस तकनीक का हालिया क्रांतिकारी प्रभाव यह है कि सिंथेटिक डेटा भौतिक AI के सामने आने वाली बड़ी डेटा की कमी को दूर करेगा। एनवीडिया ने पहले ही रोबोटिक्स और स्वायत्त ड्राइविंग के बड़े पैमाने पर सिंथेटिक डेटा जनरेशन के लिए कॉसमॉस को लागू कर दिया है, और डेवलपर्स को डेटा को ठीक करने और रोबोट और AI को प्रशिक्षित करने के लिए इसका उपयोग करने के लिए खोल दिया है।

भौतिक AI पर दांव: स्वायत्त ड्राइविंग और रोबोटिक्स

एनवीडिया ने कंप्यूटिंग शक्ति, मॉडल और डेटा के संदर्भ में एक लेआउट बनाया है, और स्वायत्त ड्राइविंग और रोबोटिक्स के दो प्रमुख ट्रैकों पर दांव लगाया है जो सबसे पहले उभरेंगे। हुआंग ने तो यह भी भविष्यवाणी की है कि रोबोटैक्सी पहला ट्रिलियन-डॉलर का रोबोटिक्स उद्योग बन जाएगा।

स्वायत्त ड्राइविंग के लिए, एनवीडिया ने "थोर ब्लैकवेल" नामक अगली पीढ़ी का ऑटोमोटिव प्रोसेसर लॉन्च किया है, जिसकी प्रसंस्करण क्षमता पिछली पीढ़ी की चिप की तुलना में 20 गुना अधिक है, जिसका उपयोग मानव रोबोट के लिए भी किया जा सकता है। रोबोट के लिए, NVIDIA IsaacGroot डेवलपर्स को चार प्रमुख समर्थन प्रदान करता है: बुनियादी रोबोट मॉडल, डेटा पाइपलाइन, सिमुलेशन फ्रेमवर्क और थोर रोबोट कंप्यूटर।

एनवीडिया ने "रोबोटिक्स के GPT पल" के लिए एक सावधानीपूर्वक बुनियादी ढाँचा बनाया है। यह अनुमान है कि 2025 में, घरेलू एम्बेडेड इंटेलिजेंस ट्रैक और स्वायत्त ड्राइविंग ट्रैक भी वित्तपोषण की होड़ में प्रवेश करेंगे।

[चित्र: जेन्सन हुआंग और स्टीव जॉब्स - गतिशीलता और AI युग के दो प्रतीक]

AI एजेंट: ट्रिलियन डॉलर का उद्योग

हुआंग ने यह भी भविष्यवाणी की है कि AI एजेंट उद्योग का आकार कई ट्रिलियन डॉलर तक पहुंच जाएगा। संबंधित उत्पाद "टेस्ट-टाइम स्केलिंग" फ़ंक्शन के साथ एजेंटिक AI है, जो कैलकुलेटर, वेब खोज, सिमेंटिक खोज, SQL खोज और अन्य टूल का समर्थन करता है। यदि एनवीडिया GPU त्वरित कंप्यूटिंग और AI एकीकरण के मामले में स्वार्म्स फ्रेमवर्क के साथ सहयोग करता है, तो स्वार्म्स फ्रेमवर्क अंततः विजेता बन सकता है, और सभी AI एजेंट इसके फ्रेमवर्क के भीतर काम करेंगे। स्वार्म्स के भविष्य में एक ट्रिलियन डॉलर की बाजार पूंजीकरण वाली कंपनी बनने की उम्मीद है, जबकि इसका वर्तमान बाजार मूल्य केवल 540 मिलियन डॉलर है, जिसका अर्थ है कि क्या इसमें अभी भी बड़ी वृद्धि की गुंजाइश है?

एनवीडिया का AI विकास के चार चरण

ओपनएआई सैम के एजीआई के पांच विकास चरणों की तुलना में, एनवीडिया के AI के चार विकास चरण अधिक व्यापक और महत्वाकांक्षी हैं:

  • संवेदी AI: वाक् पहचान, गहन पहचान
  • जेनेरेटिव AI: पाठ, छवि या वीडियो निर्माण
  • एजेंट AI: प्रोग्रामिंग सहायक, आदि, मनुष्यों को कार्यों को पूरा करने में मदद करते हैं
  • भौतिक AI: स्वायत्त ड्राइविंग कारें, सामान्य प्रयोजन रोबोट

यह विभाजन AI के विकास पथ और औद्योगिक विकास के नियमों को स्पष्ट रूप से दर्शाता है। हुआंग 10 साल पहले मंच पर एक छोटी सी दौड़ से, Xiaomi के लिए एक शो के रूप में, आज 3.6 ट्रिलियन अमेरिकी डॉलर के बाजार मूल्य के साथ एक विशालकाय बन गए हैं, और उनका भविष्य विकास असीम प्रतीत होता है।