- Published on
एनव्हिडियाची स्पेसिफिकेशन्सच्या पलीकडे क्रांती: जेन्सन हुआंगची विघटनकारी दृष्टी
जेन्सन हुआंग आणि स्टीव्ह जॉब्स: दोन युगांचे प्रणेते
2025 च्या CES मध्ये, जेव्हा जेन्सन हुआंग त्यांच्या खास ॲलिगेटर-स्किन जॅकेटमध्ये दिसले, तेव्हा लोकांचे लक्ष एनव्हिडियाच्या नवीन हालचालींपेक्षा त्यांच्या आकर्षक जॅकेटवर अधिक होते. तथापि, त्यांच्या भाषणातील आशय वस्त्रांपेक्षा अधिक प्रभावी होता, कारण त्यांनी सादर केलेली नवीन तंत्रज्ञान एनव्हिडियाच्या स्वतःच्या परिषदेतील निकालांपेक्षाही अधिक प्रगतीशील होती. तर, एनव्हिडिया नेमके काय बदलत आहे? चला सखोलपणे जाणून घेऊया.
RTX ब्लॅकवेल मालिका GPU: नवीन 'रसायन' उपकरण
एनव्हिडियाने RTX ब्लॅकवेल मालिका GPU सादर केली आहे, ज्यात RTX 5090 ग्राफिक्स कार्ड सर्वात लक्षणीय आहे. जरी आम्ही त्याच्या शक्तिशाली पॅरामीटर्सबद्दल तपशीलवार माहिती देत नसलो, तरी हे लक्षात घेणे महत्त्वाचे आहे की या मालिकेतील सर्वात कमी शक्तिशाली 5070 ग्राफिक्स कार्डची कार्यक्षमता मागील पिढीतील 4090 च्या बरोबरीची आहे, आणि त्याची किंमत एक तृतीयांशने कमी आहे.
हे सर्वज्ञात आहे की, ग्राहक-श्रेणीतील ग्राफिक्स कार्ड विशेषतः स्थानिक स्तरावर ओपन-सोर्स मॉडेलसाठी योग्य आहेत. त्यामुळे, RTX 5090 ला 'नवीन रसायन' उपकरण म्हणून ओळखले जाते.
ब्लॅक फॉरेस्ट स्टुडिओने एनव्हिडियासोबत FLUX मॉडेल ऑप्टिमाइझ केले आहे, ज्यामुळे 50 मालिका ग्राफिक्स कार्डवर अनुमान गती लक्षणीयरीत्या वाढली आहे. 5090 वर DEV मॉडेलची अनुमान गती 4090 पेक्षा दुप्पट आहे. याव्यतिरिक्त, फेब्रुवारीमध्ये FP4 प्रमाणीकरण स्वरूपात FLUX मॉडेल सादर केले जाईल.
बाजारात 5090 ची प्री-सेलिंग सुरू झाली आहे, जे दर्शवते की यावर्षी AI डिझाइन, AI स्टुडिओ, AI कॉमिक्स, AI शॉर्ट फिल्म्स इत्यादी क्षेत्रांमध्ये स्टुडिओमध्ये प्रचंड वाढ होईल.
प्रोजेक्ट DIGITS: डेस्कटॉप क्लाउड प्लॅटफॉर्मची मोठी मॉडेल क्रांती
जर पेंटिंग सॉफ्टवेअर स्थानिक पातळीवर स्थापित केले जाऊ शकते, तर 13B पेक्षा जास्त पॅरामीटर्स असलेले मोठे मॉडेल देखील स्थापित केले जाऊ शकतात का? हुआंग यांनी या प्रश्नाचे होकारार्थी उत्तर दिले. एनव्हिडियाने 'प्रोजेक्ट DIGITS' डेस्कटॉप क्लाउड प्लॅटफॉर्म कॉम्प्युटर सादर केले आहे, जे डेस्कटॉपवर 200 अब्ज पॅरामीटर्सचे मोठे मॉडेल चालवू शकते आणि त्याला फक्त स्टँडर्ड पॉवर सॉकेटची आवश्यकता आहे.
डेस्कटॉप सिस्टमवर मोठ्या मॉडेलचा विकास किंवा अनुमान पूर्ण झाल्यानंतर, ते त्वरित क्लाउड किंवा डेटा सेंटरमध्ये तैनात केले जाऊ शकते. यामुळे वैयक्तिक प्रशिक्षण डेटासेटवर आधारित विशेष मॉडेलच्या विकासाला चालना मिळेल. भविष्यात, विकासक स्थानिक पातळीवर 8-13B मॉडेल स्थापित करू शकतील आणि स्टेबल डिफ्यूजनने वैयक्तिक निर्मात्यांमध्ये जी लोकप्रियता मिळवली होती, ती पुन्हा अनुभवता येईल. त्यांच्यासाठी 3000 डॉलर्सची किंमत देखील फार मोठी नाही.
NVIDIA GB200 NVL72: डेटा सेंटर सुपर चिप
एनव्हिडियाने NVIDIA GB200 NVL72 सादर केले आहे, जे 72 ब्लॅकवेल GPU, 1.4 exaFLOPS ची गणना क्षमता आणि 130 ट्रिलियन ट्रांजिस्टर असलेले डेटा सेंटर सुपर चिप आहे. हुआंग यांनी याची तुलना कॅप्टन अमेरिकेच्या ढालेशी केली आहे.
या चिपची ताकद अशी आहे की, हुआंग यांनी स्वतः 6 चिप्स हातात धरून दाखवल्या, ज्यांची गणना क्षमता चीनमधील अनेक AI कंपन्या आणि ऑटो कंपन्यांच्या संपूर्ण डेटा सेंटरच्या बरोबरीची आहे. तुलनेत, Li Auto ची इंटेलिजेंट ड्रायव्हिंगची एकूण गणना क्षमता 8.1 EFLOPS आहे. या सुपर चिप्सद्वारे सुसज्ज डेटा सेंटर्सच्या स्थापनेमुळे, पुढील पिढीतील भाषिक मॉडेल, ऑटोमेटेड ड्रायव्हिंग एंड-टू-एंड आणि रोबोटचे जागतिक मॉडेल गणना क्षमतेच्या कमतरतेमुळे त्रस्त होणार नाहीत.
कॉसमॉस मॉडेल: AI ला भौतिक जग समजून घेणे
एनव्हिडियाने कॉसमॉस मॉडेल सादर केले आहे, जे एक जागतिक मॉडेल विकास प्लॅटफॉर्म आहे, जे 'AI ला भौतिक जग समजून घेण्यासाठी' तयार केले आहे. यात जागतिक मूलभूत मॉडेल, टोकनायझर्स आणि व्हिडिओ प्रोसेसिंग वर्कफ्लो यांचा समावेश आहे, जे रोबोटिक्स आणि AV प्रयोगशाळांसाठी एक मोठे वरदान आहे.
कॉसमॉस मजकूर, प्रतिमा किंवा व्हिडिओ प्रॉम्प्ट स्वीकारून आभासी जगाची स्थिती तयार करू शकते, याचा अर्थ असा आहे की मशीन शेवटी जगात कल्पना करू शकते आणि ते समजून घेऊ शकते. 20 दशलक्ष तासांच्या व्हिडिओवर आधारित, 4 अब्ज ते 14 अब्ज पर्यंतचे वजन असलेले हे ओपन-सोर्स, ओपन-वेट व्हिडिओ वर्ल्ड मॉडेल आहे.
जगातील मॉडेलच्या अनेक व्याख्या असल्या तरी, कॉसमॉसची 4D सिम्युलेशन क्षमता अद्वितीय आहे. या तंत्रज्ञानाचा तात्काळ परिणाम असा आहे की, सिंथेटिक डेटा भौतिक AI मधील मोठ्या डेटाची कमतरता दूर करेल. एनव्हिडियाने रोबोटिक्स आणि ऑटोमेटेड ड्रायव्हिंगसाठी मोठ्या प्रमाणात सिंथेटिक डेटा तयार करण्यासाठी कॉसमॉसचा वापर केला आहे, आणि विकासकांना डेटा फाइन-ट्यून करण्यासाठी आणि रोबोट्स आणि AI ला प्रशिक्षित करण्यासाठी ते उपलब्ध करून दिले आहे.
भौतिक AI मध्ये गुंतवणूक: ऑटोमेटेड ड्रायव्हिंग आणि रोबोटिक्स
एनव्हिडियाने गणना क्षमता, मॉडेल आणि डेटा या तिन्हीमध्ये गुंतवणूक केली आहे आणि ऑटोमेटेड ड्रायव्हिंग आणि रोबोटिक्स या दोन क्षेत्रांमध्ये मोठी वाढ होण्याची शक्यता आहे. हुआंग यांनी असा अंदाज वर्तवला आहे की, रोबोटॅक्सी हे पहिले ट्रिलियन-डॉलरचे रोबोटिक्स उद्योग असेल.
ऑटोमेटेड ड्रायव्हिंगसाठी, एनव्हिडियाने 'थोर ब्लॅकवेल' नावाचे पुढील पिढीचे ऑटोमोटिव्ह प्रोसेसर सादर केले आहे, ज्याची प्रक्रिया क्षमता मागील पिढीतील चिपपेक्षा 20 पट जास्त आहे आणि ते मानवरूपी रोबोट्ससाठी देखील वापरले जाऊ शकते. रोबोट्ससाठी, NVIDIA IsaacGroot विकासकांना चार मुख्य आधार प्रदान करते: मूलभूत रोबोट मॉडेल, डेटा पाइपलाइन, सिम्युलेशन फ्रेमवर्क आणि थोर रोबोट कॉम्प्युटर.
एनव्हिडियाने 'रोबोटिक्सच्या GPT क्षणासाठी' व्यवस्थित पायाभूत सुविधा तयार केल्या आहेत. 2025 पर्यंत, देशांतर्गत एम्बोडेड इंटेलिजन्स आणि ऑटोमेटेड ड्रायव्हिंग क्षेत्रात गुंतवणुकीची प्रचंड लाट येण्याची शक्यता आहे.
[चित्र: जेन्सन हुआंग आणि स्टीव्ह जॉब्स - मोबाईल आणि AI युगातील दोन महत्त्वाचे व्यक्ती]
AI एजंट: ट्रिलियन डॉलर्सचे उद्योग
हुआंग यांनी असा अंदाज वर्तवला आहे की, AI एजंट उद्योगाचे मूल्य अनेक ट्रिलियन डॉलर्स असेल. संबंधित उत्पादन म्हणजे 'टेस्ट-टाइम स्केलिंग' फंक्शन असलेले एजंटिक AI, जे कॅल्क्युलेटर, वेब शोध, सिमेंटिक शोध, SQL शोध इत्यादी साधनांना समर्थन देते. जर एनव्हिडियाने GPU प्रवेगक गणना आणि AI एकत्रीकरणामध्ये स्वार्म्स फ्रेमवर्कसोबत भागीदारी केली, तर स्वार्म्स फ्रेमवर्कचा अंतिम विजय होऊ शकतो आणि सर्व AI एजंट्स त्याच्या फ्रेमवर्कमध्ये चालतील. स्वार्म्स भविष्यात ट्रिलियन-डॉलरची कंपनी बनू शकते आणि तिचे सध्याचे बाजार मूल्य फक्त 540 दशलक्ष डॉलर्स आहे, याचा अर्थ असा आहे की, वाढीसाठी खूप मोठी संधी आहे.
एनव्हिडियाचे AI विकासाचे चार टप्पे
OpenAI च्या सॅमच्या AGI च्या पाच विकास टप्प्यांच्या तुलनेत, एनव्हिडियाचे AI चे चार टप्पे अधिक व्यापक आणि महत्वाकांक्षी आहेत:
- संवेदनशील AI: आवाज ओळख, सखोल ओळख
- जनरेटिव्ह AI: मजकूर, प्रतिमा किंवा व्हिडिओ निर्मिती
- एजंट AI: प्रोग्रामिंग सहाय्यक, मानवी कार्ये पूर्ण करण्यास मदत करणे
- भौतिक AI: ऑटोमेटेड ड्रायव्हिंग कार, सामान्य रोबोट्स
अशा वर्गीकरणामुळे AI चा विकास आणि औद्योगिक विकासाचा क्रम स्पष्टपणे दिसून येतो. 10 वर्षांपूर्वी लहान धाव घेऊन स्टेजवर येऊन Xiaomi ला पाठिंबा देणारे हुआंग आज 3.6 ट्रिलियन डॉलर्सचे मोठे साम्राज्य बनले आहेत आणि त्यांची भविष्यातील वाढ अजूनही अमर्याद दिसते.