- Published on
प्रोटीन अनुसंधान में विकासवादी पैमाने का ESM3 एक बड़ी छलांग
ESM3: प्रोटीन अनुसंधान में एक क्रांति
पिछले साल 25 जून को, इवोल्यूशनरीस्केल ने ESM3 का अनावरण किया, जो 98 बिलियन पैरामीटर वाला एक अभूतपूर्व जैविक मॉडल है, जो इसे विश्व स्तर पर अपनी तरह का सबसे बड़ा मॉडल बनाता है। यह मॉडल प्रोटीन को समझने और हेरफेर करने के तरीके में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है।
ESM3 प्रोटीन की त्रि-आयामी संरचना और कार्य को एक असतत वर्णमाला में बदलकर काम करता है। यह अभिनव दृष्टिकोण प्रत्येक 3डी संरचना को अक्षरों के अनुक्रम के रूप में दर्शाने की अनुमति देता है। नतीजतन, ESM3 एक साथ एक प्रोटीन के अनुक्रम, संरचना और कार्य को संसाधित कर सकता है, जटिल संकेतों का जवाब दे सकता है जो परमाणु-स्तर के विवरण को उच्च-स्तरीय निर्देशों के साथ जोड़ते हैं ताकि पूरी तरह से नए प्रोटीन उत्पन्न किए जा सकें। प्रभावशाली ढंग से, ESM3 का विकास का अनुकरण प्राकृतिक विकास के 5 ट्रिलियन वर्षों के बराबर है।
मुफ्त API एक्सेस और विशेषज्ञ समर्थन
जब ESM3 को पहली बार पेश किया गया था तो वैज्ञानिक और दवा समुदाय में उत्साह था। हाल ही में, सुबह 4 बजे, इवोल्यूशनरीस्केल ने दुनिया भर के वैज्ञानिकों के लिए प्रोटीन की भविष्यवाणी में तेजी लाने के उद्देश्य से ESM3 API की मुफ्त उपलब्धता की घोषणा की।
इस कदम का स्वागत ट्यूरिंग पुरस्कार विजेता और मेटा के मुख्य वैज्ञानिक यान लेकन ने किया, जिन्होंने इवोल्यूशनरीस्केल की उपलब्धि को "एक बहुत अच्छी बात" बताया।
एक पत्रकार के रूप में, जो कई वर्षों से AI को कवर कर रहा है, मेरा मानना है कि यह एक ऐतिहासिक क्षण है। ESM3 सिर्फ एक मॉडल से कहीं अधिक है; यह परमाणु स्तर पर प्रोटीन को समझने और उत्पन्न करने में एक सफलता है, जिसका चिकित्सा क्षेत्र पर गहरा प्रभाव पड़ने का वादा है।
ESM3 की कम्प्यूटेशनल शक्ति और मुख्य क्षमताएं
ESM3 को विश्व स्तर पर सबसे शक्तिशाली GPU क्लस्टर में से एक पर प्रशिक्षित किया गया था, जिसमें 1x10^24 से अधिक FLOPS कंप्यूटिंग शक्ति और 98 बिलियन पैरामीटर का उपयोग किया गया था। यह आज तक जैविक मॉडल प्रशिक्षण में सबसे बड़ा कम्प्यूटेशनल निवेश का प्रतिनिधित्व करता है।
मॉडल की मुख्य ताकत प्रोटीन के अनुक्रम, संरचना और कार्य को एक साथ संसाधित करने की क्षमता में निहित है, जो उनके संचालन को समझने के लिए आवश्यक विशेषताएँ हैं। यह 3D संरचनाओं और कार्यों को एक अलग वर्णमाला में परिवर्तित करके प्राप्त किया जाता है, जिससे बड़े पैमाने पर प्रशिक्षण और नई जनरेटिव क्षमताओं को अनलॉक किया जा सकता है।
मल्टीमॉडल दृष्टिकोण: ESM3 एक मल्टीमॉडल दृष्टिकोण का उपयोग करता है, जो इसे विकासवादी परिप्रेक्ष्य से अनुक्रम, संरचना और कार्य के बीच गहरे संबंध सीखने में सक्षम बनाता है।
मास्कड लैंग्वेज मॉडलिंग: प्रशिक्षण के दौरान, ESM3 एक मास्कड लैंग्वेज मॉडलिंग उद्देश्य का उपयोग करता है। यह आंशिक रूप से प्रोटीन के अनुक्रम, संरचना और कार्य को मास्क करता है और फिर मास्क किए गए भागों की भविष्यवाणी करता है। यह मॉडल को इन तत्वों के बीच संबंधों को गहराई से समझने के लिए मजबूर करता है, अरबों प्रोटीन और पैरामीटर के पैमाने पर विकास का अनुकरण करता है।
उपन्यास प्रोटीन और वास्तविक दुनिया के अनुप्रयोगों का निर्माण
ESM3 का मल्टीमॉडल तर्क इसे अभूतपूर्व सटीकता के साथ नए प्रोटीन उत्पन्न करने की अनुमति देता है। उदाहरण के लिए, वैज्ञानिक विशिष्ट सक्रिय साइटों के साथ प्रोटीन मचान बनाने के लिए ESM3 को निर्देशित कर सकते हैं, संरचनात्मक, अनुक्रम और कार्यात्मक आवश्यकताओं को मिलाकर। इस क्षमता में प्रोटीन इंजीनियरिंग में महत्वपूर्ण क्षमता है, विशेष रूप से प्लास्टिक कचरे को तोड़ने जैसे कार्यों के लिए एंजाइम डिजाइन करने में।
ESM3 की एक प्रमुख विशेषता इसकी स्केलिंग की क्षमता है, मॉडल के बढ़ने के साथ-साथ इसकी समस्या-समाधान क्षमता में सुधार होता है। इसके अलावा, ESM3 स्वयं-प्रतिक्रिया और प्रयोगशाला डेटा के माध्यम से खुद को बेहतर बना सकता है, जिससे इसके द्वारा उत्पन्न प्रोटीन की गुणवत्ता में वृद्धि होती है।
वास्तविक दुनिया के अनुप्रयोगों में, ESM3 ने पहले ही प्रभावशाली क्षमताएं दिखाई हैं। उदाहरण के लिए, इसने सफलतापूर्वक एक नया ग्रीन फ्लोरोसेंट प्रोटीन (esmGFP) उत्पन्न किया, जिसमें ज्ञात फ्लोरोसेंट प्रोटीन के साथ केवल 58% अनुक्रम समानता थी।
- esmGFP सफलता: प्रायोगिक परिणाम बताते हैं कि esmGFP की चमक प्राकृतिक GFP के बराबर है। हालांकि, इसका विकासवादी पथ प्राकृतिक विकास से अलग है, यह दर्शाता है कि ESM3 कम समय में 500 मिलियन से अधिक वर्षों के प्राकृतिक विकास का अनुकरण कर सकता है।