- Published on
ESM3 جهش در تحقیقات پروتئین مدل بیولوژیکی پیشگام
ESM3: جهشی در تحقیقات پروتئین
سال گذشته در 25 ژوئن Evolutionaryscale از ESM3 یک مدل بیولوژیکی پیشگام با 98 میلیارد پارامتر رونمایی کرد که آن را به بزرگترین مدل از نوع خود در سطح جهان تبدیل کرد این مدل نشان دهنده پیشرفت قابل توجهی در نحوه درک و دستکاری پروتئین ها است.
ESM3 با تبدیل ساختار و عملکرد سه بعدی پروتئین ها به یک الفبای گسسته عمل می کند این رویکرد نوآورانه به هر ساختار سه بعدی اجازه می دهد تا به عنوان یک دنباله از حروف نشان داده شود در نتیجه ESM3 می تواند به طور همزمان توالی ساختار و عملکرد یک پروتئین را پردازش کند و به درخواست های پیچیده ای که جزئیات در سطح اتمی را با دستورالعمل های سطح بالا ترکیب می کند پاسخ دهد تا پروتئین های کاملاً جدید تولید کند به طور چشمگیری شبیه سازی تکامل ESM3 قابل مقایسه با 5 تریلیون سال تکامل طبیعی است.
دسترسی رایگان به API و تایید کارشناسان
هنگامی که ESM3 در ابتدا معرفی شد جوامع علمی و دارویی در هیجان بودند اخیراً در ساعت 4 صبح Evolutionaryscale در دسترس بودن رایگان API ESM3 را با هدف تسریع در پیش بینی پروتئین برای دانشمندان در سراسر جهان اعلام کرد.
این حرکت با استقبال یان لکان برنده جایزه تورینگ و دانشمند ارشد متا روبرو شد که از دستاورد Evolutionaryscale به عنوان یک چیز بسیار جالب تمجید کرد.
به عنوان یک روزنامه نگار که سالهاست هوش مصنوعی را پوشش می دهم معتقدم این لحظه نقطه عطفی است ESM3 چیزی بیش از یک مدل است این یک پیشرفت در درک و تولید پروتئین ها در سطح اتمی است که نوید تأثیر عمیقی بر زمینه پزشکی را می دهد.
قدرت محاسباتی و قابلیت های اصلی ESM3
ESM3 بر روی یکی از قدرتمندترین خوشه های GPU در سطح جهان آموزش داده شد که از بیش از 1x10^24 FLOPS قدرت محاسباتی و 98 میلیارد پارامتر استفاده می کند این نشان دهنده بزرگترین سرمایه گذاری محاسباتی در آموزش مدل های بیولوژیکی تا به امروز است.
- نقطه قوت اصلی مدل در توانایی آن برای پردازش همزمان توالی ساختار و عملکرد پروتئین ها است ویژگی های اساسی برای درک عملکرد آنها.
- این امر با تبدیل ساختارهای سه بعدی و عملکردها به یک الفبای گسسته امکان پذیر می شود و آموزش در مقیاس بزرگ را امکان پذیر می کند و قابلیت های تولید جدید را باز می کند.
رویکرد چندوجهی: ESM3 از یک رویکرد چندوجهی استفاده می کند و آن را قادر می سازد تا ارتباطات عمیقی بین توالی ساختار و عملکرد را از دیدگاه تکاملی بیاموزد.
مدل سازی زبان پوشانده شده: در طول آموزش ESM3 از یک هدف مدل سازی زبان پوشانده شده استفاده می کند به طور جزئی توالی ساختار و عملکرد پروتئین ها را پوشش می دهد و سپس قسمت های پوشانده شده را پیش بینی می کند این امر مدل را مجبور می کند تا روابط بین این عناصر را عمیقاً درک کند و تکامل را در مقیاس میلیاردها پروتئین و پارامتر شبیه سازی کند.
تولید پروتئین های جدید و کاربردهای دنیای واقعی
استدلال چندوجهی ESM3 به آن اجازه می دهد تا پروتئین های جدید را با دقت بی سابقه ای تولید کند به عنوان مثال دانشمندان می توانند ESM3 را برای ایجاد داربست های پروتئینی با جایگاه های فعال خاص با ترکیب الزامات ساختاری توالی و عملکرد هدایت کنند این قابلیت پتانسیل قابل توجهی در مهندسی پروتئین به ویژه در طراحی آنزیم ها برای کارهایی مانند تجزیه زباله های پلاستیکی دارد.
- یکی از ویژگی های کلیدی ESM3 ظرفیت مقیاس پذیری آن است که توانایی حل مسئله آن را با رشد مدل بهبود می بخشد.
- علاوه بر این ESM3 می تواند از طریق بازخورد خود و داده های آزمایشگاهی خود را بهبود بخشد و کیفیت پروتئین های تولید شده خود را افزایش دهد.
در کاربردهای دنیای واقعی ESM3 قبلاً قابلیت های چشمگیری را نشان داده است به عنوان مثال با موفقیت یک پروتئین فلورسنت سبز جدید (esmGFP) با تنها 58٪ شباهت توالی با پروتئین های فلورسنت شناخته شده تولید کرده است.
پیشرفت esmGFP: نتایج تجربی نشان می دهد که روشنایی esmGFP قابل مقایسه با GFP طبیعی است با این حال مسیر تکاملی آن با تکامل طبیعی متفاوت است و نشان می دهد که ESM3 می تواند بیش از 500 میلیون سال تکامل طبیعی را در مدت زمان کوتاهی شبیه سازی کند.