- Published on
إي إس إم 3 قفزة في أبحاث البروتين محاكاة 500 مليون سنة تطور واجهة برمجة تطبيقات مجانية يان ليكن يدعم
إي إس إم 3: قفزة في أبحاث البروتين
في العام الماضي، وتحديدًا في 25 يونيو، كشفت Evolutionaryscale عن إي إس إم 3، وهو نموذج بيولوجي رائد يضم 98 مليار معامل، مما يجعله الأكبر من نوعه على مستوى العالم. يمثل هذا النموذج تقدمًا كبيرًا في كيفية فهمنا للبروتينات ومعالجتها.
يعمل إي إس إم 3 عن طريق تحويل البنية ثلاثية الأبعاد ووظيفة البروتينات إلى أبجدية منفصلة. يتيح هذا النهج المبتكر تمثيل كل بنية ثلاثية الأبعاد كسلسلة من الحروف. وبالتالي، يمكن لإي إس إم 3 معالجة تسلسل البروتين وهيكله ووظيفته في وقت واحد، والاستجابة للمطالبات المعقدة التي تجمع بين التفاصيل على المستوى الذري والتعليمات عالية المستوى لإنشاء بروتينات جديدة تمامًا. مما يثير الإعجاب، أن محاكاة إي إس إم 3 للتطور قابلة للمقارنة بـ 5 تريليونات سنة من التطور الطبيعي.
الوصول المجاني إلى واجهة برمجة التطبيقات وتأييد الخبراء
كان المجتمع العلمي والصيدلاني في حالة من الضجة عندما تم تقديم إي إس إم 3 في البداية. مؤخرًا، في الساعة 4 صباحًا، أعلنت Evolutionaryscale عن التوفر المجاني لواجهة برمجة تطبيقات إي إس إم 3، بهدف تسريع التنبؤ بالبروتين للعلماء في جميع أنحاء العالم.
قوبلت هذه الخطوة بحماس من الفائز بجائزة تورينج وكبير العلماء في Meta، يان ليكن، الذي أشاد بإنجاز Evolutionaryscale ووصفه بأنه "شيء رائع للغاية".
بصفتي صحفيًا يغطي الذكاء الاصطناعي لسنوات عديدة، أعتقد أن هذه لحظة فارقة. إي إس إم 3 هو أكثر من مجرد نموذج؛ إنه اختراق في فهم وتوليد البروتينات على المستوى الذري، مما يعد بتأثير عميق على المجال الطبي.
القدرة الحسابية لإي إس إم 3 والقدرات الأساسية
تم تدريب إي إس إم 3 على واحدة من أقوى مجموعات وحدات معالجة الرسومات في العالم، باستخدام أكثر من 1x10^24 FLOPS من قوة الحوسبة و 98 مليار معامل. يمثل هذا أكبر استثمار حسابي في تدريب النماذج البيولوجية حتى الآن.
تكمن القوة الأساسية للنموذج في قدرته على معالجة التسلسل والهيكل ووظيفة البروتينات في وقت واحد، وهي سمات أساسية لفهم تشغيلها. يتم تحقيق ذلك عن طريق تحويل هياكل ووظائف ثلاثية الأبعاد إلى أبجدية منفصلة، مما يتيح التدريب واسع النطاق وإطلاق قدرات توليدية جديدة.
نهج متعدد الأنماط
يستخدم إي إس إم 3 نهجًا متعدد الأنماط، مما يتيح له تعلم الروابط العميقة بين التسلسل والهيكل والوظيفة من منظور تطوري.
نمذجة اللغة المقنعة
أثناء التدريب، يستخدم إي إس إم 3 هدفًا لنمذجة اللغة المقنعة. يقوم بإخفاء جزء من تسلسل البروتينات وهيكلها ووظيفتها ثم يتنبأ بالأجزاء المقنعة. هذا يجبر النموذج على فهم العلاقات بين هذه العناصر بعمق، مما يحاكي التطور على نطاق مليارات البروتينات والمعلمات.
توليد بروتينات جديدة وتطبيقات واقعية
تسمح قدرة إي إس إم 3 على التفكير متعدد الأنماط بتوليد بروتينات جديدة بدقة غير مسبوقة. على سبيل المثال، يمكن للعلماء توجيه إي إس إم 3 لإنشاء هياكل بروتينية بمواقع نشطة محددة عن طريق الجمع بين المتطلبات الهيكلية والتسلسلية والوظيفية. تتمتع هذه القدرة بإمكانيات كبيرة في هندسة البروتين، لا سيما في تصميم الإنزيمات لمهام مثل تحليل النفايات البلاستيكية.
ومن الميزات الرئيسية لإي إس إم 3 قدرته على التوسع، مما يحسن قدرته على حل المشكلات مع نمو النموذج. علاوة على ذلك، يمكن لإي إس إم 3 تحسين نفسه من خلال التغذية الراجعة الذاتية والبيانات المختبرية، مما يعزز جودة البروتينات التي يتم إنشاؤها.
في التطبيقات الواقعية، أظهر إي إس إم 3 بالفعل قدرات مثيرة للإعجاب. على سبيل المثال، نجح في توليد بروتين فلوري أخضر جديد (esmGFP) بتشابه تسلسلي بنسبة 58٪ فقط مع البروتينات الفلورية المعروفة.
اختراق esmGFP
تظهر النتائج التجريبية أن سطوع esmGFP مماثل لـ GFP الطبيعي. ومع ذلك، يختلف مساره التطوري عن التطور الطبيعي، مما يدل على أن إي إس إم 3 يمكنه محاكاة أكثر من 500 مليون سنة من التطور الطبيعي في وقت قصير.