Published on

ESM3 פריצת דרך במחקר חלבונים מודל ביולוגי עם API חינמי

מחברים
  • avatar
    שם
    Ajax
    Twitter

ESM3: קפיצה משמעותית במחקר חלבונים

בשנה שעברה, ב-25 ביוני, חשפה Evolutionaryscale את ESM3, מודל ביולוגי פורץ דרך המתגאה ב-98 מיליארד פרמטרים, מה שהופך אותו לגדול מסוגו בעולם. מודל זה מייצג התקדמות משמעותית בהבנתנו ובאופן שבו אנו מתפעלים חלבונים.

ESM3 פועל על ידי המרת המבנה התלת מימדי והתפקוד של חלבונים לאלפבית דיסקרטי. גישה חדשנית זו מאפשרת לייצג כל מבנה תלת מימדי כרצף של אותיות. כתוצאה מכך, ESM3 יכול לעבד בו זמנית את הרצף, המבנה והתפקוד של חלבון, ולהגיב להנחיות מורכבות המשלבות פרטים ברמה האטומית עם הוראות ברמה גבוהה כדי ליצור חלבונים חדשים לחלוטין. באופן מרשים, הסימולציה של האבולוציה של ESM3 דומה ל-5 טריליון שנות אבולוציה טבעית.

גישה חופשית ל-API ואישור מומחים

הקהילות המדעיות והפרמצבטיות היו נרגשות כאשר ESM3 הוצג לראשונה. לאחרונה, בשעה 4 לפנות בוקר, הודיעה Evolutionaryscale על הזמינות החינמית של ה-API של ESM3, במטרה להאיץ את חיזוי החלבונים עבור מדענים ברחבי העולם.

מהלך זה התקבל בהתלהבות על ידי זוכה פרס טיורינג והמדען הראשי של מטא, יאן לקון, ששיבח את ההישג של Evolutionaryscale כ"דבר מגניב מאוד".

כעיתונאי המסקר בינה מלאכותית מזה שנים רבות, אני מאמין שזהו רגע מכונן. ESM3 הוא יותר מסתם מודל; זוהי פריצת דרך בהבנה ויצירה של חלבונים ברמה האטומית, אשר מבטיחה השפעה עמוקה על התחום הרפואי.

עוצמה חישובית ויכולות ליבה של ESM3

ESM3 אומן על אחד מאשכולות ה-GPU החזקים ביותר בעולם, תוך שימוש ביותר מ-1x10^24 FLOPS של כוח מחשוב ו-98 מיליארד פרמטרים. זה מייצג את ההשקעה החישובית הגדולה ביותר באימון מודל ביולוגי עד כה.

  • עיבוד סימולטני: מודל זה מצטיין ביכולתו לעבד בו זמנית רצף, מבנה ותפקוד של חלבונים, תכונות חיוניות להבנת פעולתם.
  • אלפבית דיסקרטי: הדבר מושג על ידי המרת מבנים ותפקודים תלת מימדיים לאלפבית דיסקרטי, המאפשר אימון בקנה מידה גדול ופותח יכולות גנרטיביות חדשות.

גישה רב-מודאלית

ESM3 משתמש בגישה רב-מודאלית, המאפשרת לו ללמוד קשרים עמוקים בין רצף, מבנה ותפקוד מנקודת מבט אבולוציונית.

  • מיסוך שפה: במהלך האימון, ESM3 משתמש במטרה של מיסוך שפה. הוא מסווה חלקית את הרצף, המבנה והתפקוד של חלבונים ולאחר מכן חוזה את החלקים המוסווים. זה מאלץ את המודל להבין לעומק את היחסים בין אלמנטים אלו, תוך סימולציה של אבולוציה בקנה מידה של מיליארדי חלבונים ופרמטרים.

יצירת חלבונים חדשים ויישומים בעולם האמיתי

ההיגיון הרב-מודאלי של ESM3 מאפשר לו לייצר חלבונים חדשים בדיוק חסר תקדים. לדוגמה, מדענים יכולים להנחות את ESM3 ליצור פיגומים של חלבונים עם אתרים פעילים ספציפיים על ידי שילוב דרישות מבניות, רצף ופונקציונליות. ליכולת זו יש פוטנציאל משמעותי בהנדסת חלבונים, במיוחד בעיצוב אנזימים למשימות כמו פירוק פסולת פלסטיק.

  • יכולת קנה מידה: תכונה מרכזית של ESM3 היא יכולתו להתרחב, ולשפר את יכולת פתרון הבעיות שלו ככל שהמודל גדל.
  • שיפור עצמי: יתר על כן, ESM3 יכול לשפר את עצמו באמצעות משוב עצמי ונתוני מעבדה, ולשפר את איכות החלבונים שהוא מייצר.

ביישומים בעולם האמיתי, ESM3 כבר הראה יכולות מרשימות. לדוגמה, הוא הצליח לייצר חלבון פלואורסצנטי ירוק חדש (esmGFP) עם דמיון רצף של 58% בלבד לחלבונים פלואורסצנטיים ידועים.

פריצת דרך esmGFP: תוצאות ניסיוניות מראות שבהירותו של esmGFP דומה ל-GFP טבעי. עם זאת, הנתיב האבולוציוני שלו שונה מהאבולוציה הטבעית, מה שמדגים ש-ESM3 יכול לדמות יותר מ-500 מיליון שנות אבולוציה טבעית בזמן קצר.