- Published on
ESM3 ก้าวกระโดดในการวิจัยโปรตีน จำลองวิวัฒนาการ 500 ล้านปี API ฟรี Yann LeCun รับรอง
ESM3: การก้าวกระโดดในการวิจัยโปรตีน
เมื่อปีที่แล้ว วันที่ 25 มิถุนายน Evolutionaryscale ได้เปิดตัว ESM3 ซึ่งเป็นโมเดลชีวภาพที่ล้ำสมัย มีพารามิเตอร์ถึง 98 พันล้าน ทำให้เป็นโมเดลที่ใหญ่ที่สุดในโลก โมเดลนี้แสดงถึงความก้าวหน้าครั้งสำคัญในความเข้าใจและการจัดการโปรตีน
ESM3 ทำงานโดยการแปลงโครงสร้างสามมิติและหน้าที่ของโปรตีนให้เป็นตัวอักษรที่แยกจากกัน แนวทางที่เป็นนวัตกรรมนี้ช่วยให้แต่ละโครงสร้าง 3D สามารถแทนด้วยลำดับของตัวอักษรได้ ด้วยเหตุนี้ ESM3 สามารถประมวลผลลำดับ โครงสร้าง และหน้าที่ของโปรตีนได้พร้อมกัน โดยตอบสนองต่อคำสั่งที่ซับซ้อนที่รวมรายละเอียดระดับอะตอมเข้ากับคำสั่งระดับสูงเพื่อสร้างโปรตีนใหม่ทั้งหมด ที่น่าประทับใจคือการจำลองวิวัฒนาการของ ESM3 เทียบได้กับวิวัฒนาการตามธรรมชาติ 5 ล้านล้านปี
การเข้าถึง API ฟรีและการรับรองจากผู้เชี่ยวชาญ
วงการวิทยาศาสตร์และเภสัชกรรมต่างตื่นเต้นเมื่อมีการเปิดตัว ESM3 ในตอนแรก เมื่อเร็ว ๆ นี้ เวลา 4:00 น. Evolutionaryscale ได้ประกาศเปิดให้ใช้ ESM3 API ฟรี โดยมีเป้าหมายเพื่อเร่งการทำนายโปรตีนสำหรับนักวิทยาศาสตร์ทั่วโลก
การเคลื่อนไหวนี้ได้รับการตอบรับอย่างกระตือรือร้นจาก Yann LeCun ผู้ชนะรางวัล Turing Award และหัวหน้านักวิทยาศาสตร์ของ Meta ซึ่งยกย่องความสำเร็จของ Evolutionaryscale ว่า "เป็นสิ่งที่ยอดเยี่ยมมาก"
ในฐานะนักข่าวที่ทำข่าวเกี่ยวกับ AI มาหลายปี ฉันเชื่อว่านี่เป็นช่วงเวลาสำคัญ ESM3 เป็นมากกว่าแค่โมเดล มันคือความก้าวหน้าในการทำความเข้าใจและการสร้างโปรตีนในระดับอะตอม ซึ่งสัญญาว่าจะส่งผลกระทบอย่างลึกซึ้งต่อวงการแพทย์
พลังการคำนวณและความสามารถหลักของ ESM3
ESM3 ได้รับการฝึกฝนบนคลัสเตอร์ GPU ที่ทรงพลังที่สุดแห่งหนึ่งของโลก โดยใช้พลังการคำนวณมากกว่า 1x10^24 FLOPS และพารามิเตอร์ 98 พันล้าน ซึ่งแสดงถึงการลงทุนด้านการคำนวณที่ใหญ่ที่สุดในการฝึกอบรมแบบจำลองทางชีวภาพจนถึงปัจจุบัน
จุดแข็งหลักของโมเดลอยู่ที่ความสามารถในการประมวลผลลำดับ โครงสร้าง และหน้าที่ของโปรตีนพร้อมกัน ซึ่งเป็นคุณสมบัติที่จำเป็นสำหรับการทำความเข้าใจการทำงานของโปรตีน สิ่งนี้ทำได้โดยการแปลงโครงสร้าง 3D และฟังก์ชันให้เป็นตัวอักษรที่ไม่ต่อเนื่อง ทำให้สามารถฝึกอบรมขนาดใหญ่และปลดล็อกความสามารถในการสร้างใหม่ได้
แนวทางมัลติโมดอล
ESM3 ใช้แนวทางมัลติโมดอล ทำให้สามารถเรียนรู้ความเชื่อมโยงที่ลึกซึ้งระหว่างลำดับ โครงสร้าง และหน้าที่จากมุมมองเชิงวิวัฒนาการ
- การสร้างแบบจำลองภาษาแบบปิดบัง: ในระหว่างการฝึก ESM3 จะใช้เป้าหมายการสร้างแบบจำลองภาษาแบบปิดบัง มันจะปิดบังลำดับ โครงสร้าง และหน้าที่ของโปรตีนบางส่วน จากนั้นจึงทำนายส่วนที่ถูกปิดบัง สิ่งนี้บังคับให้โมเดลเข้าใจความสัมพันธ์ระหว่างองค์ประกอบเหล่านี้อย่างลึกซึ้ง โดยจำลองวิวัฒนาการในระดับโปรตีนและพารามิเตอร์หลายพันล้านรายการ
การสร้างโปรตีนใหม่และการประยุกต์ใช้ในโลกแห่งความเป็นจริง
การให้เหตุผลแบบมัลติโมดอลของ ESM3 ช่วยให้สามารถสร้างโปรตีนใหม่ได้อย่างแม่นยำอย่างที่ไม่เคยมีมาก่อน ตัวอย่างเช่น นักวิทยาศาสตร์สามารถสั่งให้ ESM3 สร้างโครงสร้างโปรตีนที่มีไซต์ที่ใช้งานเฉพาะ โดยรวมข้อกำหนดด้านโครงสร้าง ลำดับ และการทำงานเข้าด้วยกัน ความสามารถนี้มีศักยภาพอย่างมากในด้านวิศวกรรมโปรตีน โดยเฉพาะอย่างยิ่งในการออกแบบเอนไซม์สำหรับงานต่างๆ เช่น การย่อยสลายขยะพลาสติก
คุณสมบัติที่สำคัญของ ESM3 คือความสามารถในการปรับขนาด ซึ่งช่วยปรับปรุงความสามารถในการแก้ปัญหาเมื่อโมเดลเติบโตขึ้น นอกจากนี้ ESM3 ยังสามารถปรับปรุงตัวเองผ่านการตอบรับด้วยตนเองและข้อมูลในห้องปฏิบัติการ ซึ่งช่วยเพิ่มคุณภาพของโปรตีนที่สร้างขึ้น
ในการใช้งานจริง ESM3 ได้แสดงให้เห็นถึงความสามารถที่น่าประทับใจแล้ว ตัวอย่างเช่น ได้สร้างโปรตีนเรืองแสงสีเขียวใหม่ (esmGFP) สำเร็จ โดยมีความคล้ายคลึงของลำดับเพียง 58% กับโปรตีนเรืองแสงที่เป็นที่รู้จัก
- ความก้าวหน้าของ esmGFP: ผลการทดลองแสดงให้เห็นว่าความสว่างของ esmGFP เทียบได้กับ GFP ตามธรรมชาติ อย่างไรก็ตาม เส้นทางวิวัฒนาการของมันแตกต่างจากวิวัฒนาการตามธรรมชาติ ซึ่งแสดงให้เห็นว่า ESM3 สามารถจำลองวิวัฒนาการตามธรรมชาติได้มากกว่า 500 ล้านปีในเวลาอันสั้น