Published on

Evrimsel Ölçek ESM3: Protein Araştırmalarında Bir Sıçrama

Yazarlar
  • avatar
    Ad
    Ajax
    Twitter

ESM3: Protein Araştırmalarında Yeni Bir Çağ

Evolutionaryscale, geçtiğimiz yıl 25 Haziran'da, 98 milyar parametreye sahip çığır açan biyolojik modeli ESM3'ü tanıttı. Bu model, türünün en büyüğü olarak dünya çapında proteinleri anlama ve manipüle etme biçimimizde önemli bir ilerlemeyi temsil ediyor.

ESM3, proteinlerin üç boyutlu yapısını ve işlevini ayrık bir alfabeye dönüştürerek çalışır. Bu yenilikçi yaklaşım, her 3D yapının bir harf dizisi olarak temsil edilmesini sağlar. Sonuç olarak, ESM3, atomik düzeydeki ayrıntıları üst düzey talimatlarla birleştiren karmaşık istemlere yanıt vererek bir proteinin dizisini, yapısını ve işlevini eşzamanlı olarak işleyebilir ve tamamen yeni proteinler üretebilir. Etkileyici bir şekilde, ESM3'ün evrim simülasyonu, 5 trilyon yıllık doğal evrimle karşılaştırılabilir.

Ücretsiz API Erişimi ve Uzman Desteği

ESM3 ilk tanıtıldığında bilim ve ilaç toplulukları büyük heyecan yaşadı. Kısa süre önce, sabah 4'te, Evolutionaryscale, dünya çapındaki bilim insanları için protein tahminini hızlandırmayı amaçlayarak ESM3 API'sinin ücretsiz olarak kullanılabileceğini duyurdu.

Bu hamle, Turing Ödülü sahibi ve Meta'nın baş bilimcisi Yann LeCun'un Evolutionaryscale'in başarısını 'çok havalı bir şey' olarak övmesiyle büyük bir coşkuyla karşılandı.

Yıllardır yapay zekayı kapsayan bir gazeteci olarak, bunun dönüm noktası niteliğinde bir an olduğuna inanıyorum. ESM3, sadece bir modelden daha fazlası; tıp alanında derin bir etki vaat eden atomik düzeyde proteinleri anlama ve üretmede bir atılım.

ESM3'ün Hesaplama Gücü ve Temel Yetenekleri

ESM3, küresel olarak en güçlü GPU kümelerinden birinde, 1x10^24 FLOPS'un üzerinde hesaplama gücü ve 98 milyar parametre kullanılarak eğitildi. Bu, bugüne kadar biyolojik model eğitimine yapılan en büyük hesaplama yatırımıdır.

Modelin temel gücü, proteinlerin çalışmasını anlamak için gerekli olan temel özellikler olan proteinlerin dizisini, yapısını ve işlevini eşzamanlı olarak işleme yeteneğinde yatmaktadır. Bu, 3D yapıları ve işlevleri ayrık bir alfabeye dönüştürerek, büyük ölçekli eğitim sağlayarak ve yeni üretken yeteneklerin kilidini açarak elde edilir.

  • Çok Modlu Yaklaşım: ESM3, evrimsel bir perspektiften dizi, yapı ve işlev arasındaki derin bağlantıları öğrenmesini sağlayan çok modlu bir yaklaşım kullanır.
  • Maskelenmiş Dil Modellemesi: Eğitim sırasında ESM3, maskelenmiş bir dil modelleme hedefi kullanır. Proteinlerin dizisini, yapısını ve işlevini kısmen maskeler ve ardından maskelenmiş kısımları tahmin eder. Bu, modeli milyarlarca protein ve parametre ölçeğinde evrimi simüle ederek bu öğeler arasındaki ilişkileri derinlemesine anlamaya zorlar.

Yeni Proteinler Üretmek ve Gerçek Dünya Uygulamaları

ESM3'ün çok modlu akıl yürütmesi, benzeri görülmemiş bir hassasiyetle yeni proteinler üretmesini sağlar. Örneğin, bilim insanları ESM3'ü yapısal, dizi ve işlevsel gereksinimleri birleştirerek belirli aktif bölgelere sahip protein iskeleleri oluşturmaya yönlendirebilir. Bu yetenek, özellikle plastik atıkları parçalamak gibi görevler için enzimler tasarlamada, protein mühendisliğinde önemli bir potansiyele sahiptir.

ESM3'ün temel bir özelliği, model büyüdükçe problem çözme yeteneğini geliştiren ölçeklendirme kapasitesidir. Ayrıca, ESM3, kendi kendini geri bildirim ve laboratuvar verileri yoluyla kendini geliştirebilir, bu da ürettiği proteinlerin kalitesini artırır.

Gerçek dünya uygulamalarında, ESM3 şimdiden etkileyici yetenekler sergilemiştir. Örneğin, bilinen floresan proteinlerle yalnızca %58 dizi benzerliğine sahip yeni bir yeşil floresan protein (esmGFP) başarıyla üretmiştir.

esmGFP Atılımı: Deneysel sonuçlar, esmGFP'nin parlaklığının doğal GFP'ye benzer olduğunu göstermektedir. Bununla birlikte, evrimsel yolu doğal evrimden farklıdır ve bu da ESM3'ün kısa sürede 500 milyon yıldan fazla doğal evrimi simüle edebileceğini göstermektedir.