Published on

ESM3 revolutioneert eiwitonderzoek met simulatie van 500 miljoen jaar evolutie

Auteurs
  • avatar
    Naam
    Ajax
    Twitter

ESM3: Een Doorbraak in Eiwitonderzoek

Evolutionaryscale onthulde vorig jaar, op 25 juni, ESM3, een baanbrekend biologisch model met maar liefst 98 miljard parameters. Dit maakt het het grootste model in zijn soort wereldwijd. ESM3 vertegenwoordigt een aanzienlijke vooruitgang in ons begrip van en onze mogelijkheden tot het manipuleren van eiwitten.

Hoe ESM3 Werkt

ESM3 werkt door de driedimensionale structuur en functie van eiwitten om te zetten in een discreet alfabet. Deze innovatieve benadering maakt het mogelijk om elke 3D-structuur weer te geven als een reeks letters. Hierdoor kan ESM3 tegelijkertijd de sequentie, structuur en functie van een eiwit verwerken. Het model reageert op complexe opdrachten die details op atomair niveau combineren met instructies op hoog niveau om volledig nieuwe eiwitten te genereren. Indrukwekkend is dat ESM3 de evolutie simuleert op een schaal die vergelijkbaar is met 5 biljoen jaar natuurlijke evolutie.

Gratis API en Steun van Expert

De wetenschappelijke en farmaceutische gemeenschappen waren enthousiast toen ESM3 voor het eerst werd geïntroduceerd. Onlangs heeft Evolutionaryscale de gratis beschikbaarheid van de ESM3 API aangekondigd, met als doel eiwitvoorspellingen voor wetenschappers wereldwijd te versnellen. Deze stap werd met enthousiasme ontvangen door Turing Award-winnaar en chief scientist van Meta, Yann LeCun, die de prestatie van Evolutionaryscale prees als "een zeer cool iets".

Als journalist die al vele jaren over AI bericht, geloof ik dat dit een gedenkwaardig moment is. ESM3 is meer dan alleen een model; het is een doorbraak in het begrijpen en genereren van eiwitten op atomair niveau, wat een diepgaande impact belooft te hebben op het medische veld.

Computationele Kracht en Kernmogelijkheden van ESM3

ESM3 is getraind op een van de krachtigste GPU-clusters ter wereld, met een rekenkracht van meer dan 1x10^24 FLOPS en 98 miljard parameters. Dit vertegenwoordigt de grootste computationele investering in de training van biologische modellen tot nu toe. De kernkracht van het model ligt in zijn vermogen om tegelijkertijd de sequentie, structuur en functie van eiwitten te verwerken, essentiële attributen voor het begrijpen van hun werking. Dit wordt bereikt door 3D-structuren en functies om te zetten in een discreet alfabet, waardoor grootschalige training mogelijk wordt en nieuwe generatieve mogelijkheden worden ontsloten.

Multimodale Aanpak en Masked Language Modeling

ESM3 hanteert een multimodale aanpak, waardoor het diepe verbanden kan leren tussen sequentie, structuur en functie vanuit een evolutionair perspectief. Tijdens de training gebruikt ESM3 een 'masked language modeling' doelstelling. Het maskeert gedeeltelijk de sequentie, structuur en functie van eiwitten en voorspelt vervolgens de gemaskerde delen. Dit dwingt het model om de relaties tussen deze elementen diepgaand te begrijpen, waardoor evolutie wordt gesimuleerd op een schaal van miljarden eiwitten en parameters.

Het Genereren van Nieuwe Eiwitten en Toepassingen

ESM3's multimodale redenering stelt het in staat om nieuwe eiwitten met ongekende precisie te genereren. Wetenschappers kunnen ESM3 bijvoorbeeld instrueren om eiwitsteigers met specifieke actieve plaatsen te creëren door structurele, sequentie- en functionele eisen te combineren. Deze mogelijkheid heeft een aanzienlijk potentieel in eiwitengineering, met name bij het ontwerpen van enzymen voor taken zoals het afbreken van plastic afval.

Een belangrijk kenmerk van ESM3 is het vermogen om te schalen, waardoor het probleemoplossend vermogen verbetert naarmate het model groeit. Bovendien kan ESM3 zichzelf verbeteren door middel van zelf-feedback en laboratoriumgegevens, waardoor de kwaliteit van de gegenereerde eiwitten wordt verbeterd.

In real-world toepassingen heeft ESM3 al indrukwekkende mogelijkheden laten zien. Zo heeft het met succes een nieuw groen fluorescerend eiwit (esmGFP) gegenereerd met slechts 58% sequentie-overeenkomst met bekende fluorescerende eiwitten.

esmGFP Doorbraak

Experimentele resultaten tonen aan dat de helderheid van esmGFP vergelijkbaar is met die van natuurlijke GFP. Het evolutionaire pad verschilt echter van natuurlijke evolutie, wat aantoont dat ESM3 meer dan 500 miljoen jaar natuurlijke evolutie in korte tijd kan simuleren.