Published on

ESM3 Прорыв в Исследовании Белков Бесплатный API и Поддержка Янна ЛеКуна

Авторы
  • avatar
    Имя
    Ajax
    Twitter

ESM3: Революция в Исследовании Белков

В прошлом году, 25 июня, компания Evolutionaryscale представила ESM3, прорывную биологическую модель, насчитывающую 98 миллиардов параметров, что делает ее крупнейшей в своем роде в мире. Эта модель представляет собой значительный шаг вперед в нашем понимании и манипулировании белками.

ESM3 работает путем преобразования трехмерной структуры и функции белков в дискретный алфавит. Этот инновационный подход позволяет представить каждую 3D-структуру в виде последовательности букв. Следовательно, ESM3 может одновременно обрабатывать последовательность, структуру и функцию белка, отвечая на сложные запросы, сочетающие детали атомного уровня с инструкциями высокого уровня для создания совершенно новых белков. Впечатляет, что моделирование эволюции ESM3 сопоставимо с 5 триллионами лет естественной эволюции.

Бесплатный API и Поддержка Экспертов

Научное и фармацевтическое сообщества были взволнованы, когда ESM3 был впервые представлен. Недавно, в 4 часа утра, Evolutionaryscale объявила о бесплатном доступе к API ESM3, стремясь ускорить прогнозирование белков для ученых по всему миру.

Этот шаг был встречен с энтузиазмом лауреатом премии Тьюринга и главным научным сотрудником Meta, Янном ЛеКуном, который назвал достижение Evolutionaryscale "очень крутой штукой".

Как журналист, много лет освещающий ИИ, я считаю, что это важный момент. ESM3 - это не просто модель; это прорыв в понимании и создании белков на атомном уровне, который обещает глубокое влияние на медицинскую сферу.

Вычислительная Мощность и Основные Возможности ESM3

ESM3 был обучен на одном из самых мощных кластеров GPU в мире, используя более 1x10^24 FLOPS вычислительной мощности и 98 миллиардов параметров. Это представляет собой крупнейшие вычислительные инвестиции в обучение биологической модели на сегодняшний день.

Ключевая сила модели заключается в ее способности одновременно обрабатывать последовательность, структуру и функцию белков, что является важными атрибутами для понимания их работы. Это достигается путем преобразования 3D-структур и функций в дискретный алфавит, что позволяет проводить крупномасштабное обучение и открывает новые генеративные возможности.

  • Мультимодальный подход: ESM3 использует мультимодальный подход, позволяющий ей изучать глубокие связи между последовательностью, структурой и функцией с эволюционной точки зрения.
  • Маскированное языковое моделирование: Во время обучения ESM3 использует цель маскированного языкового моделирования. Она частично маскирует последовательность, структуру и функцию белков, а затем предсказывает замаскированные части. Это заставляет модель глубоко понимать взаимосвязи между этими элементами, имитируя эволюцию в масштабе миллиардов белков и параметров.

Генерация Новых Белков и Применение в Реальном Мире

Мультимодальное мышление ESM3 позволяет генерировать новые белки с беспрецедентной точностью. Например, ученые могут направить ESM3 на создание белковых каркасов с определенными активными центрами, объединяя структурные, последовательные и функциональные требования. Эта возможность имеет значительный потенциал в белковой инженерии, особенно при разработке ферментов для таких задач, как разложение пластиковых отходов.

Ключевой особенностью ESM3 является ее способность к масштабированию, улучшающая ее способность решать проблемы по мере роста модели. Кроме того, ESM3 может совершенствоваться за счет самообратной связи и лабораторных данных, повышая качество генерируемых ею белков.

В реальных условиях ESM3 уже продемонстрировала впечатляющие возможности. Например, она успешно сгенерировала новый зеленый флуоресцентный белок (esmGFP) с 58% сходством последовательности с известными флуоресцентными белками.

Прорыв esmGFP: Экспериментальные результаты показывают, что яркость esmGFP сопоставима с яркостью натурального GFP. Однако его эволюционный путь отличается от естественной эволюции, что демонстрирует, что ESM3 может имитировать более 500 миллионов лет естественной эволюции за короткое время.