Нью-Йоркская исследовательская компания в области искусственного интеллекта, специализирующаяся на биотехнологиях, создала новый белок, используя модель языка белков (ProLLMs), которая работает на основе архитектуры, аналогичной архитектуре ChatGPT. 

25 июня компания Evolutionyscale представила первую в своем роде новую белковую молекулу, созданную с помощью искусственного интеллекта, которая светится, имитируя биолюминесценцию молекулы медузы, называемой зеленым флуоресцентным белком. Новая белковая последовательность значительно отличается (сходство составляет менее 60 процентов) от природного белка: компания называет это различие возможным "за 500 миллионов лет (естественной) эволюции". 

Для достижения этой цели компания использовала свою передовую модель языка искусственного интеллекта под названием EvolutionaryScale Model-3 (ESM3) и привлекла 142 миллиона долларов в рамках начального раунда финансирования, включая инвестиции от таких гигантов индустрии, как Nvidia и Amazon.

Мы очень рады сотрудничеству с AWS и NVIDIA, направленному на расширение возможностей искусственного интеллекта в науках о жизни.

— EvolutionaryScale (@EvoscaleAI) 25 июня 2024 г.

ESM3 отличается от ChatGPT тем, что он обучен на параметрах (внутренних переменных) трех фундаментальных биологических свойств белков - последовательности, структуры и функций. Модель была обучена на 98 миллиардах параметров, что делает ее крупнейшей биологической моделью искусственного интеллекта на сегодняшний день. 

EvolutionaryScale называет это "моделью, прошедшей обучение на протяжении всей эволюции". Обучающий набор включал 2,78 миллиарда природных белков, начиная от "тропических лесов Амазонки и заканчивая океанскими глубинами, экстремальными условиями, такими как гидротермальные источники, и микробами в горсти почвы".

ESM3 позволяет пользователям генерировать белки, используя подсказки с частичной информацией (последовательность, структура и функциональные ключевые слова) и повторяя модель для прогнозирования, пока не будет завершена вся последовательность. Модель в первую очередь предназначена для ученых и дает им беспрецедентный контроль над процессом создания белков.

Мы обучили ESM3 и рады представить EvolutionaryScale. ESM3 - это генеративная языковая модель для программирования биологии. В ходе экспериментов мы обнаружили, что ESM3 может моделировать 500 миллионов лет эволюции для генерации новых флуоресцентных белков. Читать далее: https://t.co/iAC3lkj0iV pic.twitter.com/AhWtC4vxlF

— Алекс Ривз (@alexrives) 25 июня 2024 г.

EvolutionaryScale заявляет, что их цель - сделать биологию программируемой. "ESM3 делает шаг навстречу будущему, в котором искусственный интеллект является инструментом для разработки биологии на основе первых принципов точно так же, как мы проектируем структуры, машины и микрочипы, а также пишем компьютерные программы", - говорится на веб-сайте компании. 

Применение этой технологии может привести к прорывам во многих областях, таких как открытие и разработка лекарств, биомедицинские исследования, а также экологичность - пример этого уже продемонстрировала компания EvolutionaryScale, продемонстрировав прототип белка, который способен разлагать пластиковые отходы. 

Возможности безграничны, поскольку каждая клетка любого организма содержит рибосомы (белковые комплексы, которые отвечают за синтез белка). Однако также высказывались опасения, что искусственный интеллект может быть использован не по назначению для создания биологического оружия. 

Ученые применили проактивный подход и в марте изложили "Общественные ценности, руководящие принципы и обязательства по ответственной разработке искусственного интеллекта для проектирования белков", стремясь направить разработки в этой области на благо человечества.

Мы продвигаем новое глобальное соглашение, подписанное более чем 100 ведущими учеными, чтобы обеспечить ответственную разработку технологий искусственного интеллекта для конструирования белков. Эта область может обеспечить производство лекарств, вакцин и других инноваций, которые принесут пользу всем. https://t.co/pTlFtBWHNhhttps://t.co/XYn986dEAt

— Институт белкового дизайна (@UWproteindesign), 8 марта 2024 г.

  Эксперты также высоко оценили EvolutionaryScale за выпуск уменьшенной версии с открытым исходным кодом, которую другие пользователи могут свободно использовать. Полная крупномасштабная модель еще не была выпущена, хотя процесс ее обучения был обнародован в попытке сохранить прозрачность и свободно использовать технологию.