OpenAI выпустила GPT-Rosalind — специализированную модель для ускорения разработки лекарств

OpenAI представила GPT-Rosalind — модель рассуждений, созданную специально для наук о жизни. Она предназначена для работы в области биологии, разработки лекарств и трансляционной медицины. Модель оптимизирована под научные рабочие процессы: анализ геномов, моделирование белков, химические расчеты и синтез исследовательской литературы.

Название дано в честь Розалинд Франклин, чьи работы помогли раскрыть структуру ДНК и заложили основу молекулярной биологии.

Зачем нужна отдельная модель

В США путь от открытия молекулярной мишени до одобрения нового препарата регуляторами занимает в среднем от 10 до 15 лет. OpenAI считает, что прогресс на ранних стадиях дает накопительный эффект на всех последующих — если ученые точнее выбирают цели, быстрее формулируют гипотезы и проводят более качественные эксперименты.

Ключевая проблема, которую решает GPT-Rosalind — не сложность самой науки, а сложность исследовательских процессов. Ученые работают с огромными объемами литературы, специализированными базами данных, экспериментальными данными и постоянно меняющимися гипотезами. 

Что умеет модель

GPT-Rosalind показывает лучшие результаты в задачах, связанных с рассуждениями о молекулах, белках, генах, биологических путях и биологии заболеваний. Она эффективнее работает с научными инструментами и базами данных в многоэтапных процессах: обзор литературы, интерпретация связи «последовательность — функция», планирование экспериментов и анализ данных.

На открытых тестах модель демонстрирует высокие результаты. В тесте BixBench, основанном на реальных задачах биоинформатики, GPT-Rosalind показала лучшие результаты среди всех моделей с опубликованными показателями. 

В тесте LABBench2 она превосходит GPT-5.4 в 6 из 11 категорий — наиболее заметный прирост зафиксирован в задачах полного проектирования последовательностей ДНК для протоколов молекулярного клонирования.

В партнерстве с Dyno Therapeutics, специализирующейся на генной терапии, модель проверили на задачах прогнозирования и генерации РНК-последовательностей. Лучший из 10 предложенных вариантов превзошел 95% экспертов в задаче прогнозирования и около 84% — в задаче генерации последовательностей.

Плагин и инструменты

Вместе с моделью OpenAI выпустила исследовательский плагин для наук о жизни — Life Sciences research plugin для Codex. Он доступен бесплатно на GitHub и открывает доступ к более чем 50 публичным базам данных, источникам литературы и биологическим инструментам. Среди поддерживаемых направлений — генетика человека, функциональная геномика, структура белков, биохимия и клинические данные.

Пользователи уровня Enterprise могут использовать плагин совместно с GPT-Rosalind для более глубокого анализа. Остальным плагин доступен в работе с базовыми моделями OpenAI.

Кому доступно 

На начальном этапе GPT-Rosalind запускается в рамках программы доверенного доступа для квалифицированных клиентов Enterprise в США. Организации должны вести научные исследования с очевидной общественной пользой, поддерживать механизмы контроля соответствия требованиям и ограничивать доступ только одобренными пользователями внутри защищенных сред.

В период предварительного исследования использование модели не расходует существующие кредиты или токены. Запросить доступ можно на сайте OpenAI.