6 апреля (понедельник), 1300, аудитория 615 ИППИ РАН
Ольга Калинина
Использование коррелированных изменений в последовательности белков для предсказания их трехмерной структуры
Предсказание трехмерной структуры белков на основании аминокислотной последовательности уже более 40 лет является одной из центральных нерешенных задач биоинформатики.
Методы, основанные на биофизических представлениях об этом процессе, работают успешно только для очень коротких белков, так как либо недостаточно точны,
либо требуют слишком больших вычислительных ресурсов. Использование информации о родственных белках представляется продуктивным альтернативным подходом к решению проблемы.
Две позиции в последовательности белка называются скоррелированными, если они изменяются одновременно в одних и тех же родственных последовательностях.
Самая простая причина для такой специфической картины мутаций - непосредственный физический контакт соответствующих аминокислотных остатков в трехмерной структуре белка.
Наивный подход с использованием взаимной информации распределений частот аминокислотных остатков для каждой пары позиций был ранее с успехом применен в предсказанию структуры РНК,
однако для белков такой подход был мало успешен. Причина этому лежит в том, высокая взаимная информация является транзитивной:
если распределение частот в позициях А и В имеет высокую взаимную информацию, и также в позициях В и С, то распределения частот в позициях А и С также оказываются скоррелированными.
Таким образом, может быть сформулирована задача о нахождении для данного белка базисного набора коррелирующих пар позиций, который может объяснить все наблюдаемые в нем корреляции.
В последние годы появились работы, решающие эту задачу с помощью разных методов оптимизации. В докладе будут рассмотрены методы,
основанные на (а) максимизации энтропии глобальной статистической модели; (б) обращении матрицы ковариаций; (в) случайных Марковских полях.
04.04.2015 | |