|
Определение точности позиционирования лигандов в белках-мишенях
Определение точности позиционирования лигандов в белках-мишенях программой SOL, основывается на расчете среднеквадратичного отклонения положения задоченных нативных лигандов от положения нативных лигандов, координаты которых взяты из PDB комплекса, в выбранном наборе белков-мишеней. Для более наглядного выявления качества работы программы SOL докинг выбранного тестового набора проводился одновременно двумя программами SOL и AutoDock.
Подготовка комплексов
Для проведения данного типа валидации прежде всего, были отобраны комплексы не содержащие ионы металла в активном центре. Атомы водорода добавлялись с помощью программы Reduce, скачанной с сайта, и находящейся в свободном доступе. Дальнейшая типизация и создание файла mrk проводились программой FARS. При типизации из исходного файла белка удалялись некоторые ионы, включая ионы металла на краях протеина. Если в аминокислотных остатках существовали два альтернативных положения каких-либо атомов или самих остатков, обозначаемых обычно символами A или B, то при типизации сохранялись только положения, обозначенные символами А. Если на концах цепей, далеко от активного центра присутствовали фрагменты недоопределенных аминокислотных остатков, то они также удалялись из исходного файла. Если файл белка содержал несколько идентичных цепей, т.е. это был димер или тетрамер исходного белка, то при проведении типизации сохранялась только одна, наиболее полная цепь. Таким образом, в полученном наборе содержатся белки, у которых отсутствуют недоопределенные атомы или аминокислотные остатки.
При подготовке лигандов из данных комплексов создавался файл, содержащий координаты ингибитора, взятые из исходного PDB-файла. Затем полученная структура в формате PDB загружается в редактор HyperChem (http://www.hyper.com/) для проверки зарядовых состояний (для pH=7) и создания hin файла. Полученный файл использовался в качестве входного для задочивающих программ SOL и AutoDock.
Результаты
Задочивание проводилось при следующих параметрах программы SOL:
NUMBER OF RUNS: 60
POPULATION SIZE: 30000
NUMBER OF GENERATIONS: 500
И при числе RUN = 50 для программы Autodock.
В данном типе валидации мы ориентируемся на следующие критерии качества работы программы задочивания: значения среднеквадратичного отклонения 2-3 ангстрема - удовлетворительное качество, 1-2 ангстрема - хорошее качество, < 1 ангстрем - отличное качество задочивания.
В таблице 1 приведены результаты по 65 рассчитанным комплексам. Данные отсортированы по возрастанию среднеквадратичных отклонений положений лигандов, полученных по программе SOL
Таблица 1. Название рассчитанных комплексов и полученные для них результаты с помощью программы SOL и AutoDock. Результаты представлены в виде значения (A) среднеквадратичного отклонения координат позиционированных лигандов от их координат в нативном положении соответствующего PDB-комплекса.
PROTEIN |
SOL RESULTS |
AutoDock RESULTS |
1pax |
0,31 |
0,568 |
3pax |
0,31 |
0,805 |
1fh7 |
0,35 |
3,469 |
1a28 |
0,48 |
0,752 |
1ju4 |
0,5 |
1,376 |
1h70 |
0,51 |
0,638 |
1mq6 |
0,51 |
1,213 |
1c83 |
0,55 |
0,656 |
4rsk |
0,55 |
4,262 |
1abe |
0,57 |
1,496 |
1j01 |
0,59 |
3,635 |
1ifu |
0,63 |
8,866 |
1jd3 |
0,64 |
0,558 |
2pax |
0,69 |
0,41 |
2dri |
0,7 |
0,569 |
1h1s |
0,73 |
1,492 |
1tsy |
0,74 |
6,486 |
1qpe |
0,74 |
0,508 |
3eng |
0,8 |
1,177 |
1i7z |
0,86 |
3,441 |
1fut |
0,88 |
1,175 |
1b9v |
0,92 |
1,366 |
1hpv |
0,94 |
0,995 |
1efy |
0,95 |
0,759 |
1h52 |
0,95 |
11,011 |
1mai |
0,96 |
1,089 |
1pot |
0,98 |
0,633 |
1jgi |
0,99 |
1,64 |
1lqd |
0,99 |
0,411 |
1ane |
1,01 |
0,36 |
1afq |
1,02 |
3,063 |
1flz |
1,1 |
7,559 |
2ifb |
1,17 |
1,314 |
1ppc |
1,17 |
5,451 |
1mor |
1,18 |
1,922 |
1qkq |
1,22 |
4,83 |
3kiv |
1,45 |
1,51 |
1k1j |
1,63 |
3,849 |
1icm |
1,69 |
1,787 |
1br6 |
1,85 |
2,757 |
1br5 |
1,85 |
1,126 |
1lif |
1,87 |
1,117 |
2sak |
1,93 |
1,777 |
2hmb |
2,04 |
4,062 |
1mq5 |
2,53 |
1,311 |
1l8g |
2,87 |
1,621 |
1ppa |
2,93 |
6,066 |
1art |
2,94 |
0,876 |
1ifs |
3,14 |
1,054 |
1nli |
3,14 |
2,092 |
3jdw |
3,43 |
4,08 |
1mrg |
3,44 |
0,779 |
2cmd |
3,44 |
8,004 |
2enb |
3,48 |
2,336 |
1hi3 |
3,83 |
3,759 |
1ikg |
4,13 |
0,816 |
1fao |
4,2 |
0,829 |
1rob |
4,39 |
4,645 |
1oxp |
4,61 |
1,332 |
1pph |
4,73 |
3,495 |
1jj0 |
5,18 |
1,877 |
1akb |
5,75 |
1,692 |
1h1p |
6,06 |
4,117 |
1gor |
6,48 |
3,749 |
1htf |
6,85 |
2,743 |
Средние значения (RMSD) отклонений положений лигандов полученных при помощи SOL и AutoDock составляют 2.0 и 2.48 A, соответственно. Из таблицы видно, что для 34 комплексов из 65 среднеквадратичные отклонения положений, полученные как по программе SOL, так и по программе AutoDock, в обоих случаях не превышают 3 анстрем (RMSD<3A).
Таблица 2 содержит количество комплексов, соответствующих каждому из критериев качества.
Таблица 2.
Значение среднеквадратичного отклонения, A |
Количество комплексов |
Суммарное количество |
SOL |
AD |
SOL |
AD |
< 1 |
29 |
18 |
48 (73.9%) |
44 (68%) |
1 < 2 |
14 |
22 |
2 < 3 |
5 |
4 |
> 3 |
17 |
21 |
17 (26.1%) |
21 (32%) |
Анализ неудач позиционирования в данном случае не проводился. Однако накопленный нами опыт таких расчетов показывает, что в большинстве случаев при детальном анализе соответствующего комплекса можно найти причину неудачного докинга.
Как видим, количество лигандов с отличным позиционированием для программы SOL существенно больше, чем для программы AutoDock. На основании этой валидации можно заключить, что программа SOL существенно лучше позиционирует нативные лиганды, чем программа AutoDock.
Заключение
Программа докинга SOL имеет хорошее качество позиционирования лигандов в активных центрах различных белков-мишеней, а используемая в ней скоринг функция позволяет эффективно применять эту программу для виртуального скрининга баз данных химических соединений с целью нахождения ингибиторов заданных белков-мишеней. |
|