RU EN

Государственный контракт № 02.435.11.1008

 
 
 валидация   о проекте   публикации     

 
 

Результаты валидации программы SOL

 

 
 
Описание
Первое направление
Второе направление
 
 
 
 

Определение точности позиционирования лигандов в белках-мишенях

Определение точности позиционирования лигандов в белках-мишенях программой SOL, основывается на расчете среднеквадратичного отклонения положения задоченных нативных  лигандов от положения нативных лигандов, координаты которых взяты из PDB комплекса, в выбранном наборе белков-мишеней. Для более наглядного выявления качества работы программы SOL докинг выбранного тестового набора проводился одновременно двумя программами SOL  и AutoDock.

 

Подготовка комплексов

Для проведения данного типа валидации прежде всего, были отобраны комплексы не содержащие ионы металла в активном центре. Атомы водорода добавлялись с помощью программы Reduce, скачанной с сайта, и находящейся в свободном доступе. Дальнейшая типизация и создание файла  mrk проводились программой FARS. При типизации из исходного файла белка удалялись некоторые ионы, включая ионы металла на краях протеина. Если в аминокислотных остатках существовали два альтернативных положения каких-либо атомов или самих остатков, обозначаемых обычно символами A или B, то при типизации сохранялись только положения, обозначенные символами А. Если на концах цепей, далеко от активного центра присутствовали фрагменты недоопределенных аминокислотных остатков, то они также удалялись из исходного файла. Если файл белка содержал несколько идентичных цепей, т.е. это был димер или тетрамер исходного белка, то при проведении типизации сохранялась только одна, наиболее полная цепь. Таким образом, в полученном наборе содержатся белки, у которых отсутствуют недоопределенные атомы или аминокислотные остатки.

При подготовке лигандов из данных комплексов создавался файл, содержащий координаты ингибитора, взятые из исходного PDB-файла. Затем полученная структура в формате PDB загружается в редактор HyperChem (http://www.hyper.com/) для проверки зарядовых состояний (для pH=7) и создания hin файла. Полученный файл использовался в качестве входного для задочивающих программ SOL и AutoDock.

 

Результаты

Задочивание проводилось при следующих параметрах программы SOL:

NUMBER OF RUNS:           60
POPULATION SIZE:        30000
NUMBER OF GENERATIONS:          500

И при числе RUN = 50 для программы Autodock.

В данном типе валидации мы ориентируемся на следующие критерии качества работы программы задочивания: значения среднеквадратичного отклонения 2-3 ангстрема - удовлетворительное качество, 1-2 ангстрема - хорошее качество, < 1 ангстрем - отличное качество задочивания.

В таблице 1 приведены результаты по 65 рассчитанным комплексам. Данные отсортированы по возрастанию среднеквадратичных отклонений положений лигандов, полученных по программе SOL

Таблица 1. Название рассчитанных комплексов и полученные для них результаты с помощью программы SOL и AutoDock. Результаты представлены в виде значения (A) среднеквадратичного отклонения координат позиционированных лигандов от их координат в нативном положении соответствующего PDB-комплекса.

PROTEIN

SOL RESULTS

AutoDock RESULTS

1pax

0,31

0,568

3pax

0,31

0,805

1fh7

0,35

3,469

1a28

0,48

0,752

1ju4

0,5

1,376

1h70

0,51

0,638

1mq6

0,51

1,213

1c83

0,55

0,656

4rsk

0,55

4,262

1abe

0,57

1,496

1j01

0,59

3,635

1ifu

0,63

8,866

1jd3

0,64

0,558

2pax

0,69

0,41

2dri

0,7

0,569

1h1s

0,73

1,492

1tsy

0,74

6,486

1qpe

0,74

0,508

3eng

0,8

1,177

1i7z

0,86

3,441

1fut

0,88

1,175

1b9v

0,92

1,366

1hpv

0,94

0,995

1efy

0,95

0,759

1h52

0,95

11,011

1mai

0,96

1,089

1pot

0,98

0,633

1jgi

0,99

1,64

1lqd

0,99

0,411

1ane

1,01

0,36

1afq

1,02

3,063

1flz

1,1

7,559

2ifb

1,17

1,314

1ppc

1,17

5,451

1mor

1,18

1,922

1qkq

1,22

4,83

3kiv

1,45

1,51

1k1j

1,63

3,849

1icm

1,69

1,787

1br6

1,85

2,757

1br5

1,85

1,126

1lif

1,87

1,117

2sak

1,93

1,777

2hmb

2,04

4,062

1mq5

2,53

1,311

1l8g

2,87

1,621

1ppa

2,93

6,066

1art

2,94

0,876

1ifs

3,14

1,054

1nli

3,14

2,092

3jdw

3,43

4,08

1mrg

3,44

0,779

2cmd

3,44

8,004

2enb

3,48

2,336

1hi3

3,83

3,759

1ikg

4,13

0,816

1fao

4,2

0,829

1rob

4,39

4,645

1oxp

4,61

1,332

1pph

4,73

3,495

1jj0

5,18

1,877

1akb

5,75

1,692

1h1p

6,06

4,117

1gor

6,48

3,749

1htf

6,85

2,743

Средние значения (RMSD) отклонений положений лигандов полученных при помощи SOL и AutoDock  составляют 2.0 и 2.48 A, соответственно. Из таблицы видно, что для 34 комплексов из 65 среднеквадратичные отклонения положений, полученные как по программе SOL, так и по программе AutoDock, в обоих случаях не превышают 3 анстрем (RMSD<3A).

Таблица 2 содержит количество комплексов, соответствующих каждому из критериев качества.

Таблица 2.

Значение среднеквадратичного отклонения, A

Количество комплексов

Суммарное количество

SOL

AD

SOL

AD

< 1

29

18

48 (73.9%)

44 (68%)

1 < 2

14

22

2 < 3

5

4

> 3

17

21

17 (26.1%)

21 (32%)

Анализ неудач позиционирования в данном случае не проводился. Однако накопленный нами опыт таких расчетов показывает, что в большинстве случаев при детальном анализе соответствующего комплекса можно найти причину неудачного докинга.

Как видим, количество лигандов с отличным позиционированием для программы SOL существенно больше, чем для программы AutoDock. На основании этой валидации можно заключить, что программа SOL существенно лучше позиционирует нативные лиганды, чем программа AutoDock.

 

Заключение

Программа докинга SOL имеет хорошее качество позиционирования лигандов в активных центрах различных белков-мишеней, а используемая в ней скоринг функция позволяет эффективно применять эту программу для виртуального скрининга баз данных химических соединений с целью нахождения ингибиторов заданных белков-мишеней.

 

 

 


© 2006, НИВЦ МГУ