Перейти к содержанию

Исправление оценки VDW

Материал из Викиверситета
Эта статья — часть материалов: проекта RNAFoldingAI


rA - 27 rC - 28 rU - 29 rG - 26
1 P - 1 P - 1 P - 1 P - 1
2 O1P (OP1) O1P O1P O1P
3 O2P (OP2) O2P O2P O2P
4 O5* O5* O5* O5*
5 C5* - 2 C5* - 2 C5* - 2 C5* - 2
6 C4* C4* C4* C4*
7 O4* O4* O4* O4*
8 C3* - 4 C3* - 4 C3* - 4 C3* - 4
9 O3* O3* O3* O3*
10 C2* C2* C2* - 9 C2*
11 O2* - 9 O2* - 9 O2* O2* - 9
12 C1* - 3 C1* - 3 C1* - 3 C1* - 3
13 N1 - 8 N1 - 8 N1 - 8 N1 - 8
14 C2 C2 C2 C2
15 N3 O2 - 6 O2 - 6 N2 - 6
16 C4 - 6 N3 N3 N3
17 C5 C4 C4 C4
18 C6 N4 - 5 O4 - 5 C5
19 N6 - 5 C5 C5 C6
20 N7 C6 - 7 C6 - 7 O6 - 5
21 C8 - 7 1H5* 1H5* N7 - 7
22 N9 2H5* 2H5* C8
23 1H5* H4* H4* N9
24 2H5* H3* H3* 1H5*
25 H4* 1H2* 1H2* 2H5*
26 H3* 2HO* 2HO* H4*
27 1H2* H1* H1* H3*
28 2HO* 1H4 H3 1H2*
29 H1* 2H4 H5 H1*
30 H2 H5 H6 2HO*
31 1H6 H6 H1
32 2H6 1H2
33 H8 2H2
34 H8

Как рассчитывается оценка радиусов Ван-дер-Ваальса (VDW) описано в Энергия связей аденин-урацил в РНК. Нам нужно уточнить эту оценку, т.к. она в некоторых случаях не различает запрещенные состояния от разрешенных. Из-за этого общая оценка энергии может быть неверной, и в итоге локальный минимум может быть более правильный чем глобальный. И в таком случае нельзя поставить задачу нахождения глобального минимума, т.к. его поиск не приведет нас к результату.

В качестве параметров (Rna vdw parameter.dat) используется наибольшая замеченная величина соответствующих пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).

В работе Автоматизированное предсказание de novo третичной структуры РНК для оценки VDW используются только по 9 атомов из нуклеотидов, изображенных ниже в таблице желтым цветом. Данных о расположении водородных атомов в структуре 1FFK нету (изображены серым цветом).

Необходимо сделать следующие уточнения:

  1. Учитывать для всех доступных атомов (20-23 шт.) нуклеотидов из 1FFK.pdb наибольшие расстояния между парами нуклеотидов, которые находятся на расстоянии <12 Å
  2. Учитывать для всех атомов (C, N, H, O) образование ковалентных связей, которых в структуре РНК быть не должно [1]


Учет близости большего числа атомов

[править]

Для этого были перевычислены параметры (Rna vdw parameter.dat) наибольшего расстояния пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).

Для этого нужно было:

  1. Переформатировать файл 1FFK, так как названия атомов и нуклеотидов не совпадают с принятыми в ПО Rosseta
  2. Используя ПО Rosseta (функция rna_vdw_pdb_stas [in pose_rna_pdbstats.cc ]), был получен файл 0,8 Гбайт, содержащий расстояния атомов для пар нуклеотидов, которые находятся на расстоянии <12 Å
  3. Используя ПО RNAFoldingAI, данный файл был прочитан, и найдены максимальные значения, был создан файл аналогичный Rna vdw parameter.dat
  4. Из-за того, что учитывается большее число атомов по сравнению с ПО Rosseta, с одной стороны уменьшили коэффициент масштаба с 1.0 до 0.2, но убрали лишний коэффициент 0.8 (имеющийся в ПО Rosseta), на который умножался конечный результат оценки VDW

Окончательно используется следующая функция оценки энергии:

SCORE = (VDW * 3.0 + RG) + (RNA_BS + RNA_BP_W + RNA_BP_H + RNA_BP_S) + (RNA_NONB * 1.5 + RNA_O2ST + RNA_PHOS) + (RNA_AXIS*0.2 + RNA_STAG * 0.5 )

Вес для VDW = 3.0 подобран из примерного расчета, чтобы оценка энергии, найденных путем полного перебора лучших состояний для пар нуклеотидов разных видов (16 вариантов), была бы меньше нуля.

Определение наличия ковалентных связей между атомами

[править]

Радиусы:

'C' = 1.50, 'N' = 1.40, 'O' = 1.30, 'H' = 1.00, 'F' = 1.20, 'S' = 1.90

Связь создается всякий раз, когда два атома находятся в пределах (R1 + R2) * 0.6 друг от друга, где R1 и R2 - соответствующие радиусы атомов[2].

C-C		(1.5+1.5)*0.6 = 1.80
C-N (N-C)	(1.5+1.4)*0.6 = 1.74
C-O (O-C)	(1.5+1.3)*0.6 = 1.68
C-H (H-C)	(1.5+1.0)*0.6 = 1.50
N-N		(1.4+1.4)*0.6 = 1.68
N-O (O-N)	(1.4+1.3)*0.6 = 1.62
N-H (H-N)	(1.4+1.0)*0.6 = 1.44
O-O 		(1.3+1.3)*0.6 = 1.56
O-H (H-O)	(1.3+1.0)*0.6 = 1.38
H-H 		(1.0+1.0)*0.6 = 1.20

При расположении атомов на расстоянии, при котором образуется ковалентная связь, вводятся большие штрафы увеличивающие оценку VDW на 10 единиц.


Примечания

[править]
  1. Естественно, за исключением фосфора (P), посредством которого соединяются между собой нуклеотиды
  2. Согласно моделированию в VMD