Исправление оценки VDW
№ | rA - 27 | rC - 28 | rU - 29 | rG - 26 |
---|---|---|---|---|
1 | P - 1 | P - 1 | P - 1 | P - 1 |
2 | O1P (OP1) | O1P | O1P | O1P |
3 | O2P (OP2) | O2P | O2P | O2P |
4 | O5* | O5* | O5* | O5* |
5 | C5* - 2 | C5* - 2 | C5* - 2 | C5* - 2 |
6 | C4* | C4* | C4* | C4* |
7 | O4* | O4* | O4* | O4* |
8 | C3* - 4 | C3* - 4 | C3* - 4 | C3* - 4 |
9 | O3* | O3* | O3* | O3* |
10 | C2* | C2* | C2* - 9 | C2* |
11 | O2* - 9 | O2* - 9 | O2* | O2* - 9 |
12 | C1* - 3 | C1* - 3 | C1* - 3 | C1* - 3 |
13 | N1 - 8 | N1 - 8 | N1 - 8 | N1 - 8 |
14 | C2 | C2 | C2 | C2 |
15 | N3 | O2 - 6 | O2 - 6 | N2 - 6 |
16 | C4 - 6 | N3 | N3 | N3 |
17 | C5 | C4 | C4 | C4 |
18 | C6 | N4 - 5 | O4 - 5 | C5 |
19 | N6 - 5 | C5 | C5 | C6 |
20 | N7 | C6 - 7 | C6 - 7 | O6 - 5 |
21 | C8 - 7 | 1H5* | 1H5* | N7 - 7 |
22 | N9 | 2H5* | 2H5* | C8 |
23 | 1H5* | H4* | H4* | N9 |
24 | 2H5* | H3* | H3* | 1H5* |
25 | H4* | 1H2* | 1H2* | 2H5* |
26 | H3* | 2HO* | 2HO* | H4* |
27 | 1H2* | H1* | H1* | H3* |
28 | 2HO* | 1H4 | H3 | 1H2* |
29 | H1* | 2H4 | H5 | H1* |
30 | H2 | H5 | H6 | 2HO* |
31 | 1H6 | H6 | H1 | |
32 | 2H6 | 1H2 | ||
33 | H8 | 2H2 | ||
34 | H8 |
Как рассчитывается оценка радиусов Ван-дер-Ваальса (VDW) описано в Энергия связей аденин-урацил в РНК. Нам нужно уточнить эту оценку, т.к. она в некоторых случаях не различает запрещенные состояния от разрешенных. Из-за этого общая оценка энергии может быть неверной, и в итоге локальный минимум может быть более правильный чем глобальный. И в таком случае нельзя поставить задачу нахождения глобального минимума, т.к. его поиск не приведет нас к результату.
В качестве параметров (Rna vdw parameter.dat) используется наибольшая замеченная величина соответствующих пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).
В работе Автоматизированное предсказание de novo третичной структуры РНК для оценки VDW используются только по 9 атомов из нуклеотидов, изображенных ниже в таблице желтым цветом. Данных о расположении водородных атомов в структуре 1FFK нету (изображены серым цветом).
Необходимо сделать следующие уточнения:
- Учитывать для всех доступных атомов (20-23 шт.) нуклеотидов из 1FFK.pdb наибольшие расстояния между парами нуклеотидов, которые находятся на расстоянии <12 Å
- Учитывать для всех атомов (C, N, H, O) образование ковалентных связей, которых в структуре РНК быть не должно [1]
Учет близости большего числа атомов
[править]Для этого были перевычислены параметры (Rna vdw parameter.dat) наибольшего расстояния пар нуклеотидов, которые находятся на расстоянии <12 Å, взятых из большой рибосомной подединицы Haloarcula marismortui (1FFK).
Для этого нужно было:
- Переформатировать файл 1FFK, так как названия атомов и нуклеотидов не совпадают с принятыми в ПО Rosseta
- Используя ПО Rosseta (функция rna_vdw_pdb_stas [in pose_rna_pdbstats.cc ]), был получен файл 0,8 Гбайт, содержащий расстояния атомов для пар нуклеотидов, которые находятся на расстоянии <12 Å
- Используя ПО RNAFoldingAI, данный файл был прочитан, и найдены максимальные значения, был создан файл аналогичный Rna vdw parameter.dat
- Из-за того, что учитывается большее число атомов по сравнению с ПО Rosseta, с одной стороны уменьшили коэффициент масштаба с 1.0 до 0.2, но убрали лишний коэффициент 0.8 (имеющийся в ПО Rosseta), на который умножался конечный результат оценки VDW
Окончательно используется следующая функция оценки энергии:
SCORE = (VDW * 3.0 + RG) + (RNA_BS + RNA_BP_W + RNA_BP_H + RNA_BP_S) + (RNA_NONB * 1.5 + RNA_O2ST + RNA_PHOS) + (RNA_AXIS*0.2 + RNA_STAG * 0.5 )
Вес для VDW = 3.0 подобран из примерного расчета, чтобы оценка энергии, найденных путем полного перебора лучших состояний для пар нуклеотидов разных видов (16 вариантов), была бы меньше нуля.
Определение наличия ковалентных связей между атомами
[править]Радиусы:
- 'C' = 1.50, 'N' = 1.40, 'O' = 1.30, 'H' = 1.00, 'F' = 1.20, 'S' = 1.90
Связь создается всякий раз, когда два атома находятся в пределах (R1 + R2) * 0.6 друг от друга, где R1 и R2 - соответствующие радиусы атомов[2].
C-C (1.5+1.5)*0.6 = 1.80 C-N (N-C) (1.5+1.4)*0.6 = 1.74 C-O (O-C) (1.5+1.3)*0.6 = 1.68 C-H (H-C) (1.5+1.0)*0.6 = 1.50 N-N (1.4+1.4)*0.6 = 1.68 N-O (O-N) (1.4+1.3)*0.6 = 1.62 N-H (H-N) (1.4+1.0)*0.6 = 1.44O-O (1.3+1.3)*0.6 = 1.56O-H (H-O) (1.3+1.0)*0.6 = 1.38H-H (1.0+1.0)*0.6 = 1.20
При расположении атомов на расстоянии, при котором образуется ковалентная связь, вводятся большие штрафы увеличивающие оценку VDW на 10 единиц.