Перейти к содержанию

RNAInSpace

Материал из Викиверситета
(перенаправлено с «RNAFoldingAI»)
Внимание! Открытый исследовательский проект, к которому может присоединится каждый ...


Эта статья — часть материалов: лаборатории Биоинформатика

sad-RNAInSpace (Semi-automatic designing RNA in space) - программное обеспечение для полуавтоматического конструирования[1] РНК в пространстве. Обеспечивает 3D визуализацию структуры РНК, позволяет её изменять и с помощью связи с модулем RNAWorld позволяет автоматизировать некоторые этапы сворачивания РНК.


Данный проект развивается участниками Викиверситета для проведения исследований в трех направлениях: геномика, искусственный интеллект, гибкое программное обеспечение высокого качества.


Все авторские права самого программного обеспечения (sad-RNAInSpace и RNAWorld) принадлежат основателю проекта Сергею Яковлеву, но участникам проекта программное обеспечение может быть предоставлено для реализации научных и образовательных целей.


Результаты моделирования

На нас ссылаются

Важные инструменты

Наиболее важные выводы

Эти выводы получены как обобщение ряда экспериментов, но не обладают строгим доказательством. Тем не менее они призваны направлять последующие исследования.

  1. Для односпиральных цепей РНК форму при сворачивании предопределяют водородные связи. То есть достаточно добиться образования водородных связей и односпиральная цепь РНК будет соответствовать тому, что наблюдается в природе лишь с небольшими погрешностями в расположении боковых цепей нуклеотидов, которые не обладают водородными связями (как правило петля фрагмента).
  2. Для многоспиральных цепей РНК форма при сворачивании не полностью предопределяется водородными связями. Но наличие водородных связей между спиралями диктует нативное состояние РНК.

Базы данных углов РНК

  • рРНК Haloarcula marismortui (1FFK)
  • рРНК Haloarcula marismortui (1JJ2)

Программная разработка

Основная статья: Модуль RNAWorld

Предметные причины создания описываются в статье «Геномика бросает вызов искусственному интеллекту».

SAD-RNAInSpace 1.0 - сделан реинжениринг программного обеспечения VMD, создана графическая библиотека визуализации молекул OpenGLPlus, и совместно с модулями RNAWorld включено в данное программное обеспечение. В статье Модуль RNAWorld описывается основной модуль, осуществляющий расчеты по сворачиванию РНК.

Разработка теоретических основ

Не следует понимать данную часть как „разработку теории на бумаге“. Тут скорее наоборот, каждое теоретическое положение проходит экспериментальную проверку in silico со сверкой полученных результатов с биологически (in vitro) известными данными. Если такое положение себя зарекомендовало далее ложится в основу дальнейших гипотез. Иначе признается не удовлетворительным или не эффективным, выводы о чем не менее важны, так как позволяют эффективно направлять ход исследований.

Подход № 1. Обучение с подкреплением

Это подход заморожен — признан недостаточным, детали см. в архиве Модуль RNAWorld/Архив#Версия RNAFoldingAI 0.1.

Подход № 2. Поиск на дереве — понятие о параллельно идущих процессах

Это похоже на игру в шахматы, при том что правила игры одному из играющих неизвестны.

Эта задача может быть определена как игра с природой — игра, в которой имеется только один игрок, причем исход ее зависит не только от его решений, но и от состояния “природы”, то есть не от сознательно противодействующего противника, но от объективной, невраждебной действительности.

Разработка и проверка методов производится на основании данных о рибозиме NC_003540.


Разработанные методы

Подход № 3. Целенаправленное построение многоспиральных цепей РНК


Архив

Указанные здесь поднаправления заморожены, так как для многоспиральных цепей не ведут к решению.

Подход № 4. Разрезание многоспиральной цепи РНК, и приведение проблематики к задаче докинга




Биоинформационные ньюансы

РНК не мoгyт образовывать структур, подобных двойной спирали ДНК

  • Из-за стерических ограничений, вызванных 2'-ОН-группой остатка рибозы, РНК не мoгyт образовывать структур, подобных двойной спирали ДНК. Поэтому РНК имеют менее регулярную структуру по сравнению с ДНК [1]

Отсутствие симметрии в моделировании

Следует иметь в виду, что в третичной структуре отсутствует симметричность, в отличие от вторичной. То есть, последовательность ga≠ag или gagg≠ggag. Поэтому атомные цепи будут разные — координаты атомов будут разные, несмотря на то, что повороты одни и те же для соответствующих нуклеотидов. А также их энергетические оценки будут существенно разные, так как они зависят от координат атомов.

Последовательность сворачивания

« Во-первых, сворачивание начинается со стартовой конформации, поддерживаемой рибосомой. Во-вторых, поиск путей сворачивания идет последовательно с растущего N-концевого участка. В-третьих, в процессе сворачивания С-конец фиксирован.[2] »

Гибкость белковой цепи и РНК-цепи

Колебания валентных связей вообще не вносят вклада в гибкость цепи. Колебания валентных углов вносят малый вклад с амплитудой ≈5°. Гибкость цепи в основном обеспечивается вращением (не полностью свободным) вокруг валентных связей. Это вращение описывается как взаимное расположение атомных группировок, связанных валентной связью через двугранный угол.

Свобода вращение зависит от гибридизации атомов:

  1. для двух sp3- гибридизированных атомов (например, связи H3C-CH3, CH2C-CH2C) размер флуктуаций ≈15-20°. Такие связи характерны для боковых групп.
  2. для двух sp2- гибридизированных атомов (например, связи C-N) размер флуктуаций ≈10°
  3. для связи, соединяющей sp3- гибридизированный и sp2- гибридизированный атомы (например, N-C`, C`-C в главной цепи) существует почти свободное вращение

Математический подход

У этого разрабатываемого подхода есть некоторая аналогия со следующим подходом:

Схематично такая процедура может быть описана следующим образом. Ландшафт энергии системы заливается водой, вода образует лужи вокруг локальных минимумов. При повышении уровня воды лужи начинают сливаться, пока не останется всего одна лужа. Результатом процедуры является направленное дерево бассейнов (луж), причем минимальным лужам ставится в соответствие их глубина (значения локальных минимумов энергии), более крупным лужам — уровень энергии, на которых эти лужи сливаются (величина барьера активации между бассейнами). В результате мы получаем дерево бассейнов и функцию на дереве бассейнов — распределение энергий локальных минимумов и барьеров активации. После этого строится модель иерархической динамики, основанная на дереве бассейнов и функции барьеров активации на нём. Это и есть модель межбассейновой кинетики. [3]

Но наш кибернетически-геометрический подход выгодно отличает, отсутствие сложной математики, благодаря чему его можно реализовать на практике.

Близкие математические работы:

  1. С. В. Козырев, Методы и приложения ультраметрического и p-адического анализа: от теории всплесков до биофизики
  2. p-Адическая математическая физика: основные конструкции и применения к сложным и наноскопическим системам, 2008
  3. Молекулярная динамика биополемеров
  4. Predicting protein structures with a multiplayer online game

См. также

Научные дискуссии

  1. Дискуссия: Биологические аспекты сворачивания РНК
  2. Дискуссия: ИИ - аспекты при исследовании сворачивания РНК

Ссылки

Инструменты


Интересные

Частично содержат такие же выводы как были получены в данном проекте.

Актуальное

  • GROMACS+CRA + Mixed monte carlo/molecular dynamics simulations in explicit solvent + aastr@iq.ufrj.br
mdp file
MKTOP: a Program for Automatic Construction of Molecular Topologies
Современные методы молекулярного моделирования

Популярные

Прочие

успешное предсказание РНК третичной структуры остается исключительными подвигами :)

Примечания

  1. Обратите внимание на этот термин, мы не модулируем поведение биологической модели РНК. Мы именно её конструируем, путем моделирования сворачивания отдельных её элементов и путем идеализации ряда процессов, которые не обязательно существуют in vivo
  2. Учебник для студентов четвертого курса факультета медицинской биотехнологии УдГУ.
  3. С. В. Козырев, Методы и приложения ультраметрического и p-адического анализа: от теории всплесков до биофизики