«Геном прокариот» (проект)

Материал из Викиверситет
Перейти к: навигация, поиск
Основная статья: Биоинформатика
Данный проект открытый. К обсуждению и сотрудничеству приглашаются все желающие, независимо от сферы и уровня образования — главное требование интерес к проблеме и желание работать.


Геном прокариот - это полный хромосомный набор доядерных одноклеточных живых организмов, не обладающих оформленным клеточным ядром.


Результаты исследований[править]

Постановка задачи[править]

Этап 1. Исправление систематических ошибок[править]

Наиболее известная база, содержащая геномы секвенированных организмов, - NCBI, содержит большое количество систематических ошибок. Из-за этого практически невозможно использование этих данных, и тем более невозможно изучение механизма мутаций (а, следовательно, и эволюции), так как в таком случае исследуются человеческие ошибки при секвенировании, а не природные мутации. Поэтому первым этапом нашей работы, достаточно продолжительным и необходимым, является уточнение этой базы и создание своего русскоязычного источника, чтобы каждый, даже начинающий учёный, мог ознакомится и сделать вклад в развитие связанных с секвенированием организмов наук. И чтобы не приходилось продираться через дебри сложностей, имеющихся объективно в данной работе, но зачастую просто имеющие просто ворох ошибок и умолчаний, которые описаны на неродном языке (а порой и вообще не описаны) и известны только профессионалам (и то не всем, а только тем которые сталкивались с данным вопросом вплотную).

Этап 2. Идентификация всех копий РНК и Белков[править]

Этот этап может идти полностью параллельно с первым, как только удаётся продраться через ошибки. Задача найти все в точности одинаковые последовательности РНК и Белков и дать им уникальный номер. На этом этапе как раз и находятся наибольшее число ошибок, так как оказывается, что в базе NCBI такой проверки не делается, в результате чего идентичные белки или РНК относят к разным группам (например, Met RNA принимают за Ile RNA), или последовательности различаются смещением на 1-3 элемента, или обрезаются концы.

Этап 3. Составить филогенетическое дерево[править]

Предварительные исследования показали, что построить стройное древо нет возможности. Эволюция может идти как во времени, так и горизонтально (см. w:Бактерии#Размножение и устройство генетического аппарата). В результате чего дерево скорее напоминает граф. Нужно указать ассоциации между организмами. Это важно по той причине, что различные элементы организма (Белки и РНК) могут иметь различное эволюционное происхождение, несмотря на то, что они содержатся в одном организме. Таким образом, задача состоит в уделении внимания только идентичным копиям РНК и белков, и на основании их перемещения между организмами выявить логическую последовательность происходящей эволюции. В статистической обработке обычно делают различные предположения, например, как нужно раздвинуть последовательности, чтобы получить гомологичные элементы. Наш подход имеет то преимущество перед статистическими обработками, что мы ничего не предполагаем мы просто отмечаем факты одинаковых РНК и Белков и на основании этого показываем какие связи имеют различные организмы. Естественно, чем более связей имеют организмы тем они более гомологичны, и остаётся найти т. н. узкие места, в которых одна группа соприкасается с другой.

Исправление последовательностей тРНК[править]

Так как РНК играет особую роль (см. подраздел ниже), начать было решено с них. Для этого есть категория Категория:тРНК. И уже проведена некоторая работа по уточнению Ala tRNA и Met tRNA. Есть большое количество автоматически предобработанного материала, но я пока не справляюсь делать коррекции (автоматически тут не сделаешь, так как хоть часть ошибок и систематические, но требуют человеческой верификации).

  • Наиболее интересные на данный момент результаты здесь Ala tRNA Yersinia Link

. Это группа организмов, которая на данный момент разделена на совершенно разные классы. Но как видим их объединяет идентичные Ala tRNA. Более детальное уточнение позволит выявить происходящий процесс эволюции и горизонтального переноса.


Кодоны, белки, тРНК[править]

Понять почему тРНК имеет важную роль для эволюции поможет следующий фрагмент из статьи Белки.

Секторный вариант записи, внутренний круг — 1-е основание кодона (от 5'-конца)

Последовательность аминокислот в белке соответствует информации, содержащейся в гене данного белка. Эта информация представлена в виде последовательности нуклеотидов, причём одной аминокислоте соответствует в ДНК последовательность из трёх нуклеотидов — так называемый триплет или кодон. То, какая аминокислота соответствует данному кодону в мРНК, определяется генетическим кодом, который может несколько отличаться у разных организмов. Синтез белков на рибосомах происходит, как правило, из 20-ти аминокислот, называемых стандартными [1]. Триплетов, которыми закодированы аминокислоты в ДНК, у разных организмов от 61 до 63 (43 = 64 , минус число стоп-кодонов). Поэтому появляется возможность, что большинство аминокислот может быть закодировано разными триплетами. То есть, генетический код может являться избыточным или, иначе, вырожденным. Это было окончательно доказано в эксперименте при анализе мутаций [2]. Генетический код, кодирующий различные аминокислоты имеет разную степень вырожденности (кодируются от 1 до 6 кодонами), это зависит от частоты встречаемости данной аминокислоты в белках, за исключением аргинина [2]. Часто основание в третьем положении оказывается несущественным для специфичности, то есть одна аминокислота может быть представлена четырьмя кодонами, различающимися только третьим основанием. Иногда различие состоит в предпочтении пурина пиримидину. Это называют вырожденностью третьего основания.

Такой трех-кодоный код сложился эволюционно рано. Но существование различий в некоторых организмах, появившихся на разных эволюционных стадиях, указывает на то, что он был не всегда таким.

Согласно некоторым моделям, сначала код существовал в примитивном виде, когда малое число кодонов обозначало сравнительно небольшое число аминокислот. Более точное значение кодонов и большее число аминокислот могли быть введены позже. Сначала только первые два из трех оснований могли быть использованы для узнавания [что зависит от структуры тРНК]. [3]

Термины[править]

  • Штамм — бактериальные культуры одного вида, выделенные, например, из разных мест обитания. Различия между штаммами не выходят за пределы вида.
  • Генотип (или геном) — совокупность всех генов организма.
  • Фенотип — совокупность всех признаков организма.

См. также[править]

Литература[править]

Примечания[править]

  1. Селеноцистеин - пример нестандартной аминокислоты.
  2. 2,0 2,1 Б. Льюин Гены. — М, 1987. — 544 с.
  3. Б. Льюин, «Гены», 1987 г., стр. 62.