Логика случая (Кунин) - страница 77

Огромное множество архейных и бактериальных генов кодируют белки, которые не имеют никакого измеримого сходства с какими-либо другими доступными последовательностями белков. Эти гены часто обозначают как одинокие рамки считывания (ОРС)[50] (Daubin and Ochman, 2004). Обычно в архейных и бактериальных геномах ОРС составляют 10–15 процентов от всех предсказанных генов. Многие ОРС – очень короткие, и некоторые из них могут быть не реальными генами, а результатом ошибочного предсказания при анализе генома (Ochman, 2002). Кроме того, высказывается предположение, что большинство ОРС, являющихся полноценными генами, произошли от генов бактериофагов и, соответственно, характеризуются высокой горизонтальной мобильностью, хотя в некоторых случаях они могут быть задействованы для клеточных функций и, соответственно, фиксируются в бактериальных и архейных геномах. Последние оценки, следующие из метагеномных исследований бактериофагов, предполагают, что разнообразие фаговых последовательностей очень велико и остается по большей части неизученным (Edwards and Rohwer, 2005). Таким образом, кажется привлекательной идея, что бо́льшая часть бактериальных и архейных ОРС произошла из этого огромного резервуара генов. В трехкомпонентной структуре вселенной прокариотических генов, с которой мы теперь знакомы, ОРС естественным образом объединяются с «облаком» редких генов, которые количественно доминируют в генном пространстве, но не в индивидуальных геномах, как обсуждалось в главе 3.

Насколько велико все геномное пространство прокариот? Сколько генов в общей сложности оно содержит? Надежная экстраполяция расширения геномного пространства в результате продолжающегося секвенирования бактериальных и архейных геномов и достоверная оценка реального размера этого пространства трудноосуществимы. Однако с учетом большого разнообразия микробных виромов, которые являются основным резервуаром генов и их переносчиком (см. также гл. 10), наиболее вероятно, что число элементов прокариотического геномного пространства увеличится на порядки величины, в основном, если не исключительно, за счет расширения «облака» (Koonin and Wolf, 2008b; Lapierre and Gogarten, 2009).

Эволюционная динамика архитектуры генома прокариот: опероны, суперопероны и сети соседствующих генов

Как уже отмечалось в главе 3, практически сразу же, как только были опубликованы первые полные геномные последовательности, стало очевидным, что последовательность генов в бактериальных и архейных геномах относительно мало консервативна, она сохраняется существенно хуже, чем последовательность нуклеотидов в самих генах (см. рис. 3–6). Для того чтобы анализировать эволюцию последовательности генов, необходимо иметь надежный набор ортологичных генов в сравниваемых геномах (см. табл. 3–1). Как только такое множество ортологичных генов задано, становится достаточно просто оценить степень сохранения последовательности генов, например с помощью точечного графика (одно из самых ранних представлений степени сходства нуклеотидных и белковых последовательностей), в котором каждая точка представляет собой пару ортологов. Исследование этих графиков показывает быстрое расхождение порядка генов у прокариот таким образом, что даже между близкородственными организмами коллинеарность хромосом разрушена в нескольких точках (см. рис. 5–2