Знание-сила, 2006 № 08 (950) (Журнал «Знание-сила») - страница 59

Один из первых этапов анализа генома — это и есть идентификация генов. Нам необходимо выяснить, какие участки ДНК представляют собой гены, и гены какого именно белка. Вопрос совершенно не праздный, ведь, как мы знаем, даже у бактерий далеко не вся ДНК несет в себе информацию о структуре белков. Для этого применяются несколько подходов. Во-первых, статистические свойства белок-кодирующих областей не такие, как у некодирующих. К таким свойствам относятся частоты коротких цепочек нуклеотидов, различные периодичности и т.п. Во-вторых, существуют особые сигналы на границах кодирующих областей: простым примером являются стоп-кодоны, которыми заканчивается любой ген. В-третьих, для поиска генов, родственных (гомологичных) уже известным, можно использовать сравнение исследуемого фрагмента с банком данных всех изученных генов. Наконец, белок-кодируюшие последовательности изменяются в ходе эволюции медленнее, чем некодирующие, что позволяет выделить гены как островки локального сходства при сравнении геномов нескольких относительно близких организмов. Каждый из этих подходов по отдельности недостаточно надежен, и лучшие современные методы распознавания генов используют комбинированные алгоритмы.

Уже этот относительно простой пример иллюстрирует два основных принципа современной биоинформатики: сравнительный подход и комбинирование разных способов анализа материала. Те же принципы работают и на следующем шаге: предсказании функции гена, точнее, теперь уже — кодируемого этим геном белка, по его аминокислотной последовательности (заметьте, что мы постепенно приближаемся к поставленной цели). Как и раньше, если уже известен гомологичный ген из родственного организма, функция белка может быть предсказана просто на основании сходства последовательностей. Если известны более далекие гомологи, могут быть предсказаны общие биохимические свойства (например, в случае фермента — тип катализируемой реакции), однако специфичность и, стало быть, роль в метаболизме клетки должна быть установлена. исходя из других соображений, которые будут обсуждены чуть ниже. Наконец, иногда удается только лишь установить наличие в белке структурных особенностей или так называемых функциональных подписей — наборов аминокислот, характерных для белков, выполняющих одну и ту же функцию. Например, во всех секретируемых белках должны присутствовать сигнальные пептиды, определяющие прохождение белка через мембрану, а в любом белке, связанном с мембраной или занимающемся трансмембранным транспортом, должен быть участок, "прошивающий" мембрану насквозь — трансмембранный домен. Пример функциональной подписи — это пептидазные мотивы, которые образуют каталитические центры в ферментах, разрушающих пептидную связь, и АТ-фазные мотивы в ферментах, зависящих от гидролиза АТФ.