Мальчик, который не переставал расти… и другие истории про гены и людей (Кёрк) - страница 114

, отмечено 287 различных позиций, изменения в которых, скорее всего, оказывают подобное влияние, причем в большинстве случаев это влияние совсем слабое.

Основной способ выявить вклад наследственности в распространенные заболевания, по крайней мере на данный момент, — это метод полногеномного поиска ассоциаций (genome-wide association study, GWAS). Если вы решили заняться GWAS[111], вам понадобится очень большая выборка людей (от десятков до сотен тысяч[112]), о которых вам что-либо известно. Например, вам известны такие их показатели, как рост, кровяное давление, был ли у них инсульт и т. п. У каждого из них вы берете образец ДНК и изучаете тысячи участков, разбросанных по всему геному, о которых известно, что они у людей различаются. Затем эти генетические данные сопоставляются с известными сведениями о людях из выборки. Цель — найти связь между данными ДНК и исследуемой характеристикой.

Допустим, у некоторых людей в определенной позиции в ДНК стоит Ц (цитозин), а у других — Т (тимин). Рассмотрев ДНК тех, у кого не было инсульта, обнаруживаем, что у 50 % из них — Ц, а у других 50 % — Т. Затем рассматриваем группу тех, кто перенес инсульт, и оказывается, что среди этих людей у 60 % в этой позиции стоит Ц, а у 40 % — Т. То есть у людей, перенесших инсульт, Ц встречается чаще, чем у контрольной группы[113]. Следующий этап — повторить исследование заново на так называемой «когорте воспроизводства» (новой группе людей), чтобы доказать, что установленная в прошлый раз связь не ошибка. Это необходимо, так как на начальном этапе применения метода GWAS появилось немало «сенсаций», которые потом оказались статистическим шумом, не имевшим отношения к действительности. Статистическая планка для второго исследования немного ниже, чем для первого, так как мы ищем один конкретный объект, а не рассматриваем весь геном целиком. Значит, для второй выборки не нужно так много людей, но работа все-таки предстоит большая. Предположим, что во второй раз вы обнаружили нечто близкое к результату первоначального исследования. Поздравляю, вы открыли фактор риска инсульта!

Однако это едва ли вам сильно поможет. Прежде всего, может оказаться, что сама по себе данная генетическая вариация не имеет прямого отношения к риску инсульта. Она может быть безвинной попутчицей, которая просто сидит и никого не трогает где-то поблизости от другой мутации — истинной виновницы. А значит, обнаружение подобной вариации зачастую всего лишь начало долгого и утомительного поиска настоящего злодея. Вторая проблема заключается в том, что полученные данные, по сути, ничего не говорят нам о конкретном человеке. Если у половины популяции в определенном месте ДНК стоит Ц и этот вариант лишь ненамного повышает риск инсульта, незачем особенно беспокоиться, обнаружив его у себя. Данные могут оказаться неприменимыми к другой популяции: например, связь между наличием варианта с Ц и инсультом достоверна только для европейцев. К сожалению, у нас наблюдается переизбыток исследований на европейском материале (я говорю «к сожалению», так как аналогичных исследований на материале других популяций нам отчаянно не хватает).