Перечисленные четыре нуклеотида – это язык ДНК, который состоит из этих четырех слов, или четырех букв, при сокращенной записи. Эти нуклеотиды комбинируются парами, и их так и называют – «пары оснований». Они фактически держат двойную спираль ДНК.
Нам эти четверки (а также тройки нуклеотидов, и другие типы повторов) в маркерах ДНК в дальнейшем не понадобятся, это описание мы даем только для того, чтобы показать, что за числами в гаплотипах стоят масштабные исследования, которыми занимаются в мире сотни и тысячи человек.
Гаплотипы ДНК выбирают так, чтобы в них таких маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах использовались 6-маркерные гаплотипы, затем 12-маркерные, 17– и 19-маркерные, затем 25– и 37-маркерные, а сейчас работа рутинно ведется с 67– и 111-маркерными гаплотипами (правда, в академических публикациях это обычно от 8 до 17 маркерных гаплотипов).
В 67-маркерных гаплотипах одна мутация происходит в среднем за 8 поколений, в 111-маркерных – за 5 поколений. Поэтому у 111-маркерных гаплотипов разрешение лучше. Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Длинные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно[7].
Как мы покажем ниже, эти гаплотипы, а именно числа в них, напрямую связаны с хронологией древних миграций людей, переходами людей на новые места, событиями прошлого – войнами, климатическими катаклизмами, эпидемиями, в общем, со всем тем, что так или иначе влияло на численность популяций человека в определенные времена и на определенных территориях. Например, расчеты могут показать, когда древние арии появились на Русской равнине, когда они появились в Индии, Иране, на Ближнем Востоке – потому что эти события приводили к появлению на этих территориях и в те времена общих предков популяций, которые разрастались вплоть до нашего времени, образуя «кусты» гаплотипов со всеми мутациями в них, то есть изменениями чисел в маркерах.
Поскольку уже показано и доказано, что мутации в маркерах происходят в основном (или исключительно) неупорядоченно, то к ним оказалось возможным применять правила и подходы химической кинетики, или биологической кинетики, кому какой термин больше нравится – суть одна. И снипы, и маркеры мутируют по законам кинетики первого порядка, других закономерностей пока не обнаружено. Это означает, что каждому маркеру свойственна определенная константа скорости мутации, и каждому гаплотипу (состоящему из набора маркеров) – тоже свойственна определенная средняя константа скорости мутации, равная сумме констант скоростей мутаций отдельных маркеров. Поэтому чем древнее общий предок популяции, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с ним, тем больше поколений (и лет) отделяет современных потомков от их общего предка, и это число поколений (и лет) рассчитывается методами ДНК-генеалогии. Как это делается, тоже будет показано ниже на многих примерах.