позволяет нам количественно измерить прочность отношений между двумя подобными переменными.
Коэффициент корреляции ввел в арсенал математиков викторианский географ, метеоролог, антрополог и статистик сэр Фрэнсис Гальтон (1822–1911)[88]. Гальтон – кстати, двоюродный брат Чарльза Дарвина – не был профессиональным математиком. Он был человек сугубо практического склада и обычно предоставлял другим математикам доводить свои новаторские понятия до совершенства; особенно ему помогал в этом статистик Карл Пирсон (1857–1936). Вот как Гальтон объяснял понятие корреляции.
Длина локтя коррелирует с телосложением, поскольку длинный локоть обычно предполагает высокий рост. Если корреляция между ними очень тесная, то очень длинный локоть обычно предполагает очень высокий рост, однако если бы она была не очень тесная, то очень длинный локоть в среднем связывался бы всего лишь с высоким, но не с очень высоким ростом, тогда как если бы она была нулевая, то очень длинный локоть не был бы связан ни с какими особенностями роста, а следовательно, в среднем, был бы связан с заурядным ростом.
В дальнейшем Пирсон дал точное математическое определение коэффициента корреляции. Этот коэффициент определяется таким образом, что когда корреляция очень высока – то есть когда колебания одной переменной очень точно следуют за взлетами и падениями другой, – коэффициент приобретает значение 1. Если же две величины антикоррелированы, то есть одна величина возрастает, когда другая уменьшается, и наоборот, коэффициент равен –1. Если две переменные ведут себя так, будто другой и вовсе не существует, коэффициент корреляции равен 0 (например, поведение иных правительств, к сожалению, демонстрирует практически нулевую корреляцию с пожеланиями народа, который они якобы представляют).
От выявления и вычисления корреляций в наши дни зависят и медицинские исследования, и экономические прогнозы. Например, связь между курением и раком легких и загаром и раком кожи изначально была выявлена благодаря обнаружению и вычислению корреляций. Биржевые аналитики постоянно пытаются найти и вычислить корреляции между поведением рынка и другими переменными – и любое подобное открытие приносит фантастические прибыли.
Как быстро выяснили некоторые первые статистики, и сбор статистических данных, и их интерпретация – дело непростое, и заниматься им надо с предельной осторожностью. Рыбак, который пользуется сетью с ячеей в десять дюймов, рискует сделать вывод, будто все рыбы в море больше десяти дюймов – просто потому, что более мелкая рыба к нему в сети не попадается. Это пример эффекта селекции, иначе называемого