Частота наличия цифры 1 в начале чисел составляет 30,1 процента, цифры 2 — 17,6 процента, цифры 3 — 12,5 процента, причем этот показатель стремительно падает по мере увеличения цифры: шанс встретить цифру 1 в начале чисел в семь раз превышает подобную вероятность по отношению к цифре 9.
Ньюком рассчитал эти показатели с помощью логарифмов. Он утверждал, что вероятность появления цифры d в начале числа определяется по формуле: log(d + 1) – log d. (В Приложении 1 я объясню ее суть.) Однако он не смог четко обосновать ее, поэтому привел вместо этого неформальный аргумент, просто представив его как некую любопытную тенденцию.
Более чем полвека спустя, в 1938 году, физик из General Electric Фрэнк Бенфорд заново открыл феномен первой цифры, тоже обратив внимание на потрепанность страниц в книгах с таблицами логарифмов (по всей вероятности, он не знал о статье Ньюкома) [3]. Однако Бенфорд проанализировал эту закономерность не только на основании книг с логарифмами. Он изучил распределение первых цифр исходя из таких данных, как население городов США, адреса первых нескольких сотен людей из биографического справочника американских ученых American Men of Science, атомный вес химических элементов, площадь бассейна рек и статистика бейсбольных матчей. В большинстве случаев результаты были близки к ожидаемому распределению. Наверное, было очень интересно наблюдать за тем, как одна и та же последовательность возникает в самых разных ситуациях. Разумеется, полученные показатели не были в точности такими, как представленные выше проценты (в реальном мире подобной точности нет). Тем не менее в целом они почти полностью совпадали с прогнозируемыми значениями, отклоняясь от них не более чем на несколько десятых процента. В настоящее время закон Бенфорда нашел свое подтверждение в самых разных областях, в том числе в естествознании, финансах, экономике и вычислительной технике. Этот закон гласит: в любом множестве данных о естественных произвольных процессах, включающем в себя величины нескольких порядков, частота появления цифры 1 в качестве первой значащей цифры составляет около 30 процентов, цифры 2 — около 18 процентов и т. д. Бенфорд считал, что этот феномен отражает универсальный закон, который он обозначил термином «закон аномальных чисел». Но термин не прижился, и открытие получило известность под названием «закон Бенфорда».
Закону Бенфорда подчиняется большинство множеств данных, взятых из реальной жизни, например численность населения в 3221 округе США и совокупный квартальный доход 30 525 открытых акционерных компаний за период с 1961 по 2011 год [4].