Большое космическое путешествие (Тайсон, Стросс) - страница 40

Когда пытаешься понять звезды, непременно нужны дополнительные математические инструменты. Один из них – функции распределения. В них заложены мощные и полезные математические идеи. Я хотел бы рассказать о них на простом примере, поэтому давайте начнем с так называемой гистограммы. Например, на такой диаграмме можно распределить количество человек в типичной аудитории американского колледжа в зависимости от их возраста (рис. 4.3).

Чтобы построить такой график, нужно спросить присутствующих, есть ли в аудитории кто-либо в возрасте 16 лет или моложе. Если никто не отзовется, то на графике этим возрастам будут соответствовать нулевые значения. Далее спросим, сколько 17–18-летних. Допустим, наберется 20 человек. Отметим этот возраст планкой, высота которой – ровно 20 единиц. А сколько тех, кому 19–20 лет? Тридцать пять человек. Так и продолжим, пока не учтем всех присутствующих.

Теперь давайте вернемся к рис. 4.3. Гистограмма позволяет кое-что сказать о распределении слушателей по возрасту в типичной аудитории. Например, большинству из них около 20 лет – из графика сразу ясно, что речь идет о группе из колледжа. Затем следует пробел, несколько одиночных значений и еще один всплеск, в районе 75 лет. На этом графике два всплеска, они называются модами. Такое распределение называется бимодальным. Большинство представителей «старшей» группы – никакие не студенты; вероятно, это вольнослушатели. Если человек может в дневное время посещать лекции в колледже, это значит, что он не обязан работать с девяти до шести, то есть это пенсионер. Можно представить себе демографическую картину, просто взглянув на такое распределение. Если бы мы построили такую гистограмму сразу для всего колледжа, то, вероятно, некоторые пробелы заполнились бы, но я готов поспорить, что общая картина осталась бы почти такой же: в основном младшие студенты, небольшое количество пожилых. Чисто случайно могут попадаться подростки-вундеркинды – может быть, один на тысячу, – поскольку, кажется, на каждом новом потоке хоть один да попадется. На такой гистограмме картинка будет повторяться с интервалом в 2 года. Думаю, если бы удалось достаточно увеличить размер выборки и включить в график всех студентов колледжей в США, интервал удалось бы уменьшить до 1 дня. Я мог бы собрать такое количество данных, что столбики на диаграмме вообще перестали бы просматриваться. При таком объеме данных интервалы на диаграмме стали бы слишком узки, и мне пришлось бы перерисовать эту диаграмму в виде сплошной кривой. Если вы переходите от гистограммы к плавной кривой и можете представить ее в математической форме, то гистограмма превращается в функцию распределения.