Карикатура на Лежандра, созданная в 1820 году французским художником Луи-Леопольдом Бальи.
ПРИМЕНЕНИЕ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ К СТАТИСТИКЕ
Кроме вычисления пространственных орбит, как мы увидим далее, метод наименьших квадратов имеет большой потенциал применения в других областях математики, особенно в статистике. Решение уравнений методом наименьших квадратов зависит от данных о функции ƒ, связывающей переменные, которые нам известны, и от сложности этой функции. Самый простой случай — когда функция имеет вид прямой, то есть Y = а + bХ. Вычисление параметров а и b получается простым расчетом на основе n пар двумерных данных (х>1, y>1), (х>2, у>2),..., (x>n, y>n). После применения техники наименьших квадратов получаем, продифференцировав и приравняв к нулю, уравнения, известные под названием нормальных уравнений:
откуда выводятся значения a и b:
где Cov(X, Y) — это ковариация переменных, Sx² и x — вариация и среднее значение переменной X, соответственно, а у — среднее значение переменной Y. Итоговую прямую называют регрессионной прямой. Такие вычисления позволяют определить возможное значение одной переменной на основе известного значения другой. Представим, что мы выбрали n индивидов, у которых пропорция между весом и ростом нормальная. На основе этих n пар данных мы делаем вычисления соответствующей регрессионной прямой. С помощью этого уравнения мы можем определить средний ожидаемый вес человека, зная его рост, — это вычисление используется по сей день. Рассмотрим следующую таблицу данных.
Рост | Вес |
170 | 68 |
172 | 70 |
174 | 71 |
175 | 72 |
177 | 73 |
180 | 76 |
182 | 80 |
185 | 82 |
186 | 83 |
187 | 84 |
190 | 85 |
193 | 85 |
194 | 86 |
Проведя вычисления для получения регрессионной прямой, получаем, что Y= 0,808Х - 68,912, где Υ — вес, а Х — рост. На графике на следующей странице представлены реальные точки и регрессионная прямая, вычисленная методом наименьших квадратов. Прямая позволяет нам спрогнозировать средний вес человека с ростом 179 сантиметров: Υ = 0,808 · 179-68,921 = 75,71.
Чем сложнее функция ƒ, тем сложнее вычисления, но тем большую точность мы получаем в итоге.
Значительная часть статистики — это формулирование предположений, то есть извлечение выводов о параметрах аудитории на основе репрезентативной выборки. Эти выводы получены с помощью функции выборки, называемой статистической оценкой, которая предполагает оценку поведения целевой аудитории. Для статистического предположения принципиальную роль играет теорема Гаусса — Маркова. В ней утверждается, что при выполнении определенных гипотез статистическая оценка, полученная методом наименьших квадратов, является оптимальной.