= 5/100 = 0,05).
Чтобы решить поставленную задачу, нужно сформулировать несколько статистических гипотез об уровне безработицы. Они не должны слишком отличаться от 0,35 (35 %): 34, 36, 33, 37, 32, 38 … Выбор гипотез следует продолжать до тех пор, пока мы не найдем значение, большее или меньшее 35 %, которое нужно будет отвергнуть. Так как требуемый уровень значимости составляет 5 %, чтобы проверить гипотезу, нужно проанализировать следующее неравенство.
Гипотезы, соответствующие этому, отвергаются.
Аналогичные расчеты повторяются для разных гипотез. Каждой гипотезе соответствует определенное значение р (предполагаемый уровень безработицы в регионе). Нужно выбрать значения р, близкие к 0,35 (35 %), и использовать биномиальное распределение вероятности, так как в нашем случае рассматриваемая переменная может иметь всего два значения: «да» и «нет». Однако поскольку в нашем примере размер генеральной совокупности значителен (n = 8000000), вместо биномиального распределения с высокой точностью можно использовать нормальное распределение вероятности.
Выберем в качестве первой гипотезы значение р = 0,33. Найдем среднее значение и среднеквадратическое отклонение по формулам биномиального распределения:
откуда имеем
Число безработных k в генеральной совокупности, выходящее за границы доверительного интервала, равно |k — μ|, число безработных в нашей выборке, большее или меньшее среднего по выборке, равно |700 — μ|. Чтобы гипотеза р = 0,33 была верна, вероятность |k — μ| — |700 — μ| согласно биномиальному закону распределения должна быть меньше, чем α = 0,05, что выражается следующим образом:
РВ(|k — 660| >= |700–660 |) < 0,05.
Преобразуем неравенство и получим:
Вместо биномиального распределения можно с высокой точностью использовать нормальное распределение, симметричное относительно среднего значения μ = 660 при р = 0,33. Следовательно,
PB(|k — 660)| >= 40) = РВ(620 >= k >= 700) = 2РВ(k >= 700), так как выделенные области равны.
Чтобы заменить биномиальный закон (РВ для дискретной переменной k) на нормальный (PN для непрерывной переменной х), нужно внести поправку:
PBinominal (k >= 1)
PNormal (
x >=
a — 0.5).
Таким образом, как можно видеть на графике,
PB(|k — 660)| >= 40) = 2РВ(k >= 700)
2∙
PN(
x >= 700 — 0,5) = 2∙
PN(
x >= 699,5).
Теперь переменная х заменяется переменной z, соответствующей стандартизованному нормальному распределению, и мы сможем воспользоваться стандартными таблицами. Замена выполняется по формуле
Как можно видеть на графике,
В таблицах значений, соответствующих стандартизованному нормальному распределению, значению