Теория вероятностей и математическая статистика/Проверка статистических гипотез
Основные определения
[править]Статистической гипотезой называется предположение относительно вида неизвестного распределения или неизвестных параметров известного распределения случайной величины.
Проверяемая гипотеза называется нулевой гипотезой. Альтернативной называют гипотезу , противоречащую нулевой.
Правило, согласно которому принимается или отклоняется гипотеза , называется статистическим критерием.
Проверка статистической гипотезы состоит в том, что по имеющейся выборке вычисляется значение некоторой случайной величины , называемой статистикой, точное или приближенное распределение которой известно. Затем по этому распределению определяется критическое значение , разбивающее все множество значений статистики критерия на два непересекающихся подмножества: критическую область (область отклонения гипотезы ) и область допустимых значений (область принятия гипотезы ).
При проверке правильности выдвинутой нулевой гипотезы могут быть допущены ошибки двух видов: 1) ошибка первого рода, состоящая в том, что будет отвергнута правильная нулевая гипотеза; 2) ошибка второго рода, заключающаяся в том, что будет принята неправильная нулевая гипотеза.
Вероятность ошибки первого рода называется уровнем значимости критерия и обозначается через . Уровень значимости определяет размер критической области.
Вероятность ошибки второго рода обозначается через .
Проверка статистических гипотез основывается на принципе, в соответствии с которым принимаются события, имеющие большую вероятность, и отвергаются имеющие малую вероятность.
Различают разные виды критических областей:
- Правостороннюю критическую область, определяемую неравенством (рис. 1);
- Левостороннюю критическую область, определяемую неравенством (рис. 2);
- Двустороннюю критическую область, определяемую неравенством (рис. 3).
Основные этапы проверки статистической гипотезы
[править]Таким образом, проверка статистических гипотез может быть разбита на следующие основные этапы:
- Формулировка проверяемой() и альтернативной() гипотез;
- Выбор уровня значимости (стандартные значения );
- Выбор статистики критерия (тип критерия);
- Вычисление эмпирического (наблюдаемого) значения выбранной статистики;
- Определение критических значений статистики , найденных по соответствующим таблицам;
- Принятие решения в зависимости от того, в какую область попадает вычисленное по выборке значение статистики (сравнение табличных и вычисленных значений статистики критерия).
Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что верна альтернативная гипотеза; эта вероятность равна .
После выбора уровня значимости следует строить критическую область так, чтобы мощность критерия была максимальной.
Проверка гипотезы о математическом ожидании a нормально распределенной генеральной совокупности
[править]Пусть имеем следующую нулевую гипотезу и одну из альтернативных:
- (правосторонняя критическая область);
- (левосторонняя критическая область);
- (двусторонняя критическая область).
Если известно среднее квадратическое отклонение , то в качестве статистики берется .
В каждом случае необходимо по выборке вычислить значение и сравнить его с .
Соотношения, по которым может быть найдена , а также условия для принятия нулевой гипотезы представлены в таблице:
Тип альтернативной гипотезы | Определение | Гипотеза принимается | Гипотеза отвергается |
---|---|---|---|
1) | (см. рис. 1) | ||
2) | (см. рис. 2) | ||
3) | (см. рис. 3) |
Если среднее квадратическое отклонение неизвестно, то статистика критерия имеет распределение Стьюдента с степенями свободы: , где - исправленное среднее квадратическое отклонение.
Критическая точка находится из таблицы приложения 3.
Для проверки гипотезы необходимо по выборке вычислить значение . Если , то гипотеза принимается, в противном случае отвергается.
Аналогично проверяются гипотезы для случаев 2) и 3).
Проверка гипотезы о нормальном распределении
[править]Пусть имеется генеральная совокупность , из которой извлечена выборка объема . По данным выборки вычисляются выборочное среднее и выборочное среднее квадратическое отклонение . Диапазон значений разбивается на интервалов и подсчитывается число выборочных значений , попавших в -й интервал.
Вычисляются теоретические вероятности того, что значение случайной величины принадлежит -му интервалу, по формуле , где и — границы -го интервала.
Необходимо проверить гипотезу : генеральная совокупность распределена нормально при заданном уровне значимости . Для этого используется критерий Пирсона (критерий ) .
По данным выборки находится и сравнивается с критическим значением . Если , то гипотезу принимают, в противном случае отвергают. Значение находится по таблице приложения 5.
Примеры
[править]Пример 1
[править]Из нормальной генеральной совокупности с известной дисперсией извлечена выборка объема , и по ней найдено выборочное среднее . При уровне значимости проверить нулевую гипотезу о том, что математическое ожидание a соответствующей генеральной совокупности равно . Рассмотреть все возможные альтернативные гипотезы.
Решение:
Необходимо проверить гипотезу . Рассмотрим три вида альтернативных гипотез: 1) ; 2) ; 3) .
1) Найдем по выборке значение .
Критическая точка может быть найдена из условия (по таблице приложения 2), следовательно, .
Так как , гипотеза отвергается и принимается гипотеза .
2) Критическая точка может быть найдена из того же условия , следовательно, .
Так как , гипотеза принимается.
3) Критическая точка может быть найдена из условия . Получим: .
Так как , гипотеза принимается.
Пример 2
[править]Имеется генеральная совокупность, из которой извлечена выборка объема :
Интервал | ||||||
---|---|---|---|---|---|---|
Проверить гипотезу о том, что генеральная совокупность распределена нормально при уровне значимости
Решение:
В качестве вариант возьмем середины интервалов ; ; ; ; ; . Выборочное среднее равно , выборочное и исправленное средние квадратические отклонения равны и .
Диапазон значений разбит на интервалов.
Теоретические вероятности равны .
Аналогично находятся остальные вероятности: , , , , .
Необходимо проверить гипотезу : генеральная совокупность распределена нормально при заданном уровне значимости . Для этого используется критерий Пирсона (критерий ) .
По данным выборки находится и сравнивается с критическим значением . Так как , гипотезу принимают.
Упражнения
[править]