Теория вероятностей и математическая статистика/Проверка статистических гипотез

Материал из Викиверситета

Основные определения[править]

Статистической гипотезой называется предположение относительно вида неизвестного распределения или неизвестных параметров известного распределения случайной величины.

Проверяемая гипотеза называется нулевой гипотезой. Альтернативной называют гипотезу , противоречащую нулевой.

Правило, согласно которому принимается или отклоняется гипотеза , называется статистическим критерием.

Проверка статистической гипотезы состоит в том, что по имеющейся выборке вычисляется значение некоторой случайной величины , называемой статистикой, точное или приближенное распределение которой известно. Затем по этому распределению определяется критическое значение , разбивающее все множество значений статистики критерия на два непересекающихся подмножества: критическую область (область отклонения гипотезы ) и область допустимых значений (область принятия гипотезы ).

При проверке правильности выдвинутой нулевой гипотезы могут быть допущены ошибки двух видов: 1) ошибка первого рода, состоящая в том, что будет отвергнута правильная нулевая гипотеза; 2) ошибка второго рода, заключающаяся в том, что будет принята неправильная нулевая гипотеза.

Вероятность ошибки первого рода называется уровнем значимости критерия и обозначается через . Уровень значимости определяет размер критической области.

Вероятность ошибки второго рода обозначается через .

Проверка статистических гипотез основывается на принципе, в соответствии с которым принимаются события, имеющие большую вероятность, и отвергаются имеющие малую вероятность.

Различают разные виды критических областей:

  1. Правостороннюю критическую область, определяемую неравенством (рис. 1);
  2. Левостороннюю критическую область, определяемую неравенством (рис. 2);
  3. Двустороннюю критическую область, определяемую неравенством (рис. 3).

Основные этапы проверки статистической гипотезы[править]

Таким образом, проверка статистических гипотез может быть разбита на следующие основные этапы:

  1. Формулировка проверяемой() и альтернативной() гипотез;
  2. Выбор уровня значимости (стандартные значения );
  3. Выбор статистики критерия (тип критерия);
  4. Вычисление эмпирического (наблюдаемого) значения выбранной статистики;
  5. Определение критических значений статистики , найденных по соответствующим таблицам;
  6. Принятие решения в зависимости от того, в какую область попадает вычисленное по выборке значение статистики (сравнение табличных и вычисленных значений статистики критерия).

Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что верна альтернативная гипотеза; эта вероятность равна .

После выбора уровня значимости следует строить критическую область так, чтобы мощность критерия была максимальной.

Проверка гипотезы о математическом ожидании   a   нормально распределенной генеральной совокупности[править]

Пусть имеем следующую нулевую гипотезу и одну из альтернативных:

  1. (правосторонняя критическая область);
  2. (левосторонняя критическая область);
  3. (двусторонняя критическая область).

Если известно среднее квадратическое отклонение , то в качестве статистики берется .

В каждом случае необходимо по выборке вычислить значение и сравнить его с .

Соотношения, по которым может быть найдена , а также условия для принятия нулевой гипотезы представлены в таблице:

Тип альтернативной гипотезы Определение Гипотеза принимается Гипотеза отвергается
1) (см. рис. 1)
2) (см. рис. 2)
3) (см. рис. 3)

Если среднее квадратическое отклонение неизвестно, то статистика критерия имеет распределение Стьюдента с степенями свободы: , где - исправленное среднее квадратическое отклонение.

Критическая точка находится из таблицы приложения 3.

Для проверки гипотезы необходимо по выборке вычислить значение . Если , то гипотеза принимается, в противном случае отвергается.

Аналогично проверяются гипотезы для случаев 2) и 3).

Проверка гипотезы о нормальном распределении[править]

Пусть имеется генеральная совокупность , из которой извлечена выборка объема . По данным выборки вычисляются выборочное среднее и выборочное среднее квадратическое отклонение . Диапазон значений разбивается на интервалов и подсчитывается число выборочных значений , попавших в -й интервал.

Вычисляются теоретические вероятности того, что значение случайной величины принадлежит -му интервалу, по формуле , где и — границы -го интервала.

Необходимо проверить гипотезу : генеральная совокупность распределена нормально при заданном уровне значимости . Для этого используется критерий Пирсона (критерий ) .

По данным выборки находится и сравнивается с критическим значением . Если , то гипотезу принимают, в противном случае отвергают. Значение находится по таблице приложения 5.

Примеры[править]

Пример 1[править]

Из нормальной генеральной совокупности с известной дисперсией извлечена выборка объема , и по ней найдено выборочное среднее . При уровне значимости проверить нулевую гипотезу о том, что математическое ожидание a соответствующей генеральной совокупности равно . Рассмотреть все возможные альтернативные гипотезы.

Решение:

Необходимо проверить гипотезу . Рассмотрим три вида альтернативных гипотез: 1) ; 2) ; 3) .

1) Найдем по выборке значение .

Критическая точка может быть найдена из условия (по таблице приложения 2), следовательно, .

Так как , гипотеза отвергается и принимается гипотеза .

2) Критическая точка может быть найдена из того же условия , следовательно, .

Так как , гипотеза принимается.

3) Критическая точка может быть найдена из условия . Получим: .

Так как , гипотеза принимается.

Пример 2[править]

Имеется генеральная совокупность, из которой извлечена выборка объема :

Интервал

Проверить гипотезу о том, что генеральная совокупность распределена нормально при уровне значимости

Решение:

В качестве вариант возьмем середины интервалов ; ; ; ; ; . Выборочное среднее равно , выборочное и исправленное средние квадратические отклонения равны и .

Диапазон значений разбит на интервалов.

Теоретические вероятности равны .

Аналогично находятся остальные вероятности: , , , , .

Необходимо проверить гипотезу : генеральная совокупность распределена нормально при заданном уровне значимости . Для этого используется критерий Пирсона (критерий ) .

По данным выборки находится и сравнивается с критическим значением . Так как , гипотезу принимают.

Упражнения[править]

1 Статистической гипотезой называется...

Проверяемая гипотеза
называется предположение относительно вида неизвестного распределения или неизвестных параметров известного распределения случайной величины
Вероятность ошибки первого рода

2 Какого вида критической области не существует?

Односторонняя критическая область
Правосторонняя критическая область
Двусторонняя критическая область

3 По какой формуле вычисляется критерий Пирсона?