Переход на главную страницу сайта “Термист” Термист
Термомеханическое упрочнение арматурного проката
технология, средства, разработка
Главная О сайте Стандарты Технология Устройства
Лаборатория Библиотека Глоссарий Желтые страницы Обратная связь

Проверка статистических гипотез

 

Проверка статистических гипотез - один из основных разделов математической статистики, объединяющий методы проверки соответствия статистических данных некоторой статистической гипотезе (гипотезе о вероятностной природе данных). Процедуры проверки статистических гипотез позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов наблюдений по многих практически важных разделах науки и производства, связанных со случайным экспериментом. Правило, в соответствии с которым принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции T = T(X1, ..., Xn) от результатов наблюдений X1, ..., Xn, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей T может быть вычислено при допущении, что проверяемая гипотеза верна, и что это распределение не зависит от характеристик гипотетического распределения. По распределению статистики T находится критическое значение T0 такое, что если гипотеза верна, то вероятность неравенства T>T0 равна α, где α - заранее заданный уровень значимости (область значений (x1, ..., xn), для которых T(X1, ..., Xn)>T0, область отклонения гипотезы H0, называется критической областью). Если в конкретном случае обнаружится, что T>T0, то считается, что расхождение значимо, и гипотеза отвергается, тогда как появление значения T≤T0 не противоречит гипотезе. Такого рода критерии, называются критериями значимости, используются как для проверки гипотез о параметрах распределения, так и гипотез о самих распределениях. В частном случае, когда проверяется согласие между выборочным и гипотетическим распределениями, пользуются термином критерий согласия.

Пусть, например, проверяется гипотеза о том, что независимые результаты наблюдений X1, ..., Xn подчиняются нормальному распределению со средним значением a=a0 при известной дисперсии σ2. При этом арифметическое среднее Xср = (X1+...+Xn)/n результатов наблюдений распределено нормально с математическим ожиданием a=a0 и дисперсией σ2/n, а величина Критерий согласия для нормального распределения распределена нормально с параметрами (0, 1). Полагая
Критерий согласия для нормального распределения
можно найти связь между T0 и a по таблицам нормального распределения. Например, при гипотезе a=a0 событие T>1.96 имеет вероятность 0.05. Правило, в соответствии с которым гипотеза a=a0 объявляется неверной при T>1.96, будет приводить к ложному отбрасыванию этой гипотезы в среднем в 5 случаях из 100, в которых она верна. Если же T≤1.96, то это ещё не означает, что гипотеза подтверждается, т. к. указанное неравенство с большой вероятностью может выполняться при a, близких к a0. Следовательно, при использовании предложенного критерия можно лишь утверждать, что результаты наблюдений не противоречат гипотезе a=a0. Если дисперсия σ2 неизвестна, то вместо данного критерия для проверки гипотезы a=a0 можно воспользоваться критерием Стъюдента, основанным на статистике Статистика для критерия Стьюдента которая включает несмещённую оценку дисперсии
Несмещённуя оценка дисперсии
и подчинена распределению Стьюдента с n-1 степенями свободы. Для проверки гипотезы о неизвестном значении σ2 используется хи-квадрат критерий.

При выборе статистики T всегда явно или неявно высказывают гипотезы, альтернативные проверяемой гипотезе. Например, при проверке гипотезы a=a0 с известным σ2 вместо Статистика для нормального распределения следует взять Еще один критерий согласия для нормального распределения, если заранее известно, что a≥a0, т. е. отклонение гипотезы a=a0 влечёт принятие гипотезы a>a0.

При решении вопроса о принятии или отклонении какой-либо гипотезы H0 с помощью любого критерия, основанного на результатах наблюдения, могут быть допущены ошибки двух типов. Ошибка "первого рода" совершается тогда, когда отвергается верная гипотеза H0. Ошибка "второго рода" совершается в том случае, когда гипотеза H0 принимается, а на самом деле верна не она, а какая-либо альтернативная гипотеза H1. Естественно требовать, чтобы критерий для проверки данной гипотезы приводил возможно реже к ошибочным решениям. Обычная процедура построения наилучшего критерия для простой гипотезы заключается в выборе среди всех критериев с заданным уровнем значимости α (вероятность ошибки 1-го рода) такого, который имел бы наименьшую вероятность ошибки 2-го рода (или, что то же самое, наибольшую вероятность отклонения гипотезы, когда она неверна). Последняя вероятность (дополняющая до единицы вероятность ошибки 2-го рода) называется мощностью статистического критерия. В случае когда альтернативная гипотеза H1 простая (см. Статистическая гипотеза), наилучшим будет критерий, который имеет наибольшую мощность среди всех других критериев с заданным уровнем значимости α (наиболее мощный статистический критерий). Если альтернативная гипотеза H1 сложная, например зависит от параметра, то мощность критерия будет функцией, определённой на классе простых альтернативных гипотез, составляющих H1, т. е. будет функцией параметра. Критерий, имеющий наибольшую мощность при каждой альтернативной гипотезе из класса H1 называется равномерно наиболее мощным статистическим критерием, однако следует отметить, что такой критерий существует лишь в немногих специальных ситуациях. В задаче проверки простой гипотезы о среднем значении нормальной совокупности a=a0 против сложной альтернативной гипотезы a>a0 равномерно наиболее мощный критерий существует, тогда как при проверке той же гипотезы против альтернативы a≠a0 его нет. Поэтому часто ограничиваются поиском равномерно наиболее мощных критериев в тех или иных специальных классах (инвариантных, несмещённых и т. п. критериев).

Теория проверки статистических гипотез позволяет с единой точки зрения трактовать задачи математической статистики, связанные с проверкой гипотез (оценка различия между средними значениями, проверка гипотезы постоянства дисперсии, проверка гипотез независимости, проверка гипотез о распределениях и т. п.). Идеи последовательного статистического анализа, применённые к проверке статистических гипотез, указывают на возможность связать решение о принятии или отклонении гипотезы с результатами последовательно проводимых наблюдений (в этом случае число наблюдений, на основе которых по определённому правилу принимается решение, не фиксируется заранее, а определяется в ходе эксперимента). Основные задачи проверки статистических гипотез могут быть сформулированы в рамках теории статистических решений.

 



Опубликовано по материалам: Математический энциклопедический словарь. / Гл. ред. Ю.В.Прохоров; Ред. кол.: С.И.Адян, Н.С.Бахвалов, В.И.Битюцков и др. - М.: Сов. энциклопедия, 1988. - 847 с. стр. 561 - 562.

 

К началу страницы


Web-сайт “Термист” (termist.com)
Термомеханическое упрочнение арматурного проката

Отсутствие ссылки на использованный материал является нарушением заповеди "Не укради"

Редактор сайта: Гунькин И.А. (termist.com@gmail.com)