10969

Статистические критерии Что такое критерий значимости?

Лекция

Математика и математический анализ

Статистические критерии Что такое критерий значимости Прежде чем перейти к рассмотрению понятия статистической гипотезы сформулируем так называемый принцип практической уверенности лежащий в основе применения выводов и рекомендаций полученных с помощью теории ...

Русский

2013-04-03

236.79 KB

33 чел.

Статистические критерии

Что такое критерий значимости?

Прежде, чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверенности, лежащий в основе применения выводов и рекомендаций, полученных с помощью теории вероятностей и математической статистики:

Если вероятность события в данном испытании очень мала, то при однократном испытании можно быть уверенным в том, что событие не произойдет, и в практической деятельности вести себя так, как будто, событие вообще невозможно.

Вопрос о том, насколько малой должна быть вероятность события , чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события .

В ряде случаев можно пренебречь событиями, вероятность которых меньше 0.05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т.п. нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0.001.

Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки гипотезы.

Критерии значимости (критерии проверки гипотез, иногда – просто тесты) – это простейшие, но, наиболее широко используемые статистические средства.

Критерий значимости дает возможность статистику найти разумный ответ на вопрос, подобный следующим:

  1.  Сталь, произведенная разными методами, имеет неодинаковые пределы прочности. "Указывает ли это на то, что производимая разными методами сталь имеет различную прочность, или же выявленное различие можно объяснить выборочными флуктуациями?"
  2.  "Превосходит ли по эффективности одно противогриппозное средство другое?"
  3.  "Способствует ли отказ от курения снижению вероятности раковых заболеваний?"
  4.  "Превосходит ли по воздействию одно удобрение другое при выращивании овощей?"

Проверка гипотез

Статистической – называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Рассмотрим простейший вид статистической процедуры, называемой проверкой гипотез.

Пусть дана некоторая оценка , построенная по выборке из независимых наблюдений СВ . Предположим, что есть основания считать истинное значение оцениваемого параметра равным . Однако даже если истинное значение параметра равно , выборочное значение , вероятно, не будет в точности равняться из-за выборочной изменчивости, присущей . Поэтому возникает следующий вопрос. Если предположить, что , то, при каком отклонении от , эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения от по выборочному распределению . Если вероятность такого отличия мала, то отличие следует считать значимым, и гипотеза должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости, и гипотеза может быть принята.

Проиллюстрируем общий подход, предположив, что выборочное значение , являющееся оценкой параметра , имеет плотность вероятности нормального распределения . Теперь, если гипотеза верна, то должна иметь среднее значение (рис. 6.1).

Рис.6.1. Область принятия и отклонения гипотезы (двусторонний критерий)

Вероятность , использованная при испытании гипотез, называется уровнем значимости критерия. 

Вероятность того, что окажется меньше нижней границы , равна вероятности того, что превзойдет верхнюю границу и каждая из них равна . Следовательно, вероятность того, что окажется вне интервала, заключенного между этими границами равна . Область значений , при которых гипотеза принимается, называется областью принятия гипотезы.

Нулевой (основной) называют выдвинутую гипотезу . В данном примере .

Область значений , при которых гипотеза должна быть отвергнута, называется областью отклонения гипотеза или критической областью.

Конкурирующей (альтернативной) называют гипотезу, которая противоречит нулевой. В данном примере .

Рассмотренный нами простой критерий испытания гипотез называется двусторонним критерием, т.к., когда гипотеза неверна, значение может быть либо больше, либо меньше .

В других случаях достаточно бывает односторонних критериев. Например, пусть основная гипотеза . Тогда альтернативная гипотеза состоит в том: . Следовательно, в критерии должна использоваться только нижняя (левая) граница , определяемая по плотности вероятности .

Рис.6.2. Область принятия и отклонения гипотезы (односторонний критерий)

При проверке гипотезы возможны два типа ошибок.

  1.  Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода.
  2.  Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода.


Проиллюстрируем эти понятия графически (рис. 6.3).

Рис. 6.3. Определение ошибки первого и второго рода при проверке гипотез

Из рисунка видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы значение попадает в область ее отклонения (критическую область). Следовательно, вероятность ошибки первого рода равна , т.е. уровню значимости критерия.

Для определения вероятности ошибки второго рода предположим, к примеру, что истинный параметр равен либо , либо
(см. рис. 6.3). Если гипотеза состоит в том, что
, тогда как на самом деле , то вероятность того, что попадает в область принятия гипотезы, заключенную между и равна . Следовательно, вероятность ошибки второго рода равна при выявлении отклонения величиной от гипотетического значения .

Вероятность называется мощностью критерия.

Следует отметить, что вероятности ошибок первого и второго рода вычисляются при разных предположениях о распределении (если верна гипотеза и если верна гипотеза ), так что никаких раз и навсегда фиксированных соотношений (например , независимо от вида гипотезы и вида критерия) между ними нет. Таким образом, при фиксированном объеме выборки , мы можем сколь угодно уменьшать ошибку первого рода, уменьшая уровень значимости . При этом, естественно, возрастает вероятность ошибки второго рода (уменьшается мощность критерия). Единственный способ одновременно уменьшить ошибки первого и второго рода и – увеличить размер выборки . Именно такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.


Пример 1. ПОСТРОЕНИЕ КРИТЕРИЯ ПРОВЕРКИ ГИПОТЕЗ

Предположим, что среднее значение СВ равно , также предположим, что дисперсия известна и равна . Необходимо найти объем выборки , позволяющий построить критерий проверки гипотезы с 5% – уровнем значимости и 5% – ошибкой второго рода для выявления 10% – отклонений от гипотетического значения. Построим также область принятия гипотезы .

Решение. Выборочное среднее , определяемое формулой (3.2), является несмещенной оценкой . Соответствующее выборочное распределение определяется из соотношения (4.6):

    (6.1)

где имеет распределение . Верхняя и нижняя границы области принятия гипотезы соответственно равны:

   (6.2)

Если теперь истинное среднее значение равно , то с вероятностью произойдет ошибка второго рода, если выборочное среднее окажется меньше (левее) верхней границы и больше (правее) нижней. В терминах выборочного распределения со средним или для верхней и нижней границ (см. рис. 6.3):

  (6.3)

Итак, справедливы следующие равенства:

 (6.4)

Вспомним, что благодаря симметричности распределения справедливы равенства:

  (6.5)

Теперь из (6.4) с учетом (6.5) найдем требуемый объем выборки:

    (6.6)

Для конкретных значений данного примера:

Подставим эти значения в (6.6) и получим значение необходимого объема выборки . Таким образом, объем выборки должен быть равен или больше пятидесяти двух. Область принятия гипотезы определяется соответствующими границами (верхней и нижней) (6.2):


 

А также другие работы, которые могут Вас заинтересовать

77628. Анализ коммерческих расходов в ООО «Квитэк» 182.86 KB
  Тема дипломной работы – учет и анализ коммерческих расходов - выбрана не случайно. Ее актуальность обусловлена тем, что издержки обращения являются одним из обобщающих показателей интенсификации и эффективности потребления ресурсов.
77629. Ценовая политика предприятия «Котлас - Мебель» 744.5 KB
  Актуальность выбранной темы «Ценовая политика организации» объясняется важностью ценовой политики в деятельности предприятия. Одним из наиболее быстрых и экономически эффективных методов увеличения нормы прибыли является совершенствование механизма ценообразования.
77631. Выявление актуальных проблем и предложение рекомендаций по совершенствованию организации государственного заказа в органе исполнительной власти Омской области 108.36 KB
  Поставленная цель предполагает решение ряда задач: раскрыть сущность государственного заказа и принципы на которых он основывается; охарактеризовать нормативно-правовое обеспечение в сфере размещения государственных заказов...
77632. ОСОБЕННОСТИ НАЛОГООБЛОЖЕНИЯ РОССИЙСКОГО МАЛОГО ПРЕДПРИНИМАТЕЛЬСТВА 149.63 KB
  В настоящее время большинство малых предприятий затрудняются в выборе налогового режима, либо необоснованно его выбирают, что влечет за собой ошибки в бухгалтерском и налоговом учете, поэтому перед учредителями малых предприятий...
77633. Соотношение политики и морали. Сократ, Аристотель, Эпикур, Макиавелли, Кант, Ильин 135 KB
  Мораль находит выражение в поступках человека по отношению к обществу, властным структурам, коллективу, семье и т.д. Ценности морали меняются с течением времени и различны у разных народов и слоев населения.
77634. Проблема соотношения биологического и социального в развитии психики человека 85.5 KB
  Интереснее чем сам человек ничего в мире нет. Что зависит от человека а что дано ему от рождения Что можно развить исправить чему можно научить И можно ли это сделать Где лежит граница и есть ли она Эти вопросы занимали умы ученых с давних времен.
77636. Философия Дзен 163 KB
  При изучении философии Дзен наилучшее представление о сути этого учения получаешь из примеров абсурдного, часто шокирующего, поведения учителей дзен. Если даже крупнейшие из них считали такой путь наилучшим для передачи своих идей, то могу ли я искать лучший?