10969

Статистические критерии Что такое критерий значимости?

Лекция

Математика и математический анализ

Статистические критерии Что такое критерий значимости Прежде чем перейти к рассмотрению понятия статистической гипотезы сформулируем так называемый принцип практической уверенности лежащий в основе применения выводов и рекомендаций полученных с помощью теории ...

Русский

2013-04-03

236.79 KB

33 чел.

Статистические критерии

Что такое критерий значимости?

Прежде, чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверенности, лежащий в основе применения выводов и рекомендаций, полученных с помощью теории вероятностей и математической статистики:

Если вероятность события в данном испытании очень мала, то при однократном испытании можно быть уверенным в том, что событие не произойдет, и в практической деятельности вести себя так, как будто, событие вообще невозможно.

Вопрос о том, насколько малой должна быть вероятность события , чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события .

В ряде случаев можно пренебречь событиями, вероятность которых меньше 0.05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т.п. нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0.001.

Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки гипотезы.

Критерии значимости (критерии проверки гипотез, иногда – просто тесты) – это простейшие, но, наиболее широко используемые статистические средства.

Критерий значимости дает возможность статистику найти разумный ответ на вопрос, подобный следующим:

  1.  Сталь, произведенная разными методами, имеет неодинаковые пределы прочности. "Указывает ли это на то, что производимая разными методами сталь имеет различную прочность, или же выявленное различие можно объяснить выборочными флуктуациями?"
  2.  "Превосходит ли по эффективности одно противогриппозное средство другое?"
  3.  "Способствует ли отказ от курения снижению вероятности раковых заболеваний?"
  4.  "Превосходит ли по воздействию одно удобрение другое при выращивании овощей?"

Проверка гипотез

Статистической – называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Рассмотрим простейший вид статистической процедуры, называемой проверкой гипотез.

Пусть дана некоторая оценка , построенная по выборке из независимых наблюдений СВ . Предположим, что есть основания считать истинное значение оцениваемого параметра равным . Однако даже если истинное значение параметра равно , выборочное значение , вероятно, не будет в точности равняться из-за выборочной изменчивости, присущей . Поэтому возникает следующий вопрос. Если предположить, что , то, при каком отклонении от , эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения от по выборочному распределению . Если вероятность такого отличия мала, то отличие следует считать значимым, и гипотеза должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости, и гипотеза может быть принята.

Проиллюстрируем общий подход, предположив, что выборочное значение , являющееся оценкой параметра , имеет плотность вероятности нормального распределения . Теперь, если гипотеза верна, то должна иметь среднее значение (рис. 6.1).

Рис.6.1. Область принятия и отклонения гипотезы (двусторонний критерий)

Вероятность , использованная при испытании гипотез, называется уровнем значимости критерия. 

Вероятность того, что окажется меньше нижней границы , равна вероятности того, что превзойдет верхнюю границу и каждая из них равна . Следовательно, вероятность того, что окажется вне интервала, заключенного между этими границами равна . Область значений , при которых гипотеза принимается, называется областью принятия гипотезы.

Нулевой (основной) называют выдвинутую гипотезу . В данном примере .

Область значений , при которых гипотеза должна быть отвергнута, называется областью отклонения гипотеза или критической областью.

Конкурирующей (альтернативной) называют гипотезу, которая противоречит нулевой. В данном примере .

Рассмотренный нами простой критерий испытания гипотез называется двусторонним критерием, т.к., когда гипотеза неверна, значение может быть либо больше, либо меньше .

В других случаях достаточно бывает односторонних критериев. Например, пусть основная гипотеза . Тогда альтернативная гипотеза состоит в том: . Следовательно, в критерии должна использоваться только нижняя (левая) граница , определяемая по плотности вероятности .

Рис.6.2. Область принятия и отклонения гипотезы (односторонний критерий)

При проверке гипотезы возможны два типа ошибок.

  1.  Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода.
  2.  Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода.


Проиллюстрируем эти понятия графически (рис. 6.3).

Рис. 6.3. Определение ошибки первого и второго рода при проверке гипотез

Из рисунка видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы значение попадает в область ее отклонения (критическую область). Следовательно, вероятность ошибки первого рода равна , т.е. уровню значимости критерия.

Для определения вероятности ошибки второго рода предположим, к примеру, что истинный параметр равен либо , либо
(см. рис. 6.3). Если гипотеза состоит в том, что
, тогда как на самом деле , то вероятность того, что попадает в область принятия гипотезы, заключенную между и равна . Следовательно, вероятность ошибки второго рода равна при выявлении отклонения величиной от гипотетического значения .

Вероятность называется мощностью критерия.

Следует отметить, что вероятности ошибок первого и второго рода вычисляются при разных предположениях о распределении (если верна гипотеза и если верна гипотеза ), так что никаких раз и навсегда фиксированных соотношений (например , независимо от вида гипотезы и вида критерия) между ними нет. Таким образом, при фиксированном объеме выборки , мы можем сколь угодно уменьшать ошибку первого рода, уменьшая уровень значимости . При этом, естественно, возрастает вероятность ошибки второго рода (уменьшается мощность критерия). Единственный способ одновременно уменьшить ошибки первого и второго рода и – увеличить размер выборки . Именно такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.


Пример 1. ПОСТРОЕНИЕ КРИТЕРИЯ ПРОВЕРКИ ГИПОТЕЗ

Предположим, что среднее значение СВ равно , также предположим, что дисперсия известна и равна . Необходимо найти объем выборки , позволяющий построить критерий проверки гипотезы с 5% – уровнем значимости и 5% – ошибкой второго рода для выявления 10% – отклонений от гипотетического значения. Построим также область принятия гипотезы .

Решение. Выборочное среднее , определяемое формулой (3.2), является несмещенной оценкой . Соответствующее выборочное распределение определяется из соотношения (4.6):

    (6.1)

где имеет распределение . Верхняя и нижняя границы области принятия гипотезы соответственно равны:

   (6.2)

Если теперь истинное среднее значение равно , то с вероятностью произойдет ошибка второго рода, если выборочное среднее окажется меньше (левее) верхней границы и больше (правее) нижней. В терминах выборочного распределения со средним или для верхней и нижней границ (см. рис. 6.3):

  (6.3)

Итак, справедливы следующие равенства:

 (6.4)

Вспомним, что благодаря симметричности распределения справедливы равенства:

  (6.5)

Теперь из (6.4) с учетом (6.5) найдем требуемый объем выборки:

    (6.6)

Для конкретных значений данного примера:

Подставим эти значения в (6.6) и получим значение необходимого объема выборки . Таким образом, объем выборки должен быть равен или больше пятидесяти двух. Область принятия гипотезы определяется соответствующими границами (верхней и нижней) (6.2):


 

А также другие работы, которые могут Вас заинтересовать

84527. Всмоктування в травному каналі. Механізми всмоктування йонів натрію, води, вуглеводів, білків, жирів 44.89 KB
  Механізми всмоктування йонів натрію води вуглеводів білків жирів. Всмоктування – це процес транспорту речовин із порожнини травного каналу у внутрішні середовища організму кров та лімфу. Найінтенсивніше процеси всмоктування проходять в верхніх відділах тонкого кишківника. Всмоктування в шлунку.
84528. Рухова функція кишок, види скорочень, їх регуляція 50.42 KB
  Рух тонкої та товстої кишок принципово не відрізняються хоча рухи товстої кишки складніші так як в ній хімус знаходиться протягом більш тривалого часу. Саме в цих місцях виникають м’язеві скорочення що рухаються вздовж кишки в дистальному напрямку. Тонічні скорочення тривають близько 10 хв такі скорочення займають великі ділянки кишки. За рахунок тонусу зростає внутрішньокишковий тиск що покращує всмоктування і контакт хімусу та стінок кишки.
84529. Фізіологічні механізми голоду та насичення 40.95 KB
  Голод – фізіологічний стан зумовлений зниженням концентрації поживних речовин у крові спрямований на відновлення їх балансу в крові. Насичення – сума процесів що змушує організм відмовитися від приймання їжі при підвищенні рівня поживних речовин в крові до певного рівня. Активність обох центрів регулюється рівнем поживних речовин в крові інформація про котрий надходить від периферичних та центральних рецепторів глікорецептори ліпорецептори.
84530. Загальна характеристика системи кровообігу. Фактори, які забезпечують рух крові по судинах, його спрямованість та безперервність 43.29 KB
  Фактори які забезпечують рух крові по судинах його спрямованість та безперервність. СИСТЕМА КРОВООБІГУ ВИКОНАВЧІ ОРГАНИ МЕХАНІЗМИ РЕГУЛЯЦІЇ Нервові Гуморальні Серце Судини Хвилинний об’єм крові ХОК який є адекватним потребам організму В залежності від потреби організму ХОК може змінюватися у дорослої людини від 5 л хв спокій до 30 л хв стан фізичного навантаження у добре тренованого спортсмена. Причиною руху крові по судинам та через камери серця є різниця градієнт тисків що створюється завдяки: нагнітальній насосній функції...
84531. Автоматія серця. Градієнт автоматії. Дослід Станіуса 45.23 KB
  Ця здатність є у структурах серця побудованих з атипічних кардіоміоцитів а саме в стимульному комплексі провідній системі серця: Пазуховопередсердний вузол nodus sinutrilis; Передсердношлуночковий вузол nodus trioventriculris; Передсердношлуночковий пучок або пучок Гіса; Ніжки пучка Гіса права та ліва; Волокна Пуркіньє. Ці елементи провідної системи серця носять назву центрів автоматії й мають певний порядок. Градієнт автоматії – зменшення ступеня автоматії елементів провідної системи серця в напрямку від...
84532. Потенціал дії атипових кардіоміоцитів сино-атріального вузла, механізми походження, фізіологічна роль 43.38 KB
  Така зміна стану каналів мембран АКМЦ веде до повільного зменшення мембранного потенціалу деполяризація мембрани. Частота з якою центр автоматії генерує ПД залежить від двох факторів: 1 величина порогового потенціалу; чим вона більша тим частота менша; в звичайних умовах під впливом механізмів регуляції частіше змінюється рівень мембранного потенціалу спокою зміна порогового потенціалу зміна частоти генерації імпульсів збудження водієм ритму зміна частоти серцевих скорочень; 2 швидкість повільної діастолічної деполяризації ПДД;...
84533. Провідна система серця. Послідовність і швидкість проведення збудження по серцю 42.64 KB
  Послідовність і швидкість проведення збудження по серцю. Швидкість проведення збудження по структурах серця різна. Чинниками що впливають на швидкість проведення збудження по м’язовим волокнам є: діаметр волокон амплітуда ПД величина порогу деполяризації швидкість розвитку піку ПД наявність нексусів між міокардіоцитами – вони мають низький опір що сприяє швидкій передачі ПД з одного КМЦ на другий і збільшенню швидкості проведення збудження. Причинами великої швидкості проведення збудження по провідній системі серця є: великий діаметр...
84534. Потенціал дії типових кардіоміоцитів шлуночків, механізми походження, фізіологічна роль. Співвідношення у часі ПД одиночного скороченння міокарда 51.9 KB
  Типові кардіоміоцити ТКМЦ не мають властивості автоматії і генерують ПД під впливом подразника ПД що йде від водія ритму серця. ПД в ТКМЦ має особливості а саме він дуже тривалий – в шлуночках до 300 мс в нервових волокнах 1 мс в скелетних м’язах 25 мс. Фази ПД ТКМЦ: 1. Пов’язана з виходом із ТКМЦ йонів калію та вхід хлору 3.
84535. Періоди рефрактерності під час розвитку ПД типових кардіоміоцитів, їх значення 40.19 KB
  Значення великої тривалості ПД ТКМЦ стає зрозумілим якщо співставити його в часі з графіком зміни збудливості ТКМЦ при збудженні з графіком поодинокого скорочення міокарда: ПД ТКМЦ тривалий через наявність фази плато. АР відповідає розвитку латентного періоду поодинокого м’язевого скорочення періоду укорочення та значної частини періоду розслаблення. Завдяки такому співвідношенню у часі фаз збудливості та періодів поодинокого скорочення міокарда досягається: неможливість виникнення в міокарді тетанічних скорочень; наступний цикл...