10969

Статистические критерии Что такое критерий значимости?

Лекция

Математика и математический анализ

Статистические критерии Что такое критерий значимости Прежде чем перейти к рассмотрению понятия статистической гипотезы сформулируем так называемый принцип практической уверенности лежащий в основе применения выводов и рекомендаций полученных с помощью теории ...

Русский

2013-04-03

236.79 KB

33 чел.

Статистические критерии

Что такое критерий значимости?

Прежде, чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверенности, лежащий в основе применения выводов и рекомендаций, полученных с помощью теории вероятностей и математической статистики:

Если вероятность события в данном испытании очень мала, то при однократном испытании можно быть уверенным в том, что событие не произойдет, и в практической деятельности вести себя так, как будто, событие вообще невозможно.

Вопрос о том, насколько малой должна быть вероятность события , чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события .

В ряде случаев можно пренебречь событиями, вероятность которых меньше 0.05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т.п. нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0.001.

Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки гипотезы.

Критерии значимости (критерии проверки гипотез, иногда – просто тесты) – это простейшие, но, наиболее широко используемые статистические средства.

Критерий значимости дает возможность статистику найти разумный ответ на вопрос, подобный следующим:

  1.  Сталь, произведенная разными методами, имеет неодинаковые пределы прочности. "Указывает ли это на то, что производимая разными методами сталь имеет различную прочность, или же выявленное различие можно объяснить выборочными флуктуациями?"
  2.  "Превосходит ли по эффективности одно противогриппозное средство другое?"
  3.  "Способствует ли отказ от курения снижению вероятности раковых заболеваний?"
  4.  "Превосходит ли по воздействию одно удобрение другое при выращивании овощей?"

Проверка гипотез

Статистической – называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Рассмотрим простейший вид статистической процедуры, называемой проверкой гипотез.

Пусть дана некоторая оценка , построенная по выборке из независимых наблюдений СВ . Предположим, что есть основания считать истинное значение оцениваемого параметра равным . Однако даже если истинное значение параметра равно , выборочное значение , вероятно, не будет в точности равняться из-за выборочной изменчивости, присущей . Поэтому возникает следующий вопрос. Если предположить, что , то, при каком отклонении от , эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения от по выборочному распределению . Если вероятность такого отличия мала, то отличие следует считать значимым, и гипотеза должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости, и гипотеза может быть принята.

Проиллюстрируем общий подход, предположив, что выборочное значение , являющееся оценкой параметра , имеет плотность вероятности нормального распределения . Теперь, если гипотеза верна, то должна иметь среднее значение (рис. 6.1).

Рис.6.1. Область принятия и отклонения гипотезы (двусторонний критерий)

Вероятность , использованная при испытании гипотез, называется уровнем значимости критерия. 

Вероятность того, что окажется меньше нижней границы , равна вероятности того, что превзойдет верхнюю границу и каждая из них равна . Следовательно, вероятность того, что окажется вне интервала, заключенного между этими границами равна . Область значений , при которых гипотеза принимается, называется областью принятия гипотезы.

Нулевой (основной) называют выдвинутую гипотезу . В данном примере .

Область значений , при которых гипотеза должна быть отвергнута, называется областью отклонения гипотеза или критической областью.

Конкурирующей (альтернативной) называют гипотезу, которая противоречит нулевой. В данном примере .

Рассмотренный нами простой критерий испытания гипотез называется двусторонним критерием, т.к., когда гипотеза неверна, значение может быть либо больше, либо меньше .

В других случаях достаточно бывает односторонних критериев. Например, пусть основная гипотеза . Тогда альтернативная гипотеза состоит в том: . Следовательно, в критерии должна использоваться только нижняя (левая) граница , определяемая по плотности вероятности .

Рис.6.2. Область принятия и отклонения гипотезы (односторонний критерий)

При проверке гипотезы возможны два типа ошибок.

  1.  Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода.
  2.  Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода.


Проиллюстрируем эти понятия графически (рис. 6.3).

Рис. 6.3. Определение ошибки первого и второго рода при проверке гипотез

Из рисунка видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы значение попадает в область ее отклонения (критическую область). Следовательно, вероятность ошибки первого рода равна , т.е. уровню значимости критерия.

Для определения вероятности ошибки второго рода предположим, к примеру, что истинный параметр равен либо , либо
(см. рис. 6.3). Если гипотеза состоит в том, что
, тогда как на самом деле , то вероятность того, что попадает в область принятия гипотезы, заключенную между и равна . Следовательно, вероятность ошибки второго рода равна при выявлении отклонения величиной от гипотетического значения .

Вероятность называется мощностью критерия.

Следует отметить, что вероятности ошибок первого и второго рода вычисляются при разных предположениях о распределении (если верна гипотеза и если верна гипотеза ), так что никаких раз и навсегда фиксированных соотношений (например , независимо от вида гипотезы и вида критерия) между ними нет. Таким образом, при фиксированном объеме выборки , мы можем сколь угодно уменьшать ошибку первого рода, уменьшая уровень значимости . При этом, естественно, возрастает вероятность ошибки второго рода (уменьшается мощность критерия). Единственный способ одновременно уменьшить ошибки первого и второго рода и – увеличить размер выборки . Именно такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.


Пример 1. ПОСТРОЕНИЕ КРИТЕРИЯ ПРОВЕРКИ ГИПОТЕЗ

Предположим, что среднее значение СВ равно , также предположим, что дисперсия известна и равна . Необходимо найти объем выборки , позволяющий построить критерий проверки гипотезы с 5% – уровнем значимости и 5% – ошибкой второго рода для выявления 10% – отклонений от гипотетического значения. Построим также область принятия гипотезы .

Решение. Выборочное среднее , определяемое формулой (3.2), является несмещенной оценкой . Соответствующее выборочное распределение определяется из соотношения (4.6):

    (6.1)

где имеет распределение . Верхняя и нижняя границы области принятия гипотезы соответственно равны:

   (6.2)

Если теперь истинное среднее значение равно , то с вероятностью произойдет ошибка второго рода, если выборочное среднее окажется меньше (левее) верхней границы и больше (правее) нижней. В терминах выборочного распределения со средним или для верхней и нижней границ (см. рис. 6.3):

  (6.3)

Итак, справедливы следующие равенства:

 (6.4)

Вспомним, что благодаря симметричности распределения справедливы равенства:

  (6.5)

Теперь из (6.4) с учетом (6.5) найдем требуемый объем выборки:

    (6.6)

Для конкретных значений данного примера:

Подставим эти значения в (6.6) и получим значение необходимого объема выборки . Таким образом, объем выборки должен быть равен или больше пятидесяти двух. Область принятия гипотезы определяется соответствующими границами (верхней и нижней) (6.2):


 

А также другие работы, которые могут Вас заинтересовать

49349. Порядок разрешения земельных споров 78 KB
  Права и обязанности землевладельцев, землепользователей и собственников земельных участков возникают из юридических фактов. Права возникают с момента наступления события или совершения действия. Отдельные виды прав возникают с момента их государственной регистрации...
49350. Написание программы на языке программирования Паскаль для решения задачи 257.15 KB
  С помощью языка программирования системы Maple решается задача интегрирования дифференциального уравнения (задача Коши) методом (по варианту задания). Окончательные вычисления в программе зависят от результатов расчета программы в Delphi (следующий пункт). Образец выполнения задания – файл RUTTA.mws.
49351. Разработка конструкции механизма поворота для подвода и отвода пушки 588.42 KB
  Разработка конструкции механизма поворота для подвода и отвода пушки. В результате выполнения задания по курсовому проектированию разработана конструкция механизма поворота для подвода и отвода пушки. В работе приведен обзор и анализ известных конструкций машин для забивки чугунной летки описание конструкции механизма поворота.
49353. Методы локализации неисправностей на аппаратуре СВ и РМ 1.09 MB
  Краткое описание тракта прохождения сигнала Алгоритм поиска неисправности: на структурном уровне на функциональном уровне на принципиальном уровне Заключение Список использованной литературы Задание на курсовое проектирование Неисправность обнаружена на АРМ РМ10 и имеет внешние проявления: яркая засветка экрана ЭЛТ БИО. Эти аналоговые сигналы поступают на блоки БИО и БИВ где обеспечивается отклонение луча...
49354. ЦИФРОВЫЕ СИСТЕМЫ ПЕРЕДАЧИ НЕПРЕРЫВНЫХ СООБЩЕНИЙ 777.15 KB
  Вид модуляции сигнала во второй ступени ЧМ. С учётом заданного вида модуляции сигнала определить его параметры характеризующие форму и требуемое значение полосы пропускания приёмного устройства. По полученному значению вероятности ошибки по формулам потенциальной помехоустойчивости найти минимальное значение отношения мощностей сигнала и помехи необходимое для обеспечения допустимого уровня искажения кода за счёт действия помех. Рассчитать требуемое значение полосы приёмника при использовании сложного сигнала.
49355. Методы логического и физического кодирования 292.4 KB
  В процессе выполнения задания необходимо выполнить логическое и физическое кодирование исходного сообщения в соответствии с заданными методами кодирования провести сравнительный анализ рассматриваемых методов кодирования выбрать и обосновать наилучший метод для передачи исходного сообщения. ЭТАПЫ РАБОТЫ Формирование сообщения В качестве исходного сообщения подлежащего передаче используются фамилия и инициалы студента выполняющего задание. Для цифрового представления сообщения необходимо использовать SCIIкоды. Определить длину сообщения.
49356. Методы локализации неисправностей в аппаратуре СВ и РМ 196.92 KB
  Задано внешнее проявление неисправности: отсутствует развертка на экране БИО по координате Х. Эти аналоговые сигналы поступают на блок БИО где обеспечивают отклонение луча ЭЛТ из центра в необходимое место экрана а ИПТ обеспечивает подсвет отклоненного луча.3 Блок индикатора основной Блок индикатора основной БИО предназначен для: стабилизации вторичной информации о воздушной обстановке; отображение результатов целераспределения состояния боевой готовности и этапов ведения боевых действий подчиненными огневыми средствами;...
49357. Составление алгоритма и программы вычисления функции с использованием нестандартных функций 44.54 KB
  Основной задачей выполнения курсовой работы по технологической информатике является закрепление теоретических знаний,полученных в процессе самостоятельной работы, а также на лекциях, практических , лабораторных занятия, развитие практических навыков программирования , работы за терминалами или персональными компьютерами.