2505

Статистическая проверка параметрических гипотез

Лекция

Социология, социальная работа и статистика

Понятие о гипотезе. Виды гипотез. Ошибки первого и второго рода. Статистический критерий проверки нулевой гипотезы. Отыскание критической области. Сравнение двух дисперсий нормальных генеральных совокупностей. Проверка гипотез равенства математических ожиданий двух случайных величин.

Русский

2013-01-06

97.31 KB

52 чел.

Лекция Статистическая проверка параметрических гипотез.

§1. Основные сведения.

 П.1 Понятие о гипотезе. Виды гипотез. Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид (назовем его ), выдвигают гипотезу: генеральная совокупность распределена по закону . Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.

 Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , выдвигают гипотезу: . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.

Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, или о параметрах известных распределений.

 Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.

Статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида функции распределения.

Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения известного вида.

 Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая ей гипотеза. По этой причине эти гипотезы целесообразно различать.

 Нулевой (основной) называют выдвинутую гипотезу .

 Обычно нулевые гипотезы утверждают, что различие между сравниваемыми величинами (параметрами или функциями распределения) отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями выборки.

 Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой.

 Например, если нулевая гипотеза состоит в предположении, что математическое ожидание нормального распределения равно 10 , то конкурирующая гипотеза, в частности, может состоять в предположении, что . Коротко это записывают так: ; .

Различают гипотезы, которые содержат одно и более одного предположения.

 Простой называют гипотезу, содержащую только одно предположение.

 Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

 П.2. Ошибки первого и второго рода.

 Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. В итоге статистической проверки гипотезы могут быть допущены ошибки двух родов.

 Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через . Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).

 Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через .

§2. Статистический критерий проверки нулевой гипотезы.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. В целях общности обозначим эту величину через .

 Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки нулевой гипотезы.

 Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.

 Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.

 После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.

 Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

 Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

 Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

 Поскольку критерий К – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

 Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.

 Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

 Правосторонней называют критическую область, определяемую неравенством К > kкр , где kкр – положительное число.

 Левосторонней называют критическую область, определяемую неравенством К < kкр , где kкр – отрицательное число.

 Двусторонней называют критическую область, определяемую неравенством К < k1 , К > k2 ,где k2>k1 . В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр>0): К < – kкр , К > kкр , или равносильным неравенством  kкр.

§3. Отыскание критической области.

Для отыскания критической области задаются уровнем значимости и ищут критические точки kкр, исходя из следующих соотношений:

 1) для правосторонней критической области вероятность того, что критерий примет значение, большее kкр, должна быть равна принятому уровню значимости:

  kкр)=, (kкр>0);

2) для левосторонней критической области: кр)=, (kкр<0);

3) для двусторонней симметричной области:  kкр)=, (kкр>0);

 кр)=.

 Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что набл > kкр , то нулевую гипотезу отвергают; если же набл < kкр , то нет оснований, чтобы отвергнуть нулевую гипотезу.

 Мощностью критерия называют вероятность попадания в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

§4. Сравнение двух дисперсий нормальных генеральных совокупностей.

На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.е. наименьшую дисперсию.

Пусть две генеральные совокупности распределены нормально. По независимым выборкам с объемами, равными и , извлеченными из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: .

Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, т.е. , , нулевую гипотезу можно записать так: .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны.

 В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий принимается отношение большей исправленной дисперсии к меньшей, которое обозначается: набл=sБ2/sМ2.

 Критическая область строится в зависимости от вида конкурирующей гипотезы. Пусть нулевая гипотеза имеет вид: . Если конкурирующая гипотеза: , то строят правостороннюю критическую область; если конкурирующая гипотеза: , то строят двустороннюю критическую область.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу  о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл и по таблице критических точек распределения Фишера–Снедекора, по заданному уровню значимости и числам степеней свободы , (– число степеней свободы большей исправленной дисперсии, – меньшей) найти критическую точку кр. Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе  критическую точку кр ищут по уровню значимости (вдвое меньше заданного) и числам степеней свободы и . Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Пример 1. Двумя методами произведены измерения одной и той же физической величины. Первым методом эта величина измерялась 10 раз, вторым – 8 раз. Получены следующие результаты: и . Можно ли считать, что оба метода обеспечивают одинаковую точность? Уровень значимости принять . Предполагается, что результаты измерений распределены нормально и выборки независимы.

 Решение. Из условия следует, что необходимо проверить нулевую гипотезу (оба метода обеспечивают одинаковую точность) против альтернативной (второй метод измерений обеспечивает более высокую точность).

Вычислим наблюдаемые значения - критерия: набл=0,00084 / 0,00041=2,05.

 По таблице квантилей - распределения по уровню значимости и числу степеней свободы и находим критическую точку кр. Так как набл=2,05, то нет оснований для отклонения нулевой гипотезы. Другими словами, имеющаяся информация о точности этих методов не дает основания считать, что второй метод измерения лучше первого.

§5. Сравнение двух средних генеральных совокупностей, дисперсии которых известны.

На практике при обработке результатов эксперимента, описываемого СВ , нередко возникает необходимость в решении задач «сравнения». Например, часто приходится сравнивать новый и старый технологические методы изготовления некоторых изделий; успеваемость в двух группах, применяющих различные методы обучения и т.д. В большинстве случаев распределение СВ предполагается нормальным, а изменения в «технологиях» сказывается на изменении математических ожиданий моделируемой нормальной совокупности. Таким образом, большинство задач сравнения сводится к проверке гипотез относительно математических ожиданий двух случайных величин, имеющих нормальное распределение.

Проверка гипотез равенства математических ожиданий двух случайных величин (большие независимые выборки).

Обозначим через и объемы больших () независимых выборок, по которым найдены соответствующие выборочные средние и . Генеральные дисперсии и известны.

Требуется по выборочным средним и при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой , т.е. : .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные средние одинаковы, то различие выборочных средних незначимо и объясняется случайными причинами и, в частности, случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные средние неодинаковы, то различие выборочных средних значимо и не может быть объяснено случайными причинами, а объясняется тем, что сами генеральные средние (математические ожидания) различны.

В качестве критерия проверки нулевой гипотезы принимается случайная величина: .   (1)

Значение критерия, вычисленное по данным наблюдений, обозначается через набл .

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости  проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных генеральных совокупностей с известными дисперсиями при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл  (21.2)

и по таблице функции Лапласа (приложение №2) найти критическую точку кр из равенства Ф(кр)=.

Если |набл |< кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл |> кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку кр по таблице функции Лапласа из равенства

Ф(кр)=.

Если набл < кр – нет оснований отвергнуть нулевую гипотезу.

Если набл > кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят критическую точку кр по правилу 2.

Если набл > –кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < – кр – нулевую гипотезу отвергают.

 Пример 2. По двум независимым выборкам, объемы которых соответственно равны и , извлеченным из нормальных генеральных совокупностей, найдены выборочные средние и . Генеральные дисперсии известны: (), (). При уровне значимости 0,01 проверить нулевую гипотезу при конкурирующей гипотезе .

 Решение. Найдем наблюдаемое значение критерия:

 набл.

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область – двусторонняя.

Найдем правую критическую точку: Ф(кр)=.

По таблице функции Лапласа находим кр=2,58. Так как |набл |> кр – нулевую гипотезу отвергаем. Другими словами, выборочные средние различаются значимо.

 

 

 

§6. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).

Пусть генеральные совокупности и распределены нормально, причем их дисперсии неизвестны. При этом условии по выборкам малого объема нельзя получить хорошие оценки генеральных дисперсий. По этой причине метод сравнения средних, изложенный в § 5, применить нельзя.

Однако если предположить, что неизвестные генеральные дисперсии равны между собой, то можно построить критерий (Стьюдента) сравнения средних. Если же нет оснований считать дисперсии одинаковыми, прежде чем сравнивать средние, следует, пользуясь критерием Фишера – Снедекора (§ 4), предварительно проверить гипотезу о равенстве генеральных дисперсий.

Таким образом, требуется проверить нулевую гипотезу  (или ), т.е. требуется установить, значимо или незначимо различаются выборочные средние и , найденные по независимым малым выборкам объемов и .

В качестве критерия проверки нулевой гипотезы примем случайную величину

  . (3)

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных совокупностей с неизвестными, но одинаковыми дисперсиями (в случае малых независимых выборок) при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия

 набл (4)

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости , помещенному в верхней строке таблицы приложения 6, и числу степеней свободы найти критическую точку двуст.кр.

Если |набл|<двуст.кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл|>двуст.кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку правост.кр по таблице приложения 6 по уровню значимости , помещенному в нижней строке таблицы, и числу степеней свободы .

 Если набл <правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл >правост.кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят сначала критическую точку правост.кр по правилу 2 и полагают левост.кр= –правост.кр.

Если набл > –правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < –правост.кр – нулевую гипотезу отвергают.


 

А также другие работы, которые могут Вас заинтересовать

21127. Сутність і соціальна природа релігії 55.5 KB
  Богослови майже усіх релігійних конфесій запевняють своїх віруючих, що їх релігія є віровчення, яке дано людям богом. Так, згідно з уявленням буддистів, буддизм був даний богами людям через Будду, людину, яка досягла вищої святості. Один з Будд, якого прозвали в його земному житті Шакьямуні
21128. Поверхностно-монтируемые компоненты (SMC или SMD) 90 KB
  Выводные компоненты IMC или THT Эта хорошо знакомая отечественным технологам группа компонентов включает традиционные пассивные компоненты с осевыми аксиальными выводами пассивные и активные компоненты с радиальными выводами а также интегральные схемы в DIP СИП и других менее распространенных корпусах. Нестандартные компоненты OFC К этой группе компонентов выделившейся относительно недавно мы относим выводные компоненты не вошедшие в IMC. Это самая пестрая группа компонентов включающая в себя соединители разъемы трансформаторы...
21129. Воздействия электрического характера 48 KB
  При реализации устройства возникают паразитные связи помехи. Паразитные связи являются следствием неидеальности реализации электрической схемы поэтому значения наводок определяются конструкцией изделия табл. Классификация паразитных связей в каналах передачи информации Причины помех Источники помех внутренние внешние Включение напряжения помехи в канале связи последовательное последовательное последовательное и параллельное Физические причины паразитной связи Неидеальность элементов в канале связи Неидеальность токопроводящих цепей...
21130. ПОНЯТИЕ О ПРОИЗВОДСТВЕННОМ И ТЕХНОЛОГИЧЕСКОМ ПРОЦЕССАХ 46.5 KB
  Изделием называется любой предмет или набор предметов производства подлежащих изготовлению на предприятии. Производство классифицируется тремя категориями: 1 Типы 2 Виды 3 Части Типы производства классификационная категория производства выделяемая по признакам широты номенклатуры регулярности стабильности и объема выпуска изделий. Тип производства важнейшая характеристика от которой зависит объем подготовки производства для выпуска изделия.
21131. Единая Система Технологической Документации (ЕСТД) 47.5 KB
  Назначение комплекса документов ЕСТД: установление единых унифицированных машинноориентированных форм документов обеспечивающих совместимость информации независимо от применяемых методов проектирования документов без применения средств механизации с применением средств механизации или автоматизации; создание единой информационной базы для внедрения средств механизации и автоматизации применяемых при проектировании технологических документов и решении инженернотехнических задач; установление единых требований и правил по оформлению...
21132. ЭТАПЫ РАЗРАБОТКИ ЭВМ И СИСТЕМ 694 KB
  Конструкция современной ЭВМ комплекс различных по природе деталей определенным образом объединенных электрически и механически друг с другом и призванных выполнять заданные функции в заданных условиях и режимах эксплуатации. Широкое внедрение вычислительной техники во все сферы человеческой деятельности предопределяет необходимость разработки таких ЭВМ которые бы имели широкие возможности применения малую стоимость небольшую длительность этапа разработки и внедрения ее в производство максимальную технологичность и т....
21133. ОБЕСПЕЧЕНИЕ ЗАЩИТЫ ЭВА ОТ ВНЕШНИХ И ПАРАЗИТНЫХ ВОЗДЕЙСТВИЙ 2.78 MB
  Понятие жесткости и механической прочности конструкции При разработке конструкции ЭВМ необходимо обеспечить требуемую жесткость и механическую прочность ее элементов. Герметизация отдельных элементов узлов устройств или всей машины При этом способе защиты в зависимости от степени чувствительности тех или иных элементов или узлов к воздействию агрессивной среды и от их конструктивных особенностей применяют различные способы герметизации отличающиеся как методом исполнения так и сложностью и стоимостью. Вакуумноплотная герметизация может...
21134. ОСНОВНЫЕ ЭТАПЫ ПРОИЗВОДСТВА ПЕЧАТНЫХ ПЛАТ 2.37 MB
  1 Изготовление фотошаблонов печатной платы Изготовление печатной платы начинается с изготовления фотошаблон рисунка.2 Получение заготовок печатной платы К заготовительным технологическим операциям изготовления ПП относят следующие операции: раскрой материала; получение заготовок ПП; получение базовых и технологических отверстий.4 Подготовка поверхности печатной платы Эта технологическая операция осуществляется со следующими целями: удаления заусенцев частиц смолы механической пыли и частиц из отверстий после сверления; получение...
21135. 11 СПОСОБОВ УБИТЬ СИСТЕМУ ИЛИ ЧЕГО НЕ СЛЕДУЕТ ДЕЛАТЬ ВО ИЗБЕЖАНИЕ НЕПРИЯТНОСТЕЙ С ПК 85 KB
  Не так давно сотрудники сайта PCstats Newsletter задали своим читателям вопрос: Вы когданибудь сталкивались с неожиданной как Вам казалось и к сожалению фатальной поломкой системы В ответ они получили массу историй проанализировав которые они пришли к следующим выводам: Наиболее часто причиной фатальной поломки становятся: Блоки питания 26 Бракованные компоненты и пренебрежение вопросами совместимости со стороны пользователя 23 Неправильная сборка 15 Компоненты отвечающие за нормальное охлаждение системы 13...