2505

Статистическая проверка параметрических гипотез

Лекция

Социология, социальная работа и статистика

Понятие о гипотезе. Виды гипотез. Ошибки первого и второго рода. Статистический критерий проверки нулевой гипотезы. Отыскание критической области. Сравнение двух дисперсий нормальных генеральных совокупностей. Проверка гипотез равенства математических ожиданий двух случайных величин.

Русский

2013-01-06

97.31 KB

51 чел.

Лекция Статистическая проверка параметрических гипотез.

§1. Основные сведения.

 П.1 Понятие о гипотезе. Виды гипотез. Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид (назовем его ), выдвигают гипотезу: генеральная совокупность распределена по закону . Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.

 Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , выдвигают гипотезу: . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.

Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, или о параметрах известных распределений.

 Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.

Статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида функции распределения.

Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения известного вида.

 Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая ей гипотеза. По этой причине эти гипотезы целесообразно различать.

 Нулевой (основной) называют выдвинутую гипотезу .

 Обычно нулевые гипотезы утверждают, что различие между сравниваемыми величинами (параметрами или функциями распределения) отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями выборки.

 Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой.

 Например, если нулевая гипотеза состоит в предположении, что математическое ожидание нормального распределения равно 10 , то конкурирующая гипотеза, в частности, может состоять в предположении, что . Коротко это записывают так: ; .

Различают гипотезы, которые содержат одно и более одного предположения.

 Простой называют гипотезу, содержащую только одно предположение.

 Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

 П.2. Ошибки первого и второго рода.

 Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. В итоге статистической проверки гипотезы могут быть допущены ошибки двух родов.

 Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через . Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).

 Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через .

§2. Статистический критерий проверки нулевой гипотезы.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. В целях общности обозначим эту величину через .

 Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки нулевой гипотезы.

 Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.

 Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.

 После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.

 Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

 Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

 Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

 Поскольку критерий К – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

 Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.

 Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

 Правосторонней называют критическую область, определяемую неравенством К > kкр , где kкр – положительное число.

 Левосторонней называют критическую область, определяемую неравенством К < kкр , где kкр – отрицательное число.

 Двусторонней называют критическую область, определяемую неравенством К < k1 , К > k2 ,где k2>k1 . В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр>0): К < – kкр , К > kкр , или равносильным неравенством  kкр.

§3. Отыскание критической области.

Для отыскания критической области задаются уровнем значимости и ищут критические точки kкр, исходя из следующих соотношений:

 1) для правосторонней критической области вероятность того, что критерий примет значение, большее kкр, должна быть равна принятому уровню значимости:

  kкр)=, (kкр>0);

2) для левосторонней критической области: кр)=, (kкр<0);

3) для двусторонней симметричной области:  kкр)=, (kкр>0);

 кр)=.

 Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что набл > kкр , то нулевую гипотезу отвергают; если же набл < kкр , то нет оснований, чтобы отвергнуть нулевую гипотезу.

 Мощностью критерия называют вероятность попадания в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

§4. Сравнение двух дисперсий нормальных генеральных совокупностей.

На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.е. наименьшую дисперсию.

Пусть две генеральные совокупности распределены нормально. По независимым выборкам с объемами, равными и , извлеченными из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: .

Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, т.е. , , нулевую гипотезу можно записать так: .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны.

 В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий принимается отношение большей исправленной дисперсии к меньшей, которое обозначается: набл=sБ2/sМ2.

 Критическая область строится в зависимости от вида конкурирующей гипотезы. Пусть нулевая гипотеза имеет вид: . Если конкурирующая гипотеза: , то строят правостороннюю критическую область; если конкурирующая гипотеза: , то строят двустороннюю критическую область.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу  о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл и по таблице критических точек распределения Фишера–Снедекора, по заданному уровню значимости и числам степеней свободы , (– число степеней свободы большей исправленной дисперсии, – меньшей) найти критическую точку кр. Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе  критическую точку кр ищут по уровню значимости (вдвое меньше заданного) и числам степеней свободы и . Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Пример 1. Двумя методами произведены измерения одной и той же физической величины. Первым методом эта величина измерялась 10 раз, вторым – 8 раз. Получены следующие результаты: и . Можно ли считать, что оба метода обеспечивают одинаковую точность? Уровень значимости принять . Предполагается, что результаты измерений распределены нормально и выборки независимы.

 Решение. Из условия следует, что необходимо проверить нулевую гипотезу (оба метода обеспечивают одинаковую точность) против альтернативной (второй метод измерений обеспечивает более высокую точность).

Вычислим наблюдаемые значения - критерия: набл=0,00084 / 0,00041=2,05.

 По таблице квантилей - распределения по уровню значимости и числу степеней свободы и находим критическую точку кр. Так как набл=2,05, то нет оснований для отклонения нулевой гипотезы. Другими словами, имеющаяся информация о точности этих методов не дает основания считать, что второй метод измерения лучше первого.

§5. Сравнение двух средних генеральных совокупностей, дисперсии которых известны.

На практике при обработке результатов эксперимента, описываемого СВ , нередко возникает необходимость в решении задач «сравнения». Например, часто приходится сравнивать новый и старый технологические методы изготовления некоторых изделий; успеваемость в двух группах, применяющих различные методы обучения и т.д. В большинстве случаев распределение СВ предполагается нормальным, а изменения в «технологиях» сказывается на изменении математических ожиданий моделируемой нормальной совокупности. Таким образом, большинство задач сравнения сводится к проверке гипотез относительно математических ожиданий двух случайных величин, имеющих нормальное распределение.

Проверка гипотез равенства математических ожиданий двух случайных величин (большие независимые выборки).

Обозначим через и объемы больших () независимых выборок, по которым найдены соответствующие выборочные средние и . Генеральные дисперсии и известны.

Требуется по выборочным средним и при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой , т.е. : .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные средние одинаковы, то различие выборочных средних незначимо и объясняется случайными причинами и, в частности, случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные средние неодинаковы, то различие выборочных средних значимо и не может быть объяснено случайными причинами, а объясняется тем, что сами генеральные средние (математические ожидания) различны.

В качестве критерия проверки нулевой гипотезы принимается случайная величина: .   (1)

Значение критерия, вычисленное по данным наблюдений, обозначается через набл .

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости  проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных генеральных совокупностей с известными дисперсиями при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл  (21.2)

и по таблице функции Лапласа (приложение №2) найти критическую точку кр из равенства Ф(кр)=.

Если |набл |< кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл |> кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку кр по таблице функции Лапласа из равенства

Ф(кр)=.

Если набл < кр – нет оснований отвергнуть нулевую гипотезу.

Если набл > кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят критическую точку кр по правилу 2.

Если набл > –кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < – кр – нулевую гипотезу отвергают.

 Пример 2. По двум независимым выборкам, объемы которых соответственно равны и , извлеченным из нормальных генеральных совокупностей, найдены выборочные средние и . Генеральные дисперсии известны: (), (). При уровне значимости 0,01 проверить нулевую гипотезу при конкурирующей гипотезе .

 Решение. Найдем наблюдаемое значение критерия:

 набл.

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область – двусторонняя.

Найдем правую критическую точку: Ф(кр)=.

По таблице функции Лапласа находим кр=2,58. Так как |набл |> кр – нулевую гипотезу отвергаем. Другими словами, выборочные средние различаются значимо.

 

 

 

§6. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).

Пусть генеральные совокупности и распределены нормально, причем их дисперсии неизвестны. При этом условии по выборкам малого объема нельзя получить хорошие оценки генеральных дисперсий. По этой причине метод сравнения средних, изложенный в § 5, применить нельзя.

Однако если предположить, что неизвестные генеральные дисперсии равны между собой, то можно построить критерий (Стьюдента) сравнения средних. Если же нет оснований считать дисперсии одинаковыми, прежде чем сравнивать средние, следует, пользуясь критерием Фишера – Снедекора (§ 4), предварительно проверить гипотезу о равенстве генеральных дисперсий.

Таким образом, требуется проверить нулевую гипотезу  (или ), т.е. требуется установить, значимо или незначимо различаются выборочные средние и , найденные по независимым малым выборкам объемов и .

В качестве критерия проверки нулевой гипотезы примем случайную величину

  . (3)

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных совокупностей с неизвестными, но одинаковыми дисперсиями (в случае малых независимых выборок) при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия

 набл (4)

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости , помещенному в верхней строке таблицы приложения 6, и числу степеней свободы найти критическую точку двуст.кр.

Если |набл|<двуст.кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл|>двуст.кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку правост.кр по таблице приложения 6 по уровню значимости , помещенному в нижней строке таблицы, и числу степеней свободы .

 Если набл <правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл >правост.кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят сначала критическую точку правост.кр по правилу 2 и полагают левост.кр= –правост.кр.

Если набл > –правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < –правост.кр – нулевую гипотезу отвергают.


 

А также другие работы, которые могут Вас заинтересовать

85168. Особенности конфессиональных отношений на территории Беларуси в составе Речи Посполитой. Реформация и контрреформация. Берестейская уния 30.78 KB
  В разных странах Европы возникает движение против господства католической церкви – РеформацияОбщественнополитическое и идеологическое движение направленное против римскокатолической церкви и её роли в политической системе общества. Результат Контрреформации: усиливается экономическое могущество и политическое влияние католической церкви. В рамках Контрреформации проводилось объединение православной и католической церкви. Она объединила православную и католическую церкви в единую Грекоуниатскую церковь.
85169. Политический кризис и разделы Речи Посполитой. Включение белорусских земель в состав Российской империи 29.27 KB
  При поддержке России победу одержал Станислав Август Понятовский. 1ый раздел произошёл в 1772 К России отошли восточная часть Белоруссии по Западной Двине и Верхнему Днепру 1788г. 2ой раздел 23 января 1793 К России отошли Центральная Белоруссия с Минском Правобережная Украина часть шляхта приняло участие в восстании под руководством Костюшко – попытка сохранить независимость РП. 3ий раздел 24 октября 1795 К России отошли Литва Западная Белоруссия Волынь Курляндия; Поляки утратили свою государственность.
85170. Культура и этническая структура белорусских земель в составе Речи Посполитой 28.63 KB
  традиции эпохи Просвещения стали оказывать существенное влияние на повседневную жизнь белорусского общества это было связано с переменами в системе образования расширено преподавания современных языков и естествознания. Влияние эпохи Просвещения ощущалось и в театральной жизни страны. Барокко и рококо под влиянием Просвещения стали постепенно уступать место классицизму основанному на традициях античности и Ренессанса.
85171. Политика российского самодержавия и общественно-политические движения в Беларуси (конец XVIII - первая половина XIX в.) 33.21 KB
  После присоединения Беларуси к РИ правительство провело ряд мер по закреплению своего влияния на присоединённые земли. В Беларуси были созданы губернии: Белорусская Минская и Литовская. Господствующее положение в Беларуси заняла православная церковь у которой оказывалась полная государственная поддержка.
85172. Социально-экономическое развитие белорусских земель в условиях кризиса феодально-крепостнической системы (первая половина XIX в.) 28.12 KB
  В условиях разложения феодальнокрепостнической системы царское правительство пошло на экономические реформы с целью приспособления существующей системы хозяйственных отношений к нуждам рынка а также повышения государственных доходов. Реформа была проведена только среди государственных крестьян. Она предусматривала: проведение подробного описания всех государственных имений и строгое определение повинностей государственных крестьян в зависимости от их хозяйственного положения прекращение сдачи государственных земель в аренду; ликвидацию...
85173. Культура Беларуси в первой половине XIX в.) 27.14 KB
  Беларусь имела автономия в плане культурного развития. Отчётливо это проявилось в системе образования. 1803г – создан Виленский учебный округ, в состав кот входили школы Беларуси, Литвы, Украины.
85174. Буржуазные реформы 1860-1880 гг. в Российской империи и особенности их проведения в белорусских губерниях 29.45 KB
  Крестьяне получали гражданские права могли заниматься промыслами торговать приобретать имущество поступать на учебу и на службу; помещики не могли продавать и судить крестьян. Однако крестьяне не сразу становились лично свободными. Помещики признавались собственниками всей земли которая принадлежала им до реформы а крестьяне получали небольшие наделы в пользование которые должны были выкупить на протяжении 9 лет. Купить свой земельный надел крестьяне могли только путем заключения выкупной сделки.
85175. Восстание 1863-1864 гг. и его итоги 28.15 KB
  Белые рассчитывали этого путем переговоров с царем с помощью Франции других стран Запада а красные опирались на восстание населения на свои силы.Калиновский который готовил восстание издавал газету Мужицкая правда боролся за свободу народа. Восстание началось зимой 1863 Для руководства восстанием были созданы руководящие органы: Центральный нац.Калиновский возглавил восстание в Гродненской губернии.
85176. Развитие капитализма в Беларуси в 1860 - 1890-е годах 29.42 KB
  Ускорили развитие капиталистических отношений в эк. Сохранилась сельская община чересполосица что сдерживало развитие с х. Быстрое развитие всех форм хозяйствования и в первую очередь укрупнение промышленного прова потребовало создания кредитной системы.