2505

Статистическая проверка параметрических гипотез

Лекция

Социология, социальная работа и статистика

Понятие о гипотезе. Виды гипотез. Ошибки первого и второго рода. Статистический критерий проверки нулевой гипотезы. Отыскание критической области. Сравнение двух дисперсий нормальных генеральных совокупностей. Проверка гипотез равенства математических ожиданий двух случайных величин.

Русский

2013-01-06

97.31 KB

51 чел.

Лекция Статистическая проверка параметрических гипотез.

§1. Основные сведения.

 П.1 Понятие о гипотезе. Виды гипотез. Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид (назовем его ), выдвигают гипотезу: генеральная совокупность распределена по закону . Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.

 Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , выдвигают гипотезу: . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.

Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, или о параметрах известных распределений.

 Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.

Статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида функции распределения.

Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения известного вида.

 Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая ей гипотеза. По этой причине эти гипотезы целесообразно различать.

 Нулевой (основной) называют выдвинутую гипотезу .

 Обычно нулевые гипотезы утверждают, что различие между сравниваемыми величинами (параметрами или функциями распределения) отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями выборки.

 Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой.

 Например, если нулевая гипотеза состоит в предположении, что математическое ожидание нормального распределения равно 10 , то конкурирующая гипотеза, в частности, может состоять в предположении, что . Коротко это записывают так: ; .

Различают гипотезы, которые содержат одно и более одного предположения.

 Простой называют гипотезу, содержащую только одно предположение.

 Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

 П.2. Ошибки первого и второго рода.

 Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. В итоге статистической проверки гипотезы могут быть допущены ошибки двух родов.

 Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через . Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).

 Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через .

§2. Статистический критерий проверки нулевой гипотезы.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. В целях общности обозначим эту величину через .

 Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки нулевой гипотезы.

 Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.

 Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.

 После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.

 Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

 Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

 Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

 Поскольку критерий К – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

 Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.

 Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

 Правосторонней называют критическую область, определяемую неравенством К > kкр , где kкр – положительное число.

 Левосторонней называют критическую область, определяемую неравенством К < kкр , где kкр – отрицательное число.

 Двусторонней называют критическую область, определяемую неравенством К < k1 , К > k2 ,где k2>k1 . В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр>0): К < – kкр , К > kкр , или равносильным неравенством  kкр.

§3. Отыскание критической области.

Для отыскания критической области задаются уровнем значимости и ищут критические точки kкр, исходя из следующих соотношений:

 1) для правосторонней критической области вероятность того, что критерий примет значение, большее kкр, должна быть равна принятому уровню значимости:

  kкр)=, (kкр>0);

2) для левосторонней критической области: кр)=, (kкр<0);

3) для двусторонней симметричной области:  kкр)=, (kкр>0);

 кр)=.

 Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что набл > kкр , то нулевую гипотезу отвергают; если же набл < kкр , то нет оснований, чтобы отвергнуть нулевую гипотезу.

 Мощностью критерия называют вероятность попадания в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

§4. Сравнение двух дисперсий нормальных генеральных совокупностей.

На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.е. наименьшую дисперсию.

Пусть две генеральные совокупности распределены нормально. По независимым выборкам с объемами, равными и , извлеченными из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: .

Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, т.е. , , нулевую гипотезу можно записать так: .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны.

 В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий принимается отношение большей исправленной дисперсии к меньшей, которое обозначается: набл=sБ2/sМ2.

 Критическая область строится в зависимости от вида конкурирующей гипотезы. Пусть нулевая гипотеза имеет вид: . Если конкурирующая гипотеза: , то строят правостороннюю критическую область; если конкурирующая гипотеза: , то строят двустороннюю критическую область.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу  о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл и по таблице критических точек распределения Фишера–Снедекора, по заданному уровню значимости и числам степеней свободы , (– число степеней свободы большей исправленной дисперсии, – меньшей) найти критическую точку кр. Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе  критическую точку кр ищут по уровню значимости (вдвое меньше заданного) и числам степеней свободы и . Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Пример 1. Двумя методами произведены измерения одной и той же физической величины. Первым методом эта величина измерялась 10 раз, вторым – 8 раз. Получены следующие результаты: и . Можно ли считать, что оба метода обеспечивают одинаковую точность? Уровень значимости принять . Предполагается, что результаты измерений распределены нормально и выборки независимы.

 Решение. Из условия следует, что необходимо проверить нулевую гипотезу (оба метода обеспечивают одинаковую точность) против альтернативной (второй метод измерений обеспечивает более высокую точность).

Вычислим наблюдаемые значения - критерия: набл=0,00084 / 0,00041=2,05.

 По таблице квантилей - распределения по уровню значимости и числу степеней свободы и находим критическую точку кр. Так как набл=2,05, то нет оснований для отклонения нулевой гипотезы. Другими словами, имеющаяся информация о точности этих методов не дает основания считать, что второй метод измерения лучше первого.

§5. Сравнение двух средних генеральных совокупностей, дисперсии которых известны.

На практике при обработке результатов эксперимента, описываемого СВ , нередко возникает необходимость в решении задач «сравнения». Например, часто приходится сравнивать новый и старый технологические методы изготовления некоторых изделий; успеваемость в двух группах, применяющих различные методы обучения и т.д. В большинстве случаев распределение СВ предполагается нормальным, а изменения в «технологиях» сказывается на изменении математических ожиданий моделируемой нормальной совокупности. Таким образом, большинство задач сравнения сводится к проверке гипотез относительно математических ожиданий двух случайных величин, имеющих нормальное распределение.

Проверка гипотез равенства математических ожиданий двух случайных величин (большие независимые выборки).

Обозначим через и объемы больших () независимых выборок, по которым найдены соответствующие выборочные средние и . Генеральные дисперсии и известны.

Требуется по выборочным средним и при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой , т.е. : .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные средние одинаковы, то различие выборочных средних незначимо и объясняется случайными причинами и, в частности, случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные средние неодинаковы, то различие выборочных средних значимо и не может быть объяснено случайными причинами, а объясняется тем, что сами генеральные средние (математические ожидания) различны.

В качестве критерия проверки нулевой гипотезы принимается случайная величина: .   (1)

Значение критерия, вычисленное по данным наблюдений, обозначается через набл .

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости  проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных генеральных совокупностей с известными дисперсиями при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл  (21.2)

и по таблице функции Лапласа (приложение №2) найти критическую точку кр из равенства Ф(кр)=.

Если |набл |< кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл |> кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку кр по таблице функции Лапласа из равенства

Ф(кр)=.

Если набл < кр – нет оснований отвергнуть нулевую гипотезу.

Если набл > кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят критическую точку кр по правилу 2.

Если набл > –кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < – кр – нулевую гипотезу отвергают.

 Пример 2. По двум независимым выборкам, объемы которых соответственно равны и , извлеченным из нормальных генеральных совокупностей, найдены выборочные средние и . Генеральные дисперсии известны: (), (). При уровне значимости 0,01 проверить нулевую гипотезу при конкурирующей гипотезе .

 Решение. Найдем наблюдаемое значение критерия:

 набл.

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область – двусторонняя.

Найдем правую критическую точку: Ф(кр)=.

По таблице функции Лапласа находим кр=2,58. Так как |набл |> кр – нулевую гипотезу отвергаем. Другими словами, выборочные средние различаются значимо.

 

 

 

§6. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).

Пусть генеральные совокупности и распределены нормально, причем их дисперсии неизвестны. При этом условии по выборкам малого объема нельзя получить хорошие оценки генеральных дисперсий. По этой причине метод сравнения средних, изложенный в § 5, применить нельзя.

Однако если предположить, что неизвестные генеральные дисперсии равны между собой, то можно построить критерий (Стьюдента) сравнения средних. Если же нет оснований считать дисперсии одинаковыми, прежде чем сравнивать средние, следует, пользуясь критерием Фишера – Снедекора (§ 4), предварительно проверить гипотезу о равенстве генеральных дисперсий.

Таким образом, требуется проверить нулевую гипотезу  (или ), т.е. требуется установить, значимо или незначимо различаются выборочные средние и , найденные по независимым малым выборкам объемов и .

В качестве критерия проверки нулевой гипотезы примем случайную величину

  . (3)

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных совокупностей с неизвестными, но одинаковыми дисперсиями (в случае малых независимых выборок) при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия

 набл (4)

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости , помещенному в верхней строке таблицы приложения 6, и числу степеней свободы найти критическую точку двуст.кр.

Если |набл|<двуст.кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл|>двуст.кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку правост.кр по таблице приложения 6 по уровню значимости , помещенному в нижней строке таблицы, и числу степеней свободы .

 Если набл <правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл >правост.кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят сначала критическую точку правост.кр по правилу 2 и полагают левост.кр= –правост.кр.

Если набл > –правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < –правост.кр – нулевую гипотезу отвергают.


 

А также другие работы, которые могут Вас заинтересовать

5779. Університетська освіта в контексті Болонського процесу 55 KB
  Університетська освіта в контексті Болонського процесу. Поняття вища освіта. Мета, задачі, структура, типи вищих навчальних закладів України. Закон України Про вищу освіту від 17.01.2002 р. спрямований на врегулювання суспільних відносин у галу...
5780. Макроекономіка як наука 183.5 KB
  Макроекономіка як наука Анотація Економіка як об'єкт вивчення економічних наук. Рівневий підхід до вивчення економіки. Предмет макроекономічної теорії. Суб'єкти макроекономіки. Макроринки та їх класифікація. Проблема обмеженості ресурсів і...
5781. Аналіз сировини в кондитерській промисловості 205.5 KB
  Характеристика сировини, що використовується у кондитерському виробництві. Правила її зберігання та підготовка до виробництва. Органолептична оцінка якості: борошна, цукру-піску, цукрової пудри, патоки, яєць, меланжу, яєчного поро...
5782. Поняття регіону. Галузева та функціональна структури регіону 142 KB
  Поняття регіону, територіального та регіонального управління Структура регіону. Галузева та функціональна структури регіону Соціальна інфраструктура регіону Поняття регіону, територіального та регіонального управління Термін...
5783. Статья. О структурном синтезе передаточных механизмов 820 KB
  О структурном синтезе передаточных механизмов Настоящая статья является продолжением работы. Рассматривается метод образования структуры пространственных передаточных механизмов с использованием схем плоских механизмов. Метод основан на построен...
5784. Определение жесткости токарного станка производственным методом 546.5 KB
  Определение жесткости токарного станка производственным методом Цель работы Ознакомиться с производственным методом определения жесткости. Определить суммарную жесткость передней бабки и суппорта, задней бабки и суппорта, построить диаграмму...
5785. Расчет ленточного конвейера и цилиндрического косозубого редуктора 3.47 MB
  Создание машин, отвечающих потребностям народного хозяйства, должно предусматривать их наибольший экономический эффект и высокие тактико-технические и эксплуатационные показатели. Основные требования, предъявляемые к создаваемой машине: выс...
5786. Расчет механической частоты вращения электродвигателя 748.5 KB
  Ведение Электрический привод (ЭП) представляет собой электромеханическую систему, обеспечивающую реализацию различных технологических и производственных процессов в промышленности, сельском хозяйстве, на транспорте, коммунальном хозяйстве и в быту с...
5787. Действительный одноступенчатый поршневой компрессор 1015 KB
  Действительный одноступенчатый поршневой компрессор Цель: Изучить процессы, протекающие в действительном поршневом компрессоре, и их влияние на основные технические характеристики, такие как производительность, работа, мощность, температурный режим,...