2505

Статистическая проверка параметрических гипотез

Лекция

Социология, социальная работа и статистика

Понятие о гипотезе. Виды гипотез. Ошибки первого и второго рода. Статистический критерий проверки нулевой гипотезы. Отыскание критической области. Сравнение двух дисперсий нормальных генеральных совокупностей. Проверка гипотез равенства математических ожиданий двух случайных величин.

Русский

2013-01-06

97.31 KB

51 чел.

Лекция Статистическая проверка параметрических гипотез.

§1. Основные сведения.

 П.1 Понятие о гипотезе. Виды гипотез. Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид (назовем его ), выдвигают гипотезу: генеральная совокупность распределена по закону . Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.

 Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , выдвигают гипотезу: . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.

Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, или о параметрах известных распределений.

 Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.

Статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида функции распределения.

Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения известного вида.

 Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая ей гипотеза. По этой причине эти гипотезы целесообразно различать.

 Нулевой (основной) называют выдвинутую гипотезу .

 Обычно нулевые гипотезы утверждают, что различие между сравниваемыми величинами (параметрами или функциями распределения) отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями выборки.

 Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой.

 Например, если нулевая гипотеза состоит в предположении, что математическое ожидание нормального распределения равно 10 , то конкурирующая гипотеза, в частности, может состоять в предположении, что . Коротко это записывают так: ; .

Различают гипотезы, которые содержат одно и более одного предположения.

 Простой называют гипотезу, содержащую только одно предположение.

 Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

 П.2. Ошибки первого и второго рода.

 Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. В итоге статистической проверки гипотезы могут быть допущены ошибки двух родов.

 Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через . Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).

 Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через .

§2. Статистический критерий проверки нулевой гипотезы.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. В целях общности обозначим эту величину через .

 Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки нулевой гипотезы.

 Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.

 Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.

 После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.

 Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

 Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

 Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

 Поскольку критерий К – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

 Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.

 Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

 Правосторонней называют критическую область, определяемую неравенством К > kкр , где kкр – положительное число.

 Левосторонней называют критическую область, определяемую неравенством К < kкр , где kкр – отрицательное число.

 Двусторонней называют критическую область, определяемую неравенством К < k1 , К > k2 ,где k2>k1 . В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр>0): К < – kкр , К > kкр , или равносильным неравенством  kкр.

§3. Отыскание критической области.

Для отыскания критической области задаются уровнем значимости и ищут критические точки kкр, исходя из следующих соотношений:

 1) для правосторонней критической области вероятность того, что критерий примет значение, большее kкр, должна быть равна принятому уровню значимости:

  kкр)=, (kкр>0);

2) для левосторонней критической области: кр)=, (kкр<0);

3) для двусторонней симметричной области:  kкр)=, (kкр>0);

 кр)=.

 Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что набл > kкр , то нулевую гипотезу отвергают; если же набл < kкр , то нет оснований, чтобы отвергнуть нулевую гипотезу.

 Мощностью критерия называют вероятность попадания в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

§4. Сравнение двух дисперсий нормальных генеральных совокупностей.

На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.е. наименьшую дисперсию.

Пусть две генеральные совокупности распределены нормально. По независимым выборкам с объемами, равными и , извлеченными из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: .

Учитывая, что исправленные дисперсии являются несмещенными оценками генеральных дисперсий, т.е. , , нулевую гипотезу можно записать так: .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий незначимо и объясняется случайными причинами, в частности случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные дисперсии одинаковы, то различие исправленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны.

 В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий принимается отношение большей исправленной дисперсии к меньшей, которое обозначается: набл=sБ2/sМ2.

 Критическая область строится в зависимости от вида конкурирующей гипотезы. Пусть нулевая гипотеза имеет вид: . Если конкурирующая гипотеза: , то строят правостороннюю критическую область; если конкурирующая гипотеза: , то строят двустороннюю критическую область.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу  о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл и по таблице критических точек распределения Фишера–Снедекора, по заданному уровню значимости и числам степеней свободы , (– число степеней свободы большей исправленной дисперсии, – меньшей) найти критическую точку кр. Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе  критическую точку кр ищут по уровню значимости (вдвое меньше заданного) и числам степеней свободы и . Если набл <кр – нет оснований отвергнуть нулевую гипотезу. Если набл>кр – нулевую гипотезу отвергают.

 Пример 1. Двумя методами произведены измерения одной и той же физической величины. Первым методом эта величина измерялась 10 раз, вторым – 8 раз. Получены следующие результаты: и . Можно ли считать, что оба метода обеспечивают одинаковую точность? Уровень значимости принять . Предполагается, что результаты измерений распределены нормально и выборки независимы.

 Решение. Из условия следует, что необходимо проверить нулевую гипотезу (оба метода обеспечивают одинаковую точность) против альтернативной (второй метод измерений обеспечивает более высокую точность).

Вычислим наблюдаемые значения - критерия: набл=0,00084 / 0,00041=2,05.

 По таблице квантилей - распределения по уровню значимости и числу степеней свободы и находим критическую точку кр. Так как набл=2,05, то нет оснований для отклонения нулевой гипотезы. Другими словами, имеющаяся информация о точности этих методов не дает основания считать, что второй метод измерения лучше первого.

§5. Сравнение двух средних генеральных совокупностей, дисперсии которых известны.

На практике при обработке результатов эксперимента, описываемого СВ , нередко возникает необходимость в решении задач «сравнения». Например, часто приходится сравнивать новый и старый технологические методы изготовления некоторых изделий; успеваемость в двух группах, применяющих различные методы обучения и т.д. В большинстве случаев распределение СВ предполагается нормальным, а изменения в «технологиях» сказывается на изменении математических ожиданий моделируемой нормальной совокупности. Таким образом, большинство задач сравнения сводится к проверке гипотез относительно математических ожиданий двух случайных величин, имеющих нормальное распределение.

Проверка гипотез равенства математических ожиданий двух случайных величин (большие независимые выборки).

Обозначим через и объемы больших () независимых выборок, по которым найдены соответствующие выборочные средние и . Генеральные дисперсии и известны.

Требуется по выборочным средним и при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой , т.е. : .

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные средние одинаковы, то различие выборочных средних незначимо и объясняется случайными причинами и, в частности, случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные средние неодинаковы, то различие выборочных средних значимо и не может быть объяснено случайными причинами, а объясняется тем, что сами генеральные средние (математические ожидания) различны.

В качестве критерия проверки нулевой гипотезы принимается случайная величина: .   (1)

Значение критерия, вычисленное по данным наблюдений, обозначается через набл .

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости  проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных генеральных совокупностей с известными дисперсиями при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия набл  (21.2)

и по таблице функции Лапласа (приложение №2) найти критическую точку кр из равенства Ф(кр)=.

Если |набл |< кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл |> кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку кр по таблице функции Лапласа из равенства

Ф(кр)=.

Если набл < кр – нет оснований отвергнуть нулевую гипотезу.

Если набл > кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят критическую точку кр по правилу 2.

Если набл > –кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < – кр – нулевую гипотезу отвергают.

 Пример 2. По двум независимым выборкам, объемы которых соответственно равны и , извлеченным из нормальных генеральных совокупностей, найдены выборочные средние и . Генеральные дисперсии известны: (), (). При уровне значимости 0,01 проверить нулевую гипотезу при конкурирующей гипотезе .

 Решение. Найдем наблюдаемое значение критерия:

 набл.

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область – двусторонняя.

Найдем правую критическую точку: Ф(кр)=.

По таблице функции Лапласа находим кр=2,58. Так как |набл |> кр – нулевую гипотезу отвергаем. Другими словами, выборочные средние различаются значимо.

 

 

 

§6. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).

Пусть генеральные совокупности и распределены нормально, причем их дисперсии неизвестны. При этом условии по выборкам малого объема нельзя получить хорошие оценки генеральных дисперсий. По этой причине метод сравнения средних, изложенный в § 5, применить нельзя.

Однако если предположить, что неизвестные генеральные дисперсии равны между собой, то можно построить критерий (Стьюдента) сравнения средних. Если же нет оснований считать дисперсии одинаковыми, прежде чем сравнивать средние, следует, пользуясь критерием Фишера – Снедекора (§ 4), предварительно проверить гипотезу о равенстве генеральных дисперсий.

Таким образом, требуется проверить нулевую гипотезу  (или ), т.е. требуется установить, значимо или незначимо различаются выборочные средние и , найденные по независимым малым выборкам объемов и .

В качестве критерия проверки нулевой гипотезы примем случайную величину

  . (3)

Сформулируем правила проверки нулевой гипотезы.

 Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу о равенстве математических ожиданий (генеральных средних) двух нормальных совокупностей с неизвестными, но одинаковыми дисперсиями (в случае малых независимых выборок) при конкурирующей гипотезе , надо вычислить наблюдаемое значение критерия

 набл (4)

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости , помещенному в верхней строке таблицы приложения 6, и числу степеней свободы найти критическую точку двуст.кр.

Если |набл|<двуст.кр – нет оснований отвергнуть нулевую гипотезу.

Если |набл|>двуст.кр – нулевую гипотезу отвергают.

 Правило 2. При конкурирующей гипотезе находят критическую точку правост.кр по таблице приложения 6 по уровню значимости , помещенному в нижней строке таблицы, и числу степеней свободы .

 Если набл <правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл >правост.кр – нулевую гипотезу отвергают.

 Правило 3. При конкурирующей гипотезе находят сначала критическую точку правост.кр по правилу 2 и полагают левост.кр= –правост.кр.

Если набл > –правост.кр – нет оснований отвергнуть нулевую гипотезу.

Если набл < –правост.кр – нулевую гипотезу отвергают.


 

А также другие работы, которые могут Вас заинтересовать

77748. ИССЛЕДОВАНИЯ И ИХ РОЛЬ В НАУЧНОЙ И ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА 49.5 KB
  Исследования как бы проникают в повседневную практику. Исследования это задача только научных работников. Исследования позволяют увидеть: где находятся резервы; что мешает развитию; чего надо опасаться; что надо поддерживать и т.
77749. МЕНЕДЖЕР ИССЛЕДОВАТЕЛЬСКОГО ТИПА 31.5 KB
  Проблемное видение мира способность распознавать проблемы там где для других все ясно. Экспрезентность способность делать верные и удачные заключения при дефиците информации. Способность к имитации функций различных членов коллектива. Инновационность и безынерционность мышления способность выйти за границы формального привычного проверенного традиционного.
77750. РОЛЬ МЕТОДОЛОГИИ В ИССЛЕДОВАНИИ СИСТЕМ УПРАВЛЕНИЯ 64 KB
  Методология это логическая организация деятельности человека состоящая в определении цели и предмета исследования подходов и ориентиров в его проведении выборе средств и методов определяющих наилучший результат. Цель исследования заключается в поиске наиболее эффективных вариантов построения системы управления и организации ее функционирования и развития. На практике проведение исследования преследует разные цели например: мониторинг качества управления формирование атмосферы творчества и инноваций в...
77751. ПРАКТИЧЕСКАЯ ФОРМУЛА ДИАЛЕКТИЧЕСКОГО ПОДХОДА К ИССЛЕДОВАНИЮ УПРАВЛЕНИЯ 31.5 KB
  Подходы к исследованию: Механистический подход признающий только причинноследственные связи явлений; Метафизический подход который отдает приоритет связям движения но движения в виде превращения одного движения в другое с последующим возвращением к исходному; Организмический подход акцентирующий те связи которые действуют в живых организмах это главным образом связи функциональные; Диалектический подход основанный на связях рождаемых противоречием. Аспектный подход. Многоаспектный подход.
77752. ОБЩЕНАУЧНЫЕ МЕТОДЫ В ИССЛЕДОВАНИИ СИСТЕМ УПРАВЛЕНИЯ 81.5 KB
  Но успех исследования в значительной мере зависит от того каким образом по каким критериям мы выбираем методы для проведения конкретного исследования и в какой комбинации мы используем эти методы. Всю совокупность методов исследования можно разделить на две группы: Эмпирические методы построены на осмыслении практической деятельности сути и особенностей событий и ситуаций. Методы наблюдений исследования с минимальным вмешательством в исследуемые события и ситуации.
77753. СИСТЕМНЫЙ ПОДХОД В ИСУ 36.5 KB
  Система управления совокупность звеньев и связей между ними осуществляющих управление. Звенья системы управления выделяются: по специфике объему и масштабу полномочий трудоемкости работы равномерности распределения нагрузки квалификационным требованиям к персоналу информационному обеспечению возможностям территориального размещения сотрудников. Звенья составляющие систему управления отличаются главным образом комбинацией функций и полномочий управления. Звенья системы управления...
77754. СПЕЦИФИЧЕСКИЕ МЕТОДЫ ИСУ 56.5 KB
  Наиболее важными из них являются методы: исследования документов эксперимент социологические исследования тестирование коллективный анализ социометрические оценки деловые и инновационные игры имитационное моделирование. Одним из критериев выбора методов исследования является степень определенности ситуации или проблемы. Эффективность исследования по документам зависит от: состава документов их содержания формы информационной классификации.
77755. ДИВЕРСИФИЦИРОВАННЫЕ МЕТОДЫ ИСУ 82 KB
  Наблюдаются ли процессы диверсификации в области исследования? В чем они проявляются? Почему возникает потребность в диверсифицированных методах исследования? Что собой представляют диверсифицированные методы исследования? Что дают диверсифицированные методы, в чем их сильные и слабые стороны?
77756. МЕТОД СИНЕКТИКИ В ИСУ 79.5 KB
  Как мобилизовать и мотивировать творческий потенциал исследователя? Какую роль формирование группы играет в мобилизации творчества исследователя? Как социально-психологические факторы совместной деятельности исследователей влияют на результат?