10969

Статистические критерии Что такое критерий значимости?

Лекция

Математика и математический анализ

Статистические критерии Что такое критерий значимости Прежде чем перейти к рассмотрению понятия статистической гипотезы сформулируем так называемый принцип практической уверенности лежащий в основе применения выводов и рекомендаций полученных с помощью теории ...

Русский

2013-04-03

236.79 KB

33 чел.

Статистические критерии

Что такое критерий значимости?

Прежде, чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверенности, лежащий в основе применения выводов и рекомендаций, полученных с помощью теории вероятностей и математической статистики:

Если вероятность события в данном испытании очень мала, то при однократном испытании можно быть уверенным в том, что событие не произойдет, и в практической деятельности вести себя так, как будто, событие вообще невозможно.

Вопрос о том, насколько малой должна быть вероятность события , чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события .

В ряде случаев можно пренебречь событиями, вероятность которых меньше 0.05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т.п. нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0.001.

Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки гипотезы.

Критерии значимости (критерии проверки гипотез, иногда – просто тесты) – это простейшие, но, наиболее широко используемые статистические средства.

Критерий значимости дает возможность статистику найти разумный ответ на вопрос, подобный следующим:

  1.  Сталь, произведенная разными методами, имеет неодинаковые пределы прочности. "Указывает ли это на то, что производимая разными методами сталь имеет различную прочность, или же выявленное различие можно объяснить выборочными флуктуациями?"
  2.  "Превосходит ли по эффективности одно противогриппозное средство другое?"
  3.  "Способствует ли отказ от курения снижению вероятности раковых заболеваний?"
  4.  "Превосходит ли по воздействию одно удобрение другое при выращивании овощей?"

Проверка гипотез

Статистической – называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Рассмотрим простейший вид статистической процедуры, называемой проверкой гипотез.

Пусть дана некоторая оценка , построенная по выборке из независимых наблюдений СВ . Предположим, что есть основания считать истинное значение оцениваемого параметра равным . Однако даже если истинное значение параметра равно , выборочное значение , вероятно, не будет в точности равняться из-за выборочной изменчивости, присущей . Поэтому возникает следующий вопрос. Если предположить, что , то, при каком отклонении от , эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения от по выборочному распределению . Если вероятность такого отличия мала, то отличие следует считать значимым, и гипотеза должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости, и гипотеза может быть принята.

Проиллюстрируем общий подход, предположив, что выборочное значение , являющееся оценкой параметра , имеет плотность вероятности нормального распределения . Теперь, если гипотеза верна, то должна иметь среднее значение (рис. 6.1).

Рис.6.1. Область принятия и отклонения гипотезы (двусторонний критерий)

Вероятность , использованная при испытании гипотез, называется уровнем значимости критерия. 

Вероятность того, что окажется меньше нижней границы , равна вероятности того, что превзойдет верхнюю границу и каждая из них равна . Следовательно, вероятность того, что окажется вне интервала, заключенного между этими границами равна . Область значений , при которых гипотеза принимается, называется областью принятия гипотезы.

Нулевой (основной) называют выдвинутую гипотезу . В данном примере .

Область значений , при которых гипотеза должна быть отвергнута, называется областью отклонения гипотеза или критической областью.

Конкурирующей (альтернативной) называют гипотезу, которая противоречит нулевой. В данном примере .

Рассмотренный нами простой критерий испытания гипотез называется двусторонним критерием, т.к., когда гипотеза неверна, значение может быть либо больше, либо меньше .

В других случаях достаточно бывает односторонних критериев. Например, пусть основная гипотеза . Тогда альтернативная гипотеза состоит в том: . Следовательно, в критерии должна использоваться только нижняя (левая) граница , определяемая по плотности вероятности .

Рис.6.2. Область принятия и отклонения гипотезы (односторонний критерий)

При проверке гипотезы возможны два типа ошибок.

  1.  Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода.
  2.  Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода.


Проиллюстрируем эти понятия графически (рис. 6.3).

Рис. 6.3. Определение ошибки первого и второго рода при проверке гипотез

Из рисунка видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы значение попадает в область ее отклонения (критическую область). Следовательно, вероятность ошибки первого рода равна , т.е. уровню значимости критерия.

Для определения вероятности ошибки второго рода предположим, к примеру, что истинный параметр равен либо , либо
(см. рис. 6.3). Если гипотеза состоит в том, что
, тогда как на самом деле , то вероятность того, что попадает в область принятия гипотезы, заключенную между и равна . Следовательно, вероятность ошибки второго рода равна при выявлении отклонения величиной от гипотетического значения .

Вероятность называется мощностью критерия.

Следует отметить, что вероятности ошибок первого и второго рода вычисляются при разных предположениях о распределении (если верна гипотеза и если верна гипотеза ), так что никаких раз и навсегда фиксированных соотношений (например , независимо от вида гипотезы и вида критерия) между ними нет. Таким образом, при фиксированном объеме выборки , мы можем сколь угодно уменьшать ошибку первого рода, уменьшая уровень значимости . При этом, естественно, возрастает вероятность ошибки второго рода (уменьшается мощность критерия). Единственный способ одновременно уменьшить ошибки первого и второго рода и – увеличить размер выборки . Именно такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.


Пример 1. ПОСТРОЕНИЕ КРИТЕРИЯ ПРОВЕРКИ ГИПОТЕЗ

Предположим, что среднее значение СВ равно , также предположим, что дисперсия известна и равна . Необходимо найти объем выборки , позволяющий построить критерий проверки гипотезы с 5% – уровнем значимости и 5% – ошибкой второго рода для выявления 10% – отклонений от гипотетического значения. Построим также область принятия гипотезы .

Решение. Выборочное среднее , определяемое формулой (3.2), является несмещенной оценкой . Соответствующее выборочное распределение определяется из соотношения (4.6):

    (6.1)

где имеет распределение . Верхняя и нижняя границы области принятия гипотезы соответственно равны:

   (6.2)

Если теперь истинное среднее значение равно , то с вероятностью произойдет ошибка второго рода, если выборочное среднее окажется меньше (левее) верхней границы и больше (правее) нижней. В терминах выборочного распределения со средним или для верхней и нижней границ (см. рис. 6.3):

  (6.3)

Итак, справедливы следующие равенства:

 (6.4)

Вспомним, что благодаря симметричности распределения справедливы равенства:

  (6.5)

Теперь из (6.4) с учетом (6.5) найдем требуемый объем выборки:

    (6.6)

Для конкретных значений данного примера:

Подставим эти значения в (6.6) и получим значение необходимого объема выборки . Таким образом, объем выборки должен быть равен или больше пятидесяти двух. Область принятия гипотезы определяется соответствующими границами (верхней и нижней) (6.2):


 

А также другие работы, которые могут Вас заинтересовать

55234. Цілі і завдання державної регіональної економічної політики України в економічній та соціальній сфері 24.26 KB
  Державна регіональна економічна політика це сукупність організаційних, правових та економічних заходів, які здійснюються державою у сфері розвитку регіонів відповідно до поточних і стратегічних цілей.
55235. Історичний шлях розвитку адвокатури в Україні 156.5 KB
  Конституція України кожному гарантує право захищати свої права й свободи від порушень і протиправних посягань шляхом оскарження в суді рішень дій чи бездіяльності органів державної влади органів місцевого самоврядування посадових і службових осіб.
55236. Брейн-ринг по правоведению для учащихся 9-10 кл 71.5 KB
  Цели: развивать у учащихся интерес к правоведению; формировать у них интерес и уважение к правовой грамотности; дать им возможность применить накопленные знания на практике; проверить уровень усваивания текущего материала по данному предмету; заинтересовать и сориентировать учеников...
55237. Прийом залучення візуального та асоціативного мислення учнів при роз’ясненні сутності конституційного права 529 KB
  Прийом залучення візуального та асоціативного мислення учнів при розясненні сутності конституційного права Актуальність та обґрунтування прийому. На юридичних факультетах конституційне право як фундаментальна галузь права вивчається ще на першому курсі відразу після вивчення теорії держави та права. Практика свідчить що не всі студенти можуть здійснити дефініціювання декомпозицію експлікацію поняття галузь права не усі з них можуть розяснити специфіку галузі конституційного права її особливу роль. Складається певним чином...
55238. Основні етапи розвитку української державності 79.5 KB
  Мета: визначити основні етапи української державності їх роль у розвитку нашої держави та її правової системи; вдосконалити вміння складати синхроністичну таблицю використовувати вивчений матеріал на уроках історії...
55239. Державний бюджет 87 KB
  Державний бюджет — система грошових відносин, яка виникає між державою, з одного боку, і підприємствами, фірмами, організаціями та населенням, з іншого, з метою формування та використання централізованого фонду грошових ресурсів для задоволення суспільних потреб. Іншими словами, це — щорічний баланс надходжень та видатків...
55240. Создание и настройка одноранговой компьютерной сети состоящей из 7 компьютеров на основе коаксиального кабеля использующей топологию “общая шина” и технологию передачи данных Ethernet 249.42 KB
  Компьютерная сеть – это технология, которая подразумевает под собой соединение двух или более персональных компьютеров. Она позволяет путем использования соединительных проводов и сетевого оборудования, передавать данные, документы, сообщения и другую информацию, совместно использовать программное обеспечение, установленное на одном из ПК, а также дорогостоящую технику.
55242. Економічні методи аналізу розміщення продуктивних сил 25.58 KB
  Розробляють цільові комплексні програми, у тому числі територіальні. Проекти будівництва підприємств, схеми та проекти районних планів розробляють на проектній стадії обгрунтування розміщення виробництва і його територіального розвитку.