30573

Основные типы статистических гипотез. Общая логическая схема статистического критерия

Доклад

Математика и математический анализ

Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1 х2. Результат подобного сопоставления может быть либо отрицательным данные наблюдения противоречат высказанной гипотезе а потому от этой гипотезы следует отказаться либо неотрицательным данные наблюдения не противоречат высказанной гипотезе а потому ее можно принять в качестве одного из естественных и допустимых решений. При этом неотрицательный результат статистической проверки гипотезы не означает что высказанное...

Русский

2013-08-24

37.33 KB

16 чел.

21

Основные типы статистических гипотез. Общая логическая схема статистического критерия

  1.  Часть I (доска)

Рис.

+ записи из части 2

  1.  Часть II (выступление) + Часть III.

На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположительных утверждений (гипотез) относительно природы или величины неизвестных параметров анализируемой стохастической системы.

Например, исследователь высказывает предположение: «исследуемые наблюдения извлечены из нормальной генеральной совокупности» или «среднее значение анализируемой генеральной совокупности равно нулю». Будем обозначать в дальнейшем высказанное нами предположение (гипотезу) с помощью буквы H. Наша цель — проверить, не противоречит ли высказанная нами гипотеза H имеющимся выборочным данным.

Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1, х2,..., хn, сопровождаемая количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.

Результат подобного сопоставления может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе, а потому от этой гипотезы следует отказаться), либо неотрицательным (данные наблюдения не противоречат высказанной гипотезе, а потому ее можно принять в качестве одного из естественных и допустимых решений). При этом неотрицательный результат статистической проверки гипотезы не означает, что высказанное нами предположительное утверждение является наилучшим, единственно подходящим: просто она не противоречит имеющимся у нас выборочным данным, однако таким же свойством могут наряду с H обладать и другие гипотезы. Так что даже статистически проверенное предположение H следует расценивать не как раз и навсегда установленный, абсолютно верный факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.

По своему прикладному содержанию высказываемые в ходе статистической обработки данных гипотезы можно подразделить на несколько основных типов.

Основные типы гипотез

8.1.1.Гипотезы о типе закона распределения исследуемой случайной величины

При обработке ряда наблюдений

х1, х2, ..., хп (8.1)

исследуемой случайной величины ξ очень важно понять механизм формирования выборочных значений хi, т. е. подобрать и обосновать некоторую модельную функцию распределения Fмод(x), с помощью которой можно адекватно описать исследуемую функцию распределения Fξ(x). На определенной стадии исследования это приводит к необходимости проверки гипотез типа

H: Fξ(x) = Fмод(x) (8.2)

где гипотетичная модельная функция может быть как заданной однозначно (тогда Fξ(x) = F0(x), где F0(x) — полностью известная функция), так и заданной с точностью до принадлежности к некоторому параметрическому семейству (тогда Fмод(x) = Fξ(Θ), где 0 — некоторый, вообще говоря, k-мерный параметр, значения которого неизвестны, но могут быть оценены по выборке (8.1)).

Проверка гипотез типа (8.2) осуществляется с помощью критериев согласия и опирается на ту или иную меру различия между анализируемой эмпирической функцией распределения F'ξ(n)(x) и гипотетическим модельным законом Fмод(x).

8.1.2.Гипотезы об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей

Наиболее типичные задачи такого рода характеризуются следующей общей ситуацией. Пусть мы имеем несколько «порций» выборочных данных типа (8.1):

1-я: x11, x12, ... , x1n1;

2-я: x21, x22, ... , x2n2; (8 3)

l-я: l-я: xl1, xl2, ... , xlnl;

Эти порции могли образоваться, например, естественным образом — в ходе проведения выборочного обследования (скажем, за счет разделенности условий их регистрации во времени или пространстве). Обозначая функцию распределения, описывающую вероятностный закон, которому подчиняются наблюдения j-й выборки, с помощью Fj(x) и снабжая тем же индексом все интересующие нас эмпирические и теоретические характеристики этого закона (средние значения а'j- и aj; дисперсии σ'j2 и σ'j2 и т.д.), основные гипотезы однородности можно записать в виде:

HF: F1(x) = F2(x) = ... = Fl(x); (8.4а)

На: a1 = a2 = ... = аl; (8.4.б)

Нσ: σ12 = σ22 = ... = σ2l (8.4в)

В случае неотрицательного результата проверки этих гипотез говорят, что соответствующие выборочные характеристики (например, a'1,a'2, ... a'l) различаются статистически незначимо.

Отметим частный случай гипотез типа (8.4а), когда число выборок l = 2, а одна из выборок содержит малое количество наблюдений (в частном случае — одно). В таком виде проверка гипотез типа (8.4а) означает проверку аномальности одного или нескольких резко выделяющихся наблюдений.

8.1.3.Гипотезы о числовых значениях параметров исследуемой генеральной совокупности

Пусть, например, ряд наблюдений (8.1) дает нам значения некоторого параметра изделий, измеренные на п изделиях, случайно отобранных из массовой продукции определенного станка автоматической линии, и пусть а0 — заданное номинальное значение этого параметра. Каждое отдельное значение ж,- может, естественно, как-то отклоняться от заданного номинала. Очевидно, для того чтобы проверить правильность настройки этого станка, надо убедиться в том, что среднее значение параметра у производимых на нем изделий будет соответствовать номиналу, т. е. проверить гипотезу типа

H: Eξ = а0. (8.5)

В общем случае гипотезы подобного типа имеют вид:

H0: Θ Δ0,  (8.6)

где Θ некоторый параметр (вообще говоря, многомерный), от которого зависит исследуемое распределение, а Δ0 — область его конкретных гипотетических значений, которая может состоять всего из одной точки.

Статистическая проверка гипотез о числовых значениях параметров играет важную роль в эконометрическом моделировании, регрессионном анализе, в широком спектре задач статистического исследования зависимостей, существующих между анализируемыми показателями. В частности, принятие решения о включении или исключении той или иной переменной в анализируемую регрессионную (эконометрическую) модель, о наличии-отсутствии статистической связи между наблюдаемыми признаками существенно опирается обычно на проверку гипотез типа (8.6) при Δ0 = 0. Такого же типа гипотезы приходится проверять при установлении факта независимости и стационарности имеющегося ряда наблюдений.

8.1.4.Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками

В п. 8.1.1 речь шла, по существу о подборе подходящей модели для описания закона распределения вероятностей исследуемой случайной величины. Не менее важное место в общем статистическом и эконометрическом анализе занимает проблема подбора подходящей модели, с помощью которой мы можем адекватно описать исследуемую статистическую зависимость между анализируемыми признаками. В качестве гипотетических могут проверяться утверждения о линейном, квадратическом, экспоненциальном, степенном, логарифмическом, полиномиальном и т. п. типе искомой зависимости.

комой зависимости.

Общая логическая схема статистического критерия

По своему назначению и характеру решаемых задач статистические критерии чрезвычайно разнообразны. Однако их объединяет общность логической схемы, по которой они строятся. Коротко эту логическую схему можно описать так.

  1.  Выдвигается гипотеза H0
  2.  Задаются величиной так называемого уровня значимости критерия а. Дело в том, что всякое статистическое решение, т. е. решение, принимаемое на основании ограниченного ряда наблюдений, неизбежно сопровождается некоторой, хотя, возможно, может и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону. Скажем, в какой-то небольшой доле случаев а гипотеза H0 может оказаться отвергнутой, в то время как на самом деле она является справедливой, или, наоборот, в какой-то небольшой доле случаев β мы можем принять нашу гипотезу, в то время как на самом деле она ошибочна, а справедливым оказывается некоторое конкурирующее с ней предположение — альтернативная гипотеза H1. При фиксированном объеме выборочных данных величину вероятности одной из этих ошибок мы можем выбирать по своему усмотрению. Если же объем выборки можно как угодно увеличивать, то имеется принципиальная возможность добиваться как угодно малых вероятностей обеих ошибок а и β при любом фиксированном конкурирующем предположительном утверждении H1. В частности, при фиксированном объеме выборки обычно задаются величиной а вероятности ошибочного отвержения проверяемой гипотезы H0, которую часто называют «основной» или «нулевой». Эту вероятность ошибочного отклонения «нулевой» гипотезы принято называть уровнем значимости или размером критерия. Выбор величины уровня значимости а зависит от сопоставления потерь, которые мы понесем в случае ошибочных заключений в ту или иную сторону: чем весомее для нас потери от ошибочного отвержения высказанной гипотезы H0, тем меньшей выбирается величина а. Однако поскольку такое сопоставление в большинстве практических задач оказывается весьма затруднительным (часто трудно даже вообще сказать, в какую сторону ошибка является для нас более опасной), то, как правило, пользуются некоторыми стандартными значениями уровня значимости. К таким стандартным значениям можно причислить величины а = 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Особенно распространенной является величина уровня значимости а, равная 0,05. Она означает, что в среднем в пяти случаях из 100 мы будем ошибочно отвергать высказанную гипотезу при многократном использовании данного статистического критерия.
  3.  Задаются некоторой функцией от результатов наблюдения (критической статистикой) γ(n) = γ(X1, x2, ... , xn). Эта критическая статистика как и всякая функция от результатов наблюдения, сама является случайной величиной (см. 7.1.2) и в предположении справедливости гипотезы Нo подчинена некоторому хорошо изученному закону распределения с плотностью fγ(n)(u)

Один из основных принципов построения критической статистики (принцип отношения правдоподобия) описан в п. 8.3.1. Поясним здесь лишь общий содержательный смысл этой статистики: как правило, ею определяется мера расхождения имеющихся в нашем распоряжении выборочных данных (8.1) с высказанной (и проверяемой) гипотезой H0. Так, в гипотезах типа рассмотренных в п. 8.1.1 критическая статистика γ определяет меру различия между анализируемой эмпирической функцией распределения F'(n)(x) и гипотетической (модельной) функцией Fмод(х). В гипотезах типа рассмотренных в п. 8.1.2 величина γ(n) измеряет степень расхождения соответствующих выборочных характеристик в различных выборках; в гипотезах типа рассмотренных в п. 8.1.3 — отклонения выборочных характеристик от соответствующих гипотетических значений и т. д.

  1.  Из таблиц распределения fγ(n)(u) находятся 100(1 - a/2) %-ная точка γa/2(min) и 100a/2 %-ная точка γa/2(max) разделяющие всю область мыслимых значений случайной величины γ(n) на три части: область неправдоподобно малых (I), неправдоподобно больших (III) и естественных или правдоподобныхусловиях справедливости гипотезы Н0) значений (II) (рис. 8.1). В тех случаях, когда основную опасность для нашего утверждения представляют только односторонние отклонения, т. е. только «слишком маленькие» или только «слишком большие» значения критической статистики γ(n), находят лишь одну процентную точку: либо 100(1 — а)%-ную точку γa(min) которая будет разделять весь диапазон значений γ(n) на две части: область неправдоподобно малых и область правдоподобных значений; либо 100а%-ную точку γa(,max); она будет разделять весь диапазон значений γ(n) на область неправдоподобно больших и область правдоподобных значений.
  2.  Наконец, в функцию γ(n) подставляют имеющиеся конкретные выборочные данные x1 и подсчитывают численную величину γ(n). Если окажется, что вычисленное значение принадлежит области правдоподобных значений то гипотеза H0 считается не противоречащей выборочным данным. В противном случае, т. е. если γ(n) слишком мала или слишком велика, делается вывод, что γ(n) на самом деле не подчиняется закону fγ(n)(u) (этот вывод, как легко понять, сопровождается вероятностью ошибки, равной а), и это несоответствие мы вынуждены объяснить ошибочностью высказанного нами предположения Я0 и, следовательно, отказаться от него.

Таким образом, решение, принимаемое на основании любого статистического критерия, может оказаться ошибочным как в случае отклонения проверяемой гипотезы H0 (с вероятностью а), так и в случае ее принятия (с вероятностью Р). Вероятности а и β ошибочных решений называют также ошибками соответственно первого и второго рода, а величину 1 - β — мощностью критерия. Очевидно, из двух критериев, характеризующихся одной и той же вероятностью а отвергнуть в действительности правильную гипотезу H0, следует предпочесть тот, который сопровождается меньшей ошибкой второго рода (или большей мощностью).

Рис(доска). График плотности распределения критической статистики γn к выделение областей «правдоподобных» (II) и «неправдоподобных» (I к III), в условиях справедливости гипотезы H0, значений этой статистики

Если проверяемое предположительное утверждение сводится к гипотезе о том, что значение некоторого параметра Θ в точности равно заданной величине ΘО, то эта гипотеза называется простой. В других случаях гипотеза будет называться сложной.


 

А также другие работы, которые могут Вас заинтересовать

69501. Организация производства Конспект лекций 408 KB
  Процессы организации производства: организация процесса производства в пространстве; организация процесса производства во времени; организация технической подготовки новой продукции; организация труда и заработной платы; организация обслуживания процесса...
69502. Основы международных валютно-финансовых и кредитных отношений 771.5 KB
  Включает ряд элементов каждый из которых юридически оформляется международными договорами и соглашениями: формы международных средств обращения и платежа золото определённые валюты международные валюты например ЕВРО; валютный паритет и узаконенный режим курсов...
69503. Планирование деятельности предприятий 522 KB
  Дело в том что предприятия в значительной мере отличаются друг от друга: размерами объемом выпускаемой продукции самой продукцией прокатный стан и часы одна сравнительно простая с коротким производственным циклом другая сложная например средняя турбина имеет порядка 40 тыс.
69504. Потенциал предприятия. Формирование и оценка 439.5 KB
  Основным этапом оценки становится определение потенциальных возможностей предприятия. Методы оценки конкурентоспособности потенциала предприятия. В общем виде процесс оценки конкурентоспособности потенциала предприятия состоит из следующих этапов: 1. определение цели...
69505. Стратегия предприятий 6.95 MB
  Современные концепции стратегии. Анализ современной экономической литературы дает возможность выделить две основных концепции стратегии: философскую; организационно-управленческую. Философская концепция грунтуется на общем значении стратегии для предприятия.
69506. Страхование 276.5 KB
  Страхователь это юридическое дееспособное физическое лицо заключившее со страховщиком договор страхования и обязующееся уплачивать страховщику страховые взносы при наступлении страхового случая страхователь может требовать от страховщика уплату страхового возмещения.
69507. Страховые услуги 350 KB
  Зарождение страховых услуг в Украине. Экономические отношения в чумацких братствах можно считать прообразами страхования. Первая страховая компания на территории Украины Общество взаимного страхования от огня была создана в 1863 году в Полтаве.
69508. Учет и аудит в банках 818.5 KB
  Бухгалтерский учет в банке можно определить как систему регистрации и подсчета итогов операций, выполняемых в банковском бизнесе, с последующим анализом и проверкой результатов и составлением соответствующих отчетов.
69509. Финансовая деятельность субъектов хозяйствования 623.5 KB
  В соответствии с действующим законодательством Украины под хозяйственными обществами подразумеваются предприятия учреждения организации образованные на основе соглашения между юридическими лицами и гражданами путем объединения их собственности и предпринимательской...