30573

Основные типы статистических гипотез. Общая логическая схема статистического критерия

Доклад

Математика и математический анализ

Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1 х2. Результат подобного сопоставления может быть либо отрицательным данные наблюдения противоречат высказанной гипотезе а потому от этой гипотезы следует отказаться либо неотрицательным данные наблюдения не противоречат высказанной гипотезе а потому ее можно принять в качестве одного из естественных и допустимых решений. При этом неотрицательный результат статистической проверки гипотезы не означает что высказанное...

Русский

2013-08-24

37.33 KB

22 чел.

21

Основные типы статистических гипотез. Общая логическая схема статистического критерия

  1.  Часть I (доска)

Рис.

+ записи из части 2

  1.  Часть II (выступление) + Часть III.

На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположительных утверждений (гипотез) относительно природы или величины неизвестных параметров анализируемой стохастической системы.

Например, исследователь высказывает предположение: «исследуемые наблюдения извлечены из нормальной генеральной совокупности» или «среднее значение анализируемой генеральной совокупности равно нулю». Будем обозначать в дальнейшем высказанное нами предположение (гипотезу) с помощью буквы H. Наша цель — проверить, не противоречит ли высказанная нами гипотеза H имеющимся выборочным данным.

Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1, х2,..., хn, сопровождаемая количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.

Результат подобного сопоставления может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе, а потому от этой гипотезы следует отказаться), либо неотрицательным (данные наблюдения не противоречат высказанной гипотезе, а потому ее можно принять в качестве одного из естественных и допустимых решений). При этом неотрицательный результат статистической проверки гипотезы не означает, что высказанное нами предположительное утверждение является наилучшим, единственно подходящим: просто она не противоречит имеющимся у нас выборочным данным, однако таким же свойством могут наряду с H обладать и другие гипотезы. Так что даже статистически проверенное предположение H следует расценивать не как раз и навсегда установленный, абсолютно верный факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.

По своему прикладному содержанию высказываемые в ходе статистической обработки данных гипотезы можно подразделить на несколько основных типов.

Основные типы гипотез

8.1.1.Гипотезы о типе закона распределения исследуемой случайной величины

При обработке ряда наблюдений

х1, х2, ..., хп (8.1)

исследуемой случайной величины ξ очень важно понять механизм формирования выборочных значений хi, т. е. подобрать и обосновать некоторую модельную функцию распределения Fмод(x), с помощью которой можно адекватно описать исследуемую функцию распределения Fξ(x). На определенной стадии исследования это приводит к необходимости проверки гипотез типа

H: Fξ(x) = Fмод(x) (8.2)

где гипотетичная модельная функция может быть как заданной однозначно (тогда Fξ(x) = F0(x), где F0(x) — полностью известная функция), так и заданной с точностью до принадлежности к некоторому параметрическому семейству (тогда Fмод(x) = Fξ(Θ), где 0 — некоторый, вообще говоря, k-мерный параметр, значения которого неизвестны, но могут быть оценены по выборке (8.1)).

Проверка гипотез типа (8.2) осуществляется с помощью критериев согласия и опирается на ту или иную меру различия между анализируемой эмпирической функцией распределения F'ξ(n)(x) и гипотетическим модельным законом Fмод(x).

8.1.2.Гипотезы об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей

Наиболее типичные задачи такого рода характеризуются следующей общей ситуацией. Пусть мы имеем несколько «порций» выборочных данных типа (8.1):

1-я: x11, x12, ... , x1n1;

2-я: x21, x22, ... , x2n2; (8 3)

l-я: l-я: xl1, xl2, ... , xlnl;

Эти порции могли образоваться, например, естественным образом — в ходе проведения выборочного обследования (скажем, за счет разделенности условий их регистрации во времени или пространстве). Обозначая функцию распределения, описывающую вероятностный закон, которому подчиняются наблюдения j-й выборки, с помощью Fj(x) и снабжая тем же индексом все интересующие нас эмпирические и теоретические характеристики этого закона (средние значения а'j- и aj; дисперсии σ'j2 и σ'j2 и т.д.), основные гипотезы однородности можно записать в виде:

HF: F1(x) = F2(x) = ... = Fl(x); (8.4а)

На: a1 = a2 = ... = аl; (8.4.б)

Нσ: σ12 = σ22 = ... = σ2l (8.4в)

В случае неотрицательного результата проверки этих гипотез говорят, что соответствующие выборочные характеристики (например, a'1,a'2, ... a'l) различаются статистически незначимо.

Отметим частный случай гипотез типа (8.4а), когда число выборок l = 2, а одна из выборок содержит малое количество наблюдений (в частном случае — одно). В таком виде проверка гипотез типа (8.4а) означает проверку аномальности одного или нескольких резко выделяющихся наблюдений.

8.1.3.Гипотезы о числовых значениях параметров исследуемой генеральной совокупности

Пусть, например, ряд наблюдений (8.1) дает нам значения некоторого параметра изделий, измеренные на п изделиях, случайно отобранных из массовой продукции определенного станка автоматической линии, и пусть а0 — заданное номинальное значение этого параметра. Каждое отдельное значение ж,- может, естественно, как-то отклоняться от заданного номинала. Очевидно, для того чтобы проверить правильность настройки этого станка, надо убедиться в том, что среднее значение параметра у производимых на нем изделий будет соответствовать номиналу, т. е. проверить гипотезу типа

H: Eξ = а0. (8.5)

В общем случае гипотезы подобного типа имеют вид:

H0: Θ Δ0,  (8.6)

где Θ некоторый параметр (вообще говоря, многомерный), от которого зависит исследуемое распределение, а Δ0 — область его конкретных гипотетических значений, которая может состоять всего из одной точки.

Статистическая проверка гипотез о числовых значениях параметров играет важную роль в эконометрическом моделировании, регрессионном анализе, в широком спектре задач статистического исследования зависимостей, существующих между анализируемыми показателями. В частности, принятие решения о включении или исключении той или иной переменной в анализируемую регрессионную (эконометрическую) модель, о наличии-отсутствии статистической связи между наблюдаемыми признаками существенно опирается обычно на проверку гипотез типа (8.6) при Δ0 = 0. Такого же типа гипотезы приходится проверять при установлении факта независимости и стационарности имеющегося ряда наблюдений.

8.1.4.Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками

В п. 8.1.1 речь шла, по существу о подборе подходящей модели для описания закона распределения вероятностей исследуемой случайной величины. Не менее важное место в общем статистическом и эконометрическом анализе занимает проблема подбора подходящей модели, с помощью которой мы можем адекватно описать исследуемую статистическую зависимость между анализируемыми признаками. В качестве гипотетических могут проверяться утверждения о линейном, квадратическом, экспоненциальном, степенном, логарифмическом, полиномиальном и т. п. типе искомой зависимости.

комой зависимости.

Общая логическая схема статистического критерия

По своему назначению и характеру решаемых задач статистические критерии чрезвычайно разнообразны. Однако их объединяет общность логической схемы, по которой они строятся. Коротко эту логическую схему можно описать так.

  1.  Выдвигается гипотеза H0
  2.  Задаются величиной так называемого уровня значимости критерия а. Дело в том, что всякое статистическое решение, т. е. решение, принимаемое на основании ограниченного ряда наблюдений, неизбежно сопровождается некоторой, хотя, возможно, может и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону. Скажем, в какой-то небольшой доле случаев а гипотеза H0 может оказаться отвергнутой, в то время как на самом деле она является справедливой, или, наоборот, в какой-то небольшой доле случаев β мы можем принять нашу гипотезу, в то время как на самом деле она ошибочна, а справедливым оказывается некоторое конкурирующее с ней предположение — альтернативная гипотеза H1. При фиксированном объеме выборочных данных величину вероятности одной из этих ошибок мы можем выбирать по своему усмотрению. Если же объем выборки можно как угодно увеличивать, то имеется принципиальная возможность добиваться как угодно малых вероятностей обеих ошибок а и β при любом фиксированном конкурирующем предположительном утверждении H1. В частности, при фиксированном объеме выборки обычно задаются величиной а вероятности ошибочного отвержения проверяемой гипотезы H0, которую часто называют «основной» или «нулевой». Эту вероятность ошибочного отклонения «нулевой» гипотезы принято называть уровнем значимости или размером критерия. Выбор величины уровня значимости а зависит от сопоставления потерь, которые мы понесем в случае ошибочных заключений в ту или иную сторону: чем весомее для нас потери от ошибочного отвержения высказанной гипотезы H0, тем меньшей выбирается величина а. Однако поскольку такое сопоставление в большинстве практических задач оказывается весьма затруднительным (часто трудно даже вообще сказать, в какую сторону ошибка является для нас более опасной), то, как правило, пользуются некоторыми стандартными значениями уровня значимости. К таким стандартным значениям можно причислить величины а = 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Особенно распространенной является величина уровня значимости а, равная 0,05. Она означает, что в среднем в пяти случаях из 100 мы будем ошибочно отвергать высказанную гипотезу при многократном использовании данного статистического критерия.
  3.  Задаются некоторой функцией от результатов наблюдения (критической статистикой) γ(n) = γ(X1, x2, ... , xn). Эта критическая статистика как и всякая функция от результатов наблюдения, сама является случайной величиной (см. 7.1.2) и в предположении справедливости гипотезы Нo подчинена некоторому хорошо изученному закону распределения с плотностью fγ(n)(u)

Один из основных принципов построения критической статистики (принцип отношения правдоподобия) описан в п. 8.3.1. Поясним здесь лишь общий содержательный смысл этой статистики: как правило, ею определяется мера расхождения имеющихся в нашем распоряжении выборочных данных (8.1) с высказанной (и проверяемой) гипотезой H0. Так, в гипотезах типа рассмотренных в п. 8.1.1 критическая статистика γ определяет меру различия между анализируемой эмпирической функцией распределения F'(n)(x) и гипотетической (модельной) функцией Fмод(х). В гипотезах типа рассмотренных в п. 8.1.2 величина γ(n) измеряет степень расхождения соответствующих выборочных характеристик в различных выборках; в гипотезах типа рассмотренных в п. 8.1.3 — отклонения выборочных характеристик от соответствующих гипотетических значений и т. д.

  1.  Из таблиц распределения fγ(n)(u) находятся 100(1 - a/2) %-ная точка γa/2(min) и 100a/2 %-ная точка γa/2(max) разделяющие всю область мыслимых значений случайной величины γ(n) на три части: область неправдоподобно малых (I), неправдоподобно больших (III) и естественных или правдоподобныхусловиях справедливости гипотезы Н0) значений (II) (рис. 8.1). В тех случаях, когда основную опасность для нашего утверждения представляют только односторонние отклонения, т. е. только «слишком маленькие» или только «слишком большие» значения критической статистики γ(n), находят лишь одну процентную точку: либо 100(1 — а)%-ную точку γa(min) которая будет разделять весь диапазон значений γ(n) на две части: область неправдоподобно малых и область правдоподобных значений; либо 100а%-ную точку γa(,max); она будет разделять весь диапазон значений γ(n) на область неправдоподобно больших и область правдоподобных значений.
  2.  Наконец, в функцию γ(n) подставляют имеющиеся конкретные выборочные данные x1 и подсчитывают численную величину γ(n). Если окажется, что вычисленное значение принадлежит области правдоподобных значений то гипотеза H0 считается не противоречащей выборочным данным. В противном случае, т. е. если γ(n) слишком мала или слишком велика, делается вывод, что γ(n) на самом деле не подчиняется закону fγ(n)(u) (этот вывод, как легко понять, сопровождается вероятностью ошибки, равной а), и это несоответствие мы вынуждены объяснить ошибочностью высказанного нами предположения Я0 и, следовательно, отказаться от него.

Таким образом, решение, принимаемое на основании любого статистического критерия, может оказаться ошибочным как в случае отклонения проверяемой гипотезы H0 (с вероятностью а), так и в случае ее принятия (с вероятностью Р). Вероятности а и β ошибочных решений называют также ошибками соответственно первого и второго рода, а величину 1 - β — мощностью критерия. Очевидно, из двух критериев, характеризующихся одной и той же вероятностью а отвергнуть в действительности правильную гипотезу H0, следует предпочесть тот, который сопровождается меньшей ошибкой второго рода (или большей мощностью).

Рис(доска). График плотности распределения критической статистики γn к выделение областей «правдоподобных» (II) и «неправдоподобных» (I к III), в условиях справедливости гипотезы H0, значений этой статистики

Если проверяемое предположительное утверждение сводится к гипотезе о том, что значение некоторого параметра Θ в точности равно заданной величине ΘО, то эта гипотеза называется простой. В других случаях гипотеза будет называться сложной.


 

А также другие работы, которые могут Вас заинтересовать

26042. JK-триггеры 14.14 KB
  Подобно RSтриггеру в JKтриггере входы J и K это входы установки выхода Q триггера в состояние 1 или 0. Однако в отличие от RSтриггера в JKтриггере наличие J=K=1 приводит к переходу выхода Q триггера в противоположное состояние. Условие функционирования JKтриггера описывается функцией: Рисунок 51 JKтриггеры: а асинхронные; б тактируемые фронтом. Триггер JKтипа называют универсальным потому что на его основе с помощью несложных коммутационных преобразований можно получить RS и Ттриггеры а если между входами J и K включить...
26043. D-триггеры 13.79 KB
  Характеристическое уравнение триггера: Qn1=Dn. Оно означает что логический сигнал Qn1 повторяет значение сигнала установленное на входе триггера в предшествующий момент времени. Благодаря включению элемента D1 на входы RSтриггера поступают разнополярные сигналы Рисунок 47а поэтому запрещённое состояние входных сигналов исключено но время задержки распространения сигнала элемента D1 должно быть меньше чем у элементов D2 и D3 tзд. В приведённой выше схеме Dтриггера вследствие задержки распространения сигналов сигнал на выходе Q...
26044. Счётные триггеры 18.55 KB
  Функционирование триггера определяется уравнением: Из уравнения следует что Ттриггер каждый раз изменяет своё состояние на противоположное с приходом на счётный вход Т очередного тактирующего импульса длительностью tи. Этому способствует наличие перекрёстных обратных связей с выходов триггера на входы элементов D1 и D2. Для надёжной работы триггера с целью сохранения информации о предыдущем состоянии триггера в момент его переключения в схему вводят элементы задержки имеющие время задержки tз tи. Сигнал на этом входе разрешает при V=1...
26045. Сумматоры, их схемы 98.69 KB
  Сумматоры их схемы В цифровой вычислительной технике используются одноразрядные суммирующие схемы с двумя и тремя входами причём первые называются полусумматорами а вторые полными одноразрядными сумматорами. приведена таблица истинности полусумматора на основании которой составлена его структурная формула в виде СДНФ Основными параметрами характеризующими качественные показатели логических схем являются быстродействие и количество элементов определяющее сложность схемы. Быстродействие определяется суммарным временем задержки сигнала...
26046. Программированные логические матрицы(ПЛЦ) 14.64 KB
  Программированные логические матрицыПЛЦ Основная идея работы ПЛМ заключается в реализации логической функции представленной в СДНФ дизъюнктивной нормальной форме. В схеме ПЛМ приведенной на рисунке 1 ранг терма ограничен количеством входов и равен четырем количество термов тоже равно четырем. В реально выпускавшихся микросхемах программируемых логических матриц ПЛМ количество входов было равно шестнадцати максимальный ранг минтерма 16 количество термов равно 32 и количество выходов микросхемы 8. Следует отметить что полная...
26047. Большие интегральные схемы(БИС) запоминающихся устройств(ЗУ). Организация БИС ЗУ 15.67 KB
  Большие интегральные схемы БИС запоминающихся устройств ЗУ. Организация БИС ЗУ Большая интегральная схема БИС интегральная схема ИС с высокой степенью интеграции число элементов в ней достигает 10000 используется в электронной аппаратуре как функционально законченный узел устройств вычислительной техники автоматики измерительной техники и др. По количеству элементов все интегральные схемы условно делят на следующие категории...
26048. Двоичные счётчики 15.41 KB
  Двоичные счётчики Счетчик представляет собой устройство состояние которого определяется числом поступивших на его вход импульсов. Счетчики используют для подсчета числа импульсов и фиксации этого числа в заданном коде деления частоты следования импульсов формирования последовательностей импульсов и кодов управления цифровыми блоками. Двоичный n – разрядный счетчик содержит n каскадносоединенных ячеек в качестве которых используют счетные Т–триггеры При поступлении входных импульсов по их спаду происходит последовательное изменение...
26049. Инвертор 13.41 KB
  Единица на выходе схемы И будет тогда и только тогда когда на всех входах будут единицы. Связь между выходом z этой схемы и входами x и y описывается соотношением: z = xy читается как x и y . Когда хотя бы на одном входе схемы ИЛИ будет единица на её выходе также будет единица. Условное обозначение схемы ИЛИ представлено на рис.
26050. Понятие информации в информатике 22.96 KB
  Система представления чисел двоичными цифрами называется двоичной системой счисления. В общем случае позиционной системой счисления называется позиционное представление чисел в котором последовательные цифровые разряды являются целыми степенями целого числа называемого основанием системы. Например в десятичной системе счисления основанием которой является число 10 каждый следующий старший разряд в 10 раз больше предыдущего. Целое число М в позиционной системе счисления с основанием n записывается в виде M=ak ak1a1 a0 где ak ak1a1 a0...