30573

Основные типы статистических гипотез. Общая логическая схема статистического критерия

Доклад

Математика и математический анализ

Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1 х2. Результат подобного сопоставления может быть либо отрицательным данные наблюдения противоречат высказанной гипотезе а потому от этой гипотезы следует отказаться либо неотрицательным данные наблюдения не противоречат высказанной гипотезе а потому ее можно принять в качестве одного из естественных и допустимых решений. При этом неотрицательный результат статистической проверки гипотезы не означает что высказанное...

Русский

2013-08-24

37.33 KB

19 чел.

21

Основные типы статистических гипотез. Общая логическая схема статистического критерия

  1.  Часть I (доска)

Рис.

+ записи из части 2

  1.  Часть II (выступление) + Часть III.

На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположительных утверждений (гипотез) относительно природы или величины неизвестных параметров анализируемой стохастической системы.

Например, исследователь высказывает предположение: «исследуемые наблюдения извлечены из нормальной генеральной совокупности» или «среднее значение анализируемой генеральной совокупности равно нулю». Будем обозначать в дальнейшем высказанное нами предположение (гипотезу) с помощью буквы H. Наша цель — проверить, не противоречит ли высказанная нами гипотеза H имеющимся выборочным данным.

Процедура обоснованного сопоставления высказанной гипотезы с имеющимися в нашем распоряжении выборочными данными х1, х2,..., хn, сопровождаемая количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.

Результат подобного сопоставления может быть либо отрицательным (данные наблюдения противоречат высказанной гипотезе, а потому от этой гипотезы следует отказаться), либо неотрицательным (данные наблюдения не противоречат высказанной гипотезе, а потому ее можно принять в качестве одного из естественных и допустимых решений). При этом неотрицательный результат статистической проверки гипотезы не означает, что высказанное нами предположительное утверждение является наилучшим, единственно подходящим: просто она не противоречит имеющимся у нас выборочным данным, однако таким же свойством могут наряду с H обладать и другие гипотезы. Так что даже статистически проверенное предположение H следует расценивать не как раз и навсегда установленный, абсолютно верный факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.

По своему прикладному содержанию высказываемые в ходе статистической обработки данных гипотезы можно подразделить на несколько основных типов.

Основные типы гипотез

8.1.1.Гипотезы о типе закона распределения исследуемой случайной величины

При обработке ряда наблюдений

х1, х2, ..., хп (8.1)

исследуемой случайной величины ξ очень важно понять механизм формирования выборочных значений хi, т. е. подобрать и обосновать некоторую модельную функцию распределения Fмод(x), с помощью которой можно адекватно описать исследуемую функцию распределения Fξ(x). На определенной стадии исследования это приводит к необходимости проверки гипотез типа

H: Fξ(x) = Fмод(x) (8.2)

где гипотетичная модельная функция может быть как заданной однозначно (тогда Fξ(x) = F0(x), где F0(x) — полностью известная функция), так и заданной с точностью до принадлежности к некоторому параметрическому семейству (тогда Fмод(x) = Fξ(Θ), где 0 — некоторый, вообще говоря, k-мерный параметр, значения которого неизвестны, но могут быть оценены по выборке (8.1)).

Проверка гипотез типа (8.2) осуществляется с помощью критериев согласия и опирается на ту или иную меру различия между анализируемой эмпирической функцией распределения F'ξ(n)(x) и гипотетическим модельным законом Fмод(x).

8.1.2.Гипотезы об однородности двух или нескольких обрабатываемых выборок или некоторых характеристик анализируемых совокупностей

Наиболее типичные задачи такого рода характеризуются следующей общей ситуацией. Пусть мы имеем несколько «порций» выборочных данных типа (8.1):

1-я: x11, x12, ... , x1n1;

2-я: x21, x22, ... , x2n2; (8 3)

l-я: l-я: xl1, xl2, ... , xlnl;

Эти порции могли образоваться, например, естественным образом — в ходе проведения выборочного обследования (скажем, за счет разделенности условий их регистрации во времени или пространстве). Обозначая функцию распределения, описывающую вероятностный закон, которому подчиняются наблюдения j-й выборки, с помощью Fj(x) и снабжая тем же индексом все интересующие нас эмпирические и теоретические характеристики этого закона (средние значения а'j- и aj; дисперсии σ'j2 и σ'j2 и т.д.), основные гипотезы однородности можно записать в виде:

HF: F1(x) = F2(x) = ... = Fl(x); (8.4а)

На: a1 = a2 = ... = аl; (8.4.б)

Нσ: σ12 = σ22 = ... = σ2l (8.4в)

В случае неотрицательного результата проверки этих гипотез говорят, что соответствующие выборочные характеристики (например, a'1,a'2, ... a'l) различаются статистически незначимо.

Отметим частный случай гипотез типа (8.4а), когда число выборок l = 2, а одна из выборок содержит малое количество наблюдений (в частном случае — одно). В таком виде проверка гипотез типа (8.4а) означает проверку аномальности одного или нескольких резко выделяющихся наблюдений.

8.1.3.Гипотезы о числовых значениях параметров исследуемой генеральной совокупности

Пусть, например, ряд наблюдений (8.1) дает нам значения некоторого параметра изделий, измеренные на п изделиях, случайно отобранных из массовой продукции определенного станка автоматической линии, и пусть а0 — заданное номинальное значение этого параметра. Каждое отдельное значение ж,- может, естественно, как-то отклоняться от заданного номинала. Очевидно, для того чтобы проверить правильность настройки этого станка, надо убедиться в том, что среднее значение параметра у производимых на нем изделий будет соответствовать номиналу, т. е. проверить гипотезу типа

H: Eξ = а0. (8.5)

В общем случае гипотезы подобного типа имеют вид:

H0: Θ Δ0,  (8.6)

где Θ некоторый параметр (вообще говоря, многомерный), от которого зависит исследуемое распределение, а Δ0 — область его конкретных гипотетических значений, которая может состоять всего из одной точки.

Статистическая проверка гипотез о числовых значениях параметров играет важную роль в эконометрическом моделировании, регрессионном анализе, в широком спектре задач статистического исследования зависимостей, существующих между анализируемыми показателями. В частности, принятие решения о включении или исключении той или иной переменной в анализируемую регрессионную (эконометрическую) модель, о наличии-отсутствии статистической связи между наблюдаемыми признаками существенно опирается обычно на проверку гипотез типа (8.6) при Δ0 = 0. Такого же типа гипотезы приходится проверять при установлении факта независимости и стационарности имеющегося ряда наблюдений.

8.1.4.Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками

В п. 8.1.1 речь шла, по существу о подборе подходящей модели для описания закона распределения вероятностей исследуемой случайной величины. Не менее важное место в общем статистическом и эконометрическом анализе занимает проблема подбора подходящей модели, с помощью которой мы можем адекватно описать исследуемую статистическую зависимость между анализируемыми признаками. В качестве гипотетических могут проверяться утверждения о линейном, квадратическом, экспоненциальном, степенном, логарифмическом, полиномиальном и т. п. типе искомой зависимости.

комой зависимости.

Общая логическая схема статистического критерия

По своему назначению и характеру решаемых задач статистические критерии чрезвычайно разнообразны. Однако их объединяет общность логической схемы, по которой они строятся. Коротко эту логическую схему можно описать так.

  1.  Выдвигается гипотеза H0
  2.  Задаются величиной так называемого уровня значимости критерия а. Дело в том, что всякое статистическое решение, т. е. решение, принимаемое на основании ограниченного ряда наблюдений, неизбежно сопровождается некоторой, хотя, возможно, может и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону. Скажем, в какой-то небольшой доле случаев а гипотеза H0 может оказаться отвергнутой, в то время как на самом деле она является справедливой, или, наоборот, в какой-то небольшой доле случаев β мы можем принять нашу гипотезу, в то время как на самом деле она ошибочна, а справедливым оказывается некоторое конкурирующее с ней предположение — альтернативная гипотеза H1. При фиксированном объеме выборочных данных величину вероятности одной из этих ошибок мы можем выбирать по своему усмотрению. Если же объем выборки можно как угодно увеличивать, то имеется принципиальная возможность добиваться как угодно малых вероятностей обеих ошибок а и β при любом фиксированном конкурирующем предположительном утверждении H1. В частности, при фиксированном объеме выборки обычно задаются величиной а вероятности ошибочного отвержения проверяемой гипотезы H0, которую часто называют «основной» или «нулевой». Эту вероятность ошибочного отклонения «нулевой» гипотезы принято называть уровнем значимости или размером критерия. Выбор величины уровня значимости а зависит от сопоставления потерь, которые мы понесем в случае ошибочных заключений в ту или иную сторону: чем весомее для нас потери от ошибочного отвержения высказанной гипотезы H0, тем меньшей выбирается величина а. Однако поскольку такое сопоставление в большинстве практических задач оказывается весьма затруднительным (часто трудно даже вообще сказать, в какую сторону ошибка является для нас более опасной), то, как правило, пользуются некоторыми стандартными значениями уровня значимости. К таким стандартным значениям можно причислить величины а = 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Особенно распространенной является величина уровня значимости а, равная 0,05. Она означает, что в среднем в пяти случаях из 100 мы будем ошибочно отвергать высказанную гипотезу при многократном использовании данного статистического критерия.
  3.  Задаются некоторой функцией от результатов наблюдения (критической статистикой) γ(n) = γ(X1, x2, ... , xn). Эта критическая статистика как и всякая функция от результатов наблюдения, сама является случайной величиной (см. 7.1.2) и в предположении справедливости гипотезы Нo подчинена некоторому хорошо изученному закону распределения с плотностью fγ(n)(u)

Один из основных принципов построения критической статистики (принцип отношения правдоподобия) описан в п. 8.3.1. Поясним здесь лишь общий содержательный смысл этой статистики: как правило, ею определяется мера расхождения имеющихся в нашем распоряжении выборочных данных (8.1) с высказанной (и проверяемой) гипотезой H0. Так, в гипотезах типа рассмотренных в п. 8.1.1 критическая статистика γ определяет меру различия между анализируемой эмпирической функцией распределения F'(n)(x) и гипотетической (модельной) функцией Fмод(х). В гипотезах типа рассмотренных в п. 8.1.2 величина γ(n) измеряет степень расхождения соответствующих выборочных характеристик в различных выборках; в гипотезах типа рассмотренных в п. 8.1.3 — отклонения выборочных характеристик от соответствующих гипотетических значений и т. д.

  1.  Из таблиц распределения fγ(n)(u) находятся 100(1 - a/2) %-ная точка γa/2(min) и 100a/2 %-ная точка γa/2(max) разделяющие всю область мыслимых значений случайной величины γ(n) на три части: область неправдоподобно малых (I), неправдоподобно больших (III) и естественных или правдоподобныхусловиях справедливости гипотезы Н0) значений (II) (рис. 8.1). В тех случаях, когда основную опасность для нашего утверждения представляют только односторонние отклонения, т. е. только «слишком маленькие» или только «слишком большие» значения критической статистики γ(n), находят лишь одну процентную точку: либо 100(1 — а)%-ную точку γa(min) которая будет разделять весь диапазон значений γ(n) на две части: область неправдоподобно малых и область правдоподобных значений; либо 100а%-ную точку γa(,max); она будет разделять весь диапазон значений γ(n) на область неправдоподобно больших и область правдоподобных значений.
  2.  Наконец, в функцию γ(n) подставляют имеющиеся конкретные выборочные данные x1 и подсчитывают численную величину γ(n). Если окажется, что вычисленное значение принадлежит области правдоподобных значений то гипотеза H0 считается не противоречащей выборочным данным. В противном случае, т. е. если γ(n) слишком мала или слишком велика, делается вывод, что γ(n) на самом деле не подчиняется закону fγ(n)(u) (этот вывод, как легко понять, сопровождается вероятностью ошибки, равной а), и это несоответствие мы вынуждены объяснить ошибочностью высказанного нами предположения Я0 и, следовательно, отказаться от него.

Таким образом, решение, принимаемое на основании любого статистического критерия, может оказаться ошибочным как в случае отклонения проверяемой гипотезы H0 (с вероятностью а), так и в случае ее принятия (с вероятностью Р). Вероятности а и β ошибочных решений называют также ошибками соответственно первого и второго рода, а величину 1 - β — мощностью критерия. Очевидно, из двух критериев, характеризующихся одной и той же вероятностью а отвергнуть в действительности правильную гипотезу H0, следует предпочесть тот, который сопровождается меньшей ошибкой второго рода (или большей мощностью).

Рис(доска). График плотности распределения критической статистики γn к выделение областей «правдоподобных» (II) и «неправдоподобных» (I к III), в условиях справедливости гипотезы H0, значений этой статистики

Если проверяемое предположительное утверждение сводится к гипотезе о том, что значение некоторого параметра Θ в точности равно заданной величине ΘО, то эта гипотеза называется простой. В других случаях гипотеза будет называться сложной.


 

А также другие работы, которые могут Вас заинтересовать

40370. Непрерывнотекущая шизофрения 40 KB
  Диапазон ее клинических вариантов по степени прогредиентности чрезвычайно широк от юношеской злокачественной шизофрении до вялотекущей проявляющейся в основном расстройствами неврозоподобного характера. Между этими крайними вариантами непрерывнотекущей шизофрении среднее место занимает параноидная шизофрения отличающаяся средней степенью прогредиентности. При непрерывнотекущей шизофрении наблюдаются экзацербации и послабления процесса нередко констатируется спонтанная или медикаментозная стабилизация однако ремиссии для этой формы...
40371. Параноидная шизофрения 37.5 KB
  Magnan 1891 и характеризующих картину хронического бреда. В стереотипе развития бредовых синдромов в типичных случаях наблюдаются этап бреда не сопровождающегося галлюцинациями и явлениями психического автоматизма паранойяльный синдром этапы параноидного бреда синдром Кандинского Клерамбо и фантастического бреда парафренный синдром [Курашев С. Манифестация болезни проявляется развитием интерпретативного бреда с большей или меньшей степенью систематизации бредовых идей. При бредовом варианте параноидной шизофрении манифестный...
40372. Парафренный синдром 27.5 KB
  Состояние в котором сочетаются фантастический бред величия бред преследования и воздействия явления психического автоматизма изменения аффекта. Содержание фантастического бреда редко бывает постоянным чаще оно склонно к расширению вариациям постоянно обогащается новыми фактами иногда крайне изменчиво. Идеи преследования становятся почти постоянным ингредиентом синдрома в ряде случаев бред бывает антагонистическим: наряду с преследователями врагами существуют силы стоящие на стороне больного. В структуре синдрома значительное место...
40373. Патологическое опьянение 23.5 KB
  Картина патологического опьянения и внешне мало напоминает алкогольное опьянение поскольку отсутствуют нарушения статики и координации движений а также пантомимические особенности характерные для облика опьяневшего человека. По существу патологическое опьянение это транзиторный психоз а в синдромологическом отношении сумеречное состояние сознания. Патологическое опьянение возникает внезапно и так же внезапно обрывается часто заканчиваясь глубоким сном.
40374. Побочные эффекты и осложнения при лечении психотропными средствами. Общие принципы лечения при побочных эффектах и осложнениях психофармакотерапии 54 KB
  Общие принципы лечения при побочных эффектах и осложнениях психофармакотерапии Побочные эффекты и осложнения при лечении психотропными средствами Побочные эффекты при психофармакотерапии как и при использовании многих других лекарственных средств связаны с невозможностью избирательно влиять исключительно на патологически измененные системы мозга. Другие же побочные эффекты и осложнения возникающие обычно редко обусловлены индивидуальными реакциями пациента на тот или иной препарат. В данном разделе будут рассмотрены только наиболее...
40375. Побочные эффекты транквилизаторов и их роль в пограничной психиатрии 46 KB
  Общая характеристика транквилизаторов К основным группам транквилизаторов по химической структуре относятся: 1 производные глицерола мепробамат; 2 производные бензодиазепина элениум диазепам лоразепам феназепам клоназепам альпразолам и многие другие; 3 производные триметоксибензойной кислоты триоксазин; 4 производные азапирона буспирон; 5 производные другой химической структуры амизил гидроксизин оксилидин мебикар мексидол и другие. Выделяют следующие клиникофармакологические эффекты...
40376. Противосудорожные средства 42 KB
  Все противосудорожные средства требуют динамического наблюдения за концентрацией препарата или его метаболита в крови при их применении. Максимальная концентрация в крови достигается через 612 ч после приема разовой дозы препарата. В плазме крови в связи с белками находится у взрослых на 50 у новорожденных детей на 3040. При концентрации в крови 300500 мкг мл развивается седативный эффект.
40377. ПСИХИЧЕСКИЕ НАРУШЕНИЯ, СВЯЗАННЫЕ СО СТРЕССОМ 62.5 KB
  Психические нарушения возникающие в ответ на воздействие острых катастрофических стрессовых факторов острая реакция на стресс острые стрессовые расстройства посттравматическое стрессовое расстройство. Нарушения психического приспособления: этиологические факторы клинические варианты динамика. Психические нарушения реактивного характера легче возникают у лиц ослабленных соматическими заболеваниями имеющих заболевания головного мозга травматического или сосудистого генеза некоторые акцентуации характера или личностные расстройства.
40378. Психические нарушения при интоксикациях лекарственными средствами бытовыми и промышленными токсическими веществами 39.5 KB
  Первые признаки интоксикации заключаются в появлении астении сильной сонливости расстройстве зрения. При атропиновой интоксикации возникают картины делирия с выраженным возбуждением и изменчивым аффектом а также состояния оглушения переходящего в сопор и кому. При хронической интоксикации барбитуратами наблюдаются психопатоподобные состояния с эйфорией расторможенностью расстройствами памяти значительным снижением критики. Психические нарушения близки к расстройствам при интоксикации анилином.