87526

БАЗОВЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Лекция

Социология, социальная работа и статистика

Элементами такого анализа в частности являются: оценка параметров известной функции распределения проверка статистических гипотез о виде распределения и т. Этого недостаточно для полного исследования распределения изучаемого явления. Однако для изучения какого-либо признака генеральной совокупности...

Русский

2015-04-21

1.71 MB

8 чел.

PAGE  27

ЛЕКЦИЯ 2

ЛЕКЦИЯ 2

Базовые понятия математической статистики. Выборочный метод. Числовые характеристики статистических рядов Точечные статистические оценки и требования к ним. Метод доверительных интервалов. Проверка статистических гипотез.

  1.  
    БАЗОВЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
    1. Выборочный метод

В этой главе приводится краткий обзор основных понятий и результатов математической статистики, которые используются в курсе эконометрики.

Одной из центральных задач математической статистики является выявление закономерностей в статистических данных, на базе которых можно строить соответствующие модели и принимать обдуманные решения. Первая задача математической статистики заключается в разработке методов сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных опытов. Вторая задача математической статистики заключается в разработке методов обработки и анализа статистических данных в зависимости от целей исследования. Элементами такого анализа, в частности, являются: оценка параметров известной функции распределения, проверка статистических гипотез о виде распределения и т.д.

Между математической статистикой и теорией вероятностей имеется тесная взаимосвязь. Теория вероятностей широко применяется при статистическом изучении массовых явлений, которые могут и не относится к категории случайных. Это осуществляется через теорию выборочного метода. Здесь вероятностных закономерностям подчиняются не сами изучаемые явления, а методы их исследования. Кроме того, теория вероятностей играет важную роль при статистическом исследовании вероятностных явлений. В этих случаях сами изучаемые явления подчиняются вполне определенным вероятностным закономерностям.

Основной задачей математической статистики является разработка методов получения научно обоснованных выводов о массовых явлениях и процессах из данных наблюдений или экспериментов. Например, нужно провести контроль качества изготовленной партии деталей или исследовать качество технологического процесса. Можно, конечно, провести сплошное обследование, т.е. обследовать каждую деталь партии. Однако если деталей слишком много, то провести сплошное обследование физически невозможно, а если обследование объекта связано с его уничтожением или требует больших затрат, то проводить сплошное обследование не имеет смысла. Поэтому приходится из всей совокупности объектов для обследования отбирать только часть, т.е. проводить выборочное обследование. Таким образом, на практике часто приходится давать оценку параметров большой совокупности по небольшому числу выбранных случайным образом элементов.

Вся подлежащая изучению совокупность объектов называется генеральной совокупностью. Та часть объектов, которая была отобрана из генеральной совокупности, называется выборочной совокупностью или более кратко – выборкой. Договоримся, обозначать объем выборки буквой n, а объем генеральной совокупности буквой N.

Выборка, в общем случае, образуется для оценки каких-либо характеристик генеральной совокупности. Однако не всякая выборка может давать реальное представление о генеральной совокупности. Например, детали, как правило изготовляются рабочими разной квалификации. Если на контроль попадут только детали, изготовленные рабочими более низкой квалификации, то представление о качестве всей продукции будет «заниженным», если только детали, изготовленные рабочими более высокой квалификации, то это представление будет завышенным.

Для того чтобы по данным выборки можно было уверенно судить об интересующем нас признаке генеральной совокупности необходимо, чтобы объекты выборки правильно ее представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Это требование коротко формулируют так: выборка должна быть репрезентативной (или представительной).

Репрезентативность выборки обеспечивается случайностью отбора. При случайном отборе все объекты генеральной совокупности имеют одинаковую возможность попасть в выборку. В этом случае, в силу закона больших чисел, можно утверждать, что выборка будет репрезентативной. Например, о качестве зерна судят по небольшой ее пробе. Хотя число наудачу отобранных зерен мало по сравнению со всей массой зерна, но само по себе оно достаточно велико. Следовательно, характеристики выборочной совокупности будут по вероятности мало чем отличаться от характеристик генеральной совокупности.

Различают повторные и бесповторные выборки. В первом случае отобранный объект перед отбором следующего возвращается в генеральную совокупность. Во втором – отобранный в выборку объект не возвращается в генеральную совокупность. Если объем выборки значительно меньше объема генеральной совокупности, то обе выборки будут практически эквивалентны.

Во многих случаях для анализа тех или иных экономических процессов важен порядок получения статистических данных. Но при рассмотрении так называемых пространственных данных порядок их получения не играет существенной роли. Кроме того, результаты выборочных значений x1, x2, …, xn количественного признака X генеральной совокупности, записанные в порядке их регистрации, обычно труднообозримы и неудобны для дальнейшего анализа. Задачей описания статистических данных является получение такого их представления, которое позволит наглядно выявить вероятностные характеристики. Для этого применяются различные формы упорядочения и группировки данных.

Статистический материал, получающийся в результате наблюдений (измерений) можно записать в виде таблицы, состоящей из двух строк. В первой строке отмечается номер измерения, во втором – полученной значение. Такая таблица называется простым статистическим рядом:

1

2

i

n

x1

x2

xi

xn

Однако при большом числе измерений статистический ряд трудно анализировать. Поэтому результаты наблюдений необходимо каким-либо образом упорядочить. Для этого наблюдаемые значения располагают в порядке их возрастания:

,

где . Такой статистический ряд называется ранжированным.

Поскольку некоторые значения статистического ряда могут иметь одинаковые значения, то их можно объединить. Тогда каждому значению xi будет поставлено в соответствие число ni, равное частоте появлений данного значения:

x1

x2

xk

n1

n2

nk

Такой ряд называется сгруппированным.

Ранжированный и сгруппированный ряд называется вариационным. Наблюдаемые значения xi называются вариантами, а число всех наблюдений варианты niчастотой. Число всех наблюдений n называется объемом вариационного ряда. Отношение частоты ni к объему ряда n называется относительной частотой:

.                                                   (3.1)

Кроме дискретных вариационных рядов, применяются и интервальные вариационные ряды. Для построения такого ряда необходимо определить величину интервалов и в соответствии сними группировать результаты наблюдений:

[x1, x2]

(x2, x3]

(x3, x4]

(xk-1, xk]

n1

n2

n3

nk

Интервальный вариационный ряд строят обычно в тех случаях, когда число наблюдавшихся вариантов очень велико. Обычно такая ситуация возникает при наблюдении за непрерывной величиной (например, измерение какой-либо физической величины). Между интервальными и дискретными вариационными рядами существует определенная взаимосвязь: любой дискретный ряд можно записать в виде интервального и наоборот.

Для графического описания дискретного вариационного ряда использую полигон. Для построения полигона в прямоугольной системе координат наносят точки с координатами (xi,ni) или (xi,wi). Затем эти точки соединяют отрезками. Полученная ломаная линия называется полигоном (см., например, рис. 3.1а).

Для графического описания интервального вариационного ряда используют гистограмму. Для ее построения по оси абсцисс откладывают отрезки, изображающие интервалы варьирования, и на этих отрезках, как на основании, строят прямоугольники с высотами, равными частотам или относительным частотам соответствующего интервала. В результате получается фигура, состоящая из прямоугольников, которая и называется гистограммой (см., например, рис. 3.1б).

а

б

Рис. 3.1

  1. Числовые характеристики статистического ряда

Построение вариационного ряда – лишь первый шаг к осмыслению ряда наблюдений. Этого недостаточно для полного исследования распределения изучаемого явления. Наиболее удобным и полным методом является аналитической способ исследования ряда, состоящий в вычислении числовых характеристик. Числовые характеристики, применяемые для исследования вариационных рядов, аналогичны тем, которые применяются в теории вероятностей.

Наиболее естественной характеристикой вариационного ряда является понятие средней величины. В статистике используют несколько видов средних величин: среднее арифметическое, среднее геометрическое, среднее гармоническое и др. Наиболее распространенным является понятие средней арифметической величины:

.                                              (3.2)

Если по данным наблюдений построен вариационный ряд, то используется понятие средней взвешенной арифметической величины:

.                                    (3.3)

Средняя арифметическая величина обладает теми же самыми свойствами, что и математическое ожидание.

В качестве меры рассеяния значений наблюдаемой величины вокруг своего среднего значения принимают величину

,                            (3.4)

которая, как и в теории вероятностей, называется дисперсией. Величина

                                               (3.5)

называется средним квадратичным отклонением (или стандартным отклонением). Статистическая дисперсия обладает теми же самыми свойствами, что и вероятностная дисперсия, и для ее вычисления можно использовать альтернативную формулу

.                                            (3.6)

Пример 3.1. По территориям региона приводятся данные за 199X г. (таб. 3.1).

Таблица 3.1

Номер
региона

Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x

1

78

2

82

3

87

4

79

5

89

6

106

7

67

8

88

9

73

10

87

11

76

12

115

Найти среднее арифметическое и стандартное отклонение. Постройте полигон частот.

Решение. Для расчета средней арифметической и дисперсии строим расчетную таблицу (табл. 3.2):

Таблица 3.2

x

x2

1

78

6084

2

82

6724

3

87

7569

4

79

6241

5

89

7921

6

106

11236

7

67

4489

8

88

7744

9

73

5329

10

87

7569

11

76

5776

12

115

13225

Сумма

1027

89907

По данным таблицы находим:

,        ,

,      .

Построим полигон частот по исходным данным (рис. 3.2).

Рис. 3.2

Пример 3.2. Получены сгруппированные данные о дневной выручке магазине электротоваров (таб. 3.3).

Таблица 3.3

Сумма продаж, тыс. руб.,
x

Число продаж,
n

0-200

3

200-300

5

300-400

9

400-500

14

500-600

8

600-700

3

Найти среднее арифметическое и стандартное отклонение. Постройте гистограмму частот.

Решение. Для расчета средней арифметической и дисперсии строим расчетную таблицу (табл. 3.4):

Таблица 3.4

xi

ni

ni xi

ni xi2

100

3

300

30000

250

5

1250

312500

350

9

3150

1102500

450

14

6300

2835000

550

8

4400

2420000

650

3

1950

1267500

Сумма

17350

7967500

Здесь вместо xi взяты середины соответствующих интервалов. По данным таблицы находим:

,     ,

,      .

Построим гистограмму частот по исходным данным (рис. 3.3).

Рис. 3.3

  1. Точечные статистические оценки
    1.  Точечные оценки и требования к ним

При осуществлении выборки возможны ошибки наблюдения: ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают из-за неточностей, погрешностей при получении сведений о единицах совокупности, когда истинное значение изучаемого признака не совпадает с его зарегистрированным значением. Например, при переписи, когда люди занижают или завышают свой возраст. Ошибки регистрации могут иметь случайный (непреднамеренный) и систематический (тенденциозный) характер. Их можно избежать при правильной организации и проведении наблюдения.

Ошибки репрезентативности возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Ошибки репрезентативности также бывают систематическими и случайными. Систематические ошибки возникают из-за того, что нарушаются условия случайного отбора. Избежать ошибок репрезентативности нельзя, однако, пользуясь методами теории вероятностей, основанными на использовании предельных теорем, эти ошибки можно свести к минимуму. Способы оценки величины случайной ошибки репрезентативности и составляют основу математической теории выборочного метода.

Числовые характеристики генеральной совокупности будем называть генеральными (или теоретическими) параметрами. Однако генеральная совокупность обычно неизвестна и судить о ней приходится по выборке. Но состав выборки случаен, поэтому и выводы о параметрах генеральной совокупности, сделанные на основании выборочных данных, тоже будут иметь случайный характер. Следовательно, ни при каком объеме выборки, вообще говоря, нельзя получить точное значение неизвестного параметра генеральной совокупности, а можно лишь найти его приближенное значение, которое называется оценкой неизвестного параметра по выборке.

Задача статистической оценки параметров заключается в том, чтобы составить такую выборочную характеристику, которая позволила бы получить по возможности наиболее точное и надежное представление о теоретическом параметре. Однако для изучения какого-либо признака генеральной совокупности нужно знать функцию распределения этого признака. Если вид функции распределения известен, то говорят о параметрической задаче, поскольку любое распределение определяется определенным числом параметров. Так, нормальное распределение определяется двумя параметрами:a и s, распределение Пуассона – одним параметром l и т.д. В этих случаях задача статистической оценки сводится к оценке параметров распределения. Если же нет представлений о виде распределения, то говорить о параметрах распределения не имеет смысла, в этом случае говорят о непараметрических задачах.

Одной из основных характеристик выборки является эмпирическая функция распределения , которая определяется формулой

,                                            (3.7)

где m(x) – число значений среди выборочных значений , меньших x. Функцию распределения признака F(x) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями распределения состоит в том, что теоретическая функция F(x) определяет вероятность события X<x, а эмпирическая функция  определяет относительную частоту этого события.

Пусть F(x;q) – функция распределения величины X, аналитический вид которой известен, но он содержит неизвестный параметр q (для простоты только один). Исследовать все элементы генеральной совокупности для вычисления параметра q не представляется возможным, поэтому об этом параметре приходится судить по выборкам из генеральной совокупности.

Будем предполагать, что мы располагаем выборкой, состоящей из значений , взятой из генеральной совокупности, с функцией распределения F(x;q). Полученные значения можно рассматривать как частную систему значений независимых случайных величин  с одной и той же функцией распределения F(x;q). Величины Xi можно рассматривать как числа (если эксперимент проведен) и как случайные величины (до проведения эксперимента). В дальнейшем мы будем пользовать последней точкой зрения, т.е.  – случайные величины, а  – возможные значения выборки, которые меняются от выборки к выборке.

Пусть

                                         (3.8)

некоторая функция выборочных значений, которую мы хотим использовать в качестве оценки параметра q. Любая функция выборочных значений, которая не зависит от неизвестных параметров, называется статистикой или статистической оценкой параметра q.

Поскольку любая выборка является случайной, то любая ее статистика также является случайной величиной. Следовательно можно говорить о математическом ожидании, дисперсии и функции распределения случайной величины . Интерпретация оценки  как случайной величины позволяет сформулировать свойства, которыми должна обладать статистическая оценка, чтобы ее можно было считать хорошим приближением к неизвестной генеральной характеристике q.

Выбор оценки, т.е. функции (3.8), позволяющей получить «хорошее» приближение оцениваемого параметра, – основная задача статистического оценивания. В связи с этим возникает ряд вопросов: какую статистику можно считать наилучшей или по крайней мере «хорошей», т.е. какие требования нужно предъявить к оценкам. Затем следует решить вопрос о способе получения оценок (точечное оценивание); получив ту или иную оценку, необходимо определить точность полученных приближений (интервальное оценивание).

Для того чтобы выбранная оценка была наилучшей, она должна удовлетворять определенным требованиям, или обладать определенными свойствами. Это свойства состоятельности, несмещенности, эффективности.

Оценка  называется состоятельной оценкой параметра q, если  сходится по вероятности к q при n:

.

Состоятельность оценки означает, что чем больше объем выборки, тем больше вероятность того, что ошибка оценки не превысит сколь угодно малого положительного числа e. Выполнение условия состоятельности гарантирует от грубых ошибок в оценке неизвестного параметра при достаточно больших объемах выборки.

Оценка  называется несмещённой оценкой параметра q, если математическое ожидание  равно оцениваемому  параметру q , т.е.

.

Если это равенство не выполняется, то оценка может быть либо завышенной, либо заниженной. В обоих случаях это приводит к систематическим ошибкам в оценке параметров. Требование несмещенности гарантирует отсутствие систематических ошибок при оценке параметров. Поэтому, во многих случаях естественно требование несмещенности оценки. Однако, если оценка уже является состоятельной, то при большом объеме выборки требованием несмещенности часто пренебрегают. Требование несмещённости особенно важно при малом объеме выборки.

Оценка  называется эффективной в определенном классе оценок параметра q, если она имеет наименьшую дисперсию среди всех возможных оценок того же самого класса оценок параметра q, вычисленных по выборке одного и того же объема:

.

Оценка называется асимптотически эффективной, если с увеличением объема выборки ее дисперсия стремится к нулю, т.е.

.

Справедливо следующее утверждение: если  и  при , то  – состоятельная оценка параметра q.

Оценки, являющиеся линейными функциями от выборочных наблюдений, называются линейными. Очень важную роль в эконометрике играют так называемые наилучшие линейные несмещенные оценки, или коротко BLUE-оценки (Best Linear Unbiased Estimators). Такие оценки, являясь линейными и несмещенными, имеют наименьшую дисперсию среди всех возможных оценок данного класса.

На практике при оценке параметров не всегда удается удовлетворить всем выше рассмотренным требованиям. Так, например, может оказаться, что для простоты расчетов целесообразно использовать незначительно смещенную оценку. Наиболее сложным является вопрос о нахождении эффективных оценок. Поэтому на практике часто используются оценки, которые являются не самыми эффективными.

  1.  Точечные оценки числовых характеристик
    генеральной совокупности
     

На начальном этапе в качестве оценки той или иной характеристики (математического ожидания, дисперсии, и т.п.) берется выборочная числовая характеристика. Затем, исследуя эту оценку, ее уточняют таким образом, чтобы она удовлетворяла описанным выше требованиям.

Доказано, что выборочная средняя

                                                  (3.10)

является состоятельной и несмещенной оценкой математического ожидания  генеральной совокупности. Эта оценка является эффективной в классе линейных несмещенных оценок. В частности, в случае нормального распределения генеральной совокупности: N(a,s), то оценка (3.10) будет асимптотически эффективной с дисперсией

                                               (3.11)

Мы уже отмечали, если объем генеральной совокупности больше объема выборки, то между повторной и бесповторной выборками нет существенной разницы. В противном случае эту разность следует учитывать. В случае бесповторной выборки расчеты несколько усложняются. Это связано с тем, что случайные величины , выражающие значения бесповторной выборки, будут уже зависимыми величинами. Однако здесь также можно показать, что выборочная средняя бесповторной выборки также является состоятельной и несмещенной оценкой генеральной средней (математического ожидания). В случае нормального распределения генеральной совокупности: N(a,s), то оценка также будет асимптотически эффективной с дисперсией

                                        (3.12)

Выборочная дисперсия

                                   (3.13)

является состоятельной, но смещенной оценкой дисперсии  генеральной совокупности, т.к. доказано, что

.

Иными словами, выборочная дисперсия оценивает генеральную дисперсию с недостатком. Хотя при n , и оценка Dвыб является асимптотически несмещенной, в качестве оценки дисперсии s2 лучше брать исправленную дисперсию:

.                            (3.12)

Исправленная дисперсия s2 является состоятельной и несмещенной оценкой дисперсии генеральной совокупности.

Из состоятельности оценок s2 и Dвыб следует, что при больших выборках (обычно при n>50) разности между ними практически нет.

Будет ли несмещенная оценка s2 дисперсии эффективной? Оказывается, что нет. Если выборка взята из нормальной генеральной совокупности N(a;s), то эффективная оценка имеет вид

.

Однако в эту формулу входит математическое ожидание, которое, вообще говоря, неизвестно. Следовательно, в таком случае, эффективной оценки вообще не существует, т.е. нижняя граница не достигается ни при какой несмещенной оценки. Однако существует оптимальная оценка и эта оценка совпадает с s2.

В случае бесповторной выборки можно показать, что

.

Поскольку объем генеральной совокупности N, как правило, очень большой (N1), то дробь , причем это равенство является достаточно точным. Поэтому для повторных выборок можно считать, что математическое ожидание выборочной дисперсии равно .

Выборочная относительная частота (выборочная доля)

где m – число элементов выборки, обладающих заданным признаком, является состоятельной, несмещенной и эффективной оценкой вероятности (генеральной доли)

,

где M – число элементов генеральной совокупности, обладающих заданным признаком. При этом

,     .

  1. Интервальные статистические оценки
    1.  Метод доверительных интервалов

После получения точечной оценки  желательно иметь данные о надежности такой оценки. Понятно, что величина  является лишь приближенным значением параметра q. Вычисленная точечная оценка может быть близка к оцениваемому параметру, а может и очень сильно отличаться от него. Точечная оценка не несет информации о точности процедуры оценивания. Особенно важно иметь сведения о надежности оценок для небольших выборок. В таких случаях следует пользоваться интервальными оценками.

Задачу интервального оценивания в самом общем виде можно сформулировать следующим образом: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри этого интервала находится оцениваемый параметр. Здесь существует несколько подходов. Наиболее распространенным методом интервального оценивания является метод доверительных интервалов1.

Доверительным интервалом для параметра q называется интервал , содержащий неизвестное значение параметра генеральной совокупности с заданной вероятностью g, т.е.

.

Число g называется доверительной вероятностью, а число a=1–g – уровнем надежности. Доверительная вероятность задается априорно и определяется конкретными условиями. Обычно используется g=0,9; 0,95; 0,99 (соответственно, a=0,1; 0,05; 0,01).

Длина доверительного интервала, характеризующая точность интервальной оценки, зависит от объема выборки n и доверительной вероятности g. При увеличении величины n длина доверительного интервала уменьшается, а с приближением вероятности g к единице – увеличивается.

Часто доверительный интервал строят симметричным относительно точечной оценки, т.е. в виде

,                                              (3.15)

или

.

Здесь число D называется предельной (или стандартной) ошибкой выборки. Однако симметричные интервалы не всегда удается построить, более того, иногда приходится ограничиваться односторонними доверительными интервалами:

или .

Поскольку в эконометрических задачах часто приходится строить доверительные интервалы параметров случайных величин, имеющих нормальное распределение, приведем схемы их нахождения.

  1.  Доверительный интервал оценки генеральной
    средней при известной генеральной дисперсии

Пусть количественный признак X генеральной совокупности имеет нормальное распределение с заданной дисперсией s2 и неизвестным математическим ожиданием a. Для оценки параметра a извлечена выборка X1, X2, …, Xn, состоящей из n независимых нормальной распределенных случайных величин с параметрами a и s, причем s известно, а величину a оценивают по выборке:

.

Оценим точность этого приближенного равенства. Для этого зададим вероятность g и попробуем найти такое число D, чтобы выполнялось соотношение

.

Далее воспользуемся свойствами нормального распределения. Известно, что сумма нормально распределенных величин также имеет нормальное распределение. Поэтому средняя величина  имеет нормальное распределение, математическое ожидание и дисперсия которой равны

,     .

Следовательно,

.

Воспользуемся теперь формулой нахождения вероятностей отклонения нормально распределенной случайной величины от математического ожидания:

,

где F(x) – функция Лапласа. Заменяя X на  и s на , получим

,

где . Из последнее равенства находим, что предельная ошибка выборки будет равна

.                                                 (3.16)

Тогда

.

Приняв во внимание, что доверительная вероятность задана и равна g, получим окончательный результат.

Интервальная оценка генеральной средней (математического ожидания) имеет вид

,                                          (3.17)

или более кратко

,                                          (3.18)

где число tg определяется из равенства .

Приведем значения tg для широко распространенных значений доверительной вероятности:

,     ,     .

Обсудим, как влияет на точность оценивания параметра a объем выборки n, величина среднего квадратичного отклонения s, а также значение доверительной вероятности g.

а) При увеличении n точность оценки увеличивается. К сожалению, увеличение точности (т.е. уменьшение длины доверительного интервала) пропорционально , а не 1/n, т.е. происходит гораздо медленнее, чем рост числа наблюдений. Например, если мы хотим увеличить точность выводов в 10 раз чисто статистическими средствами, то мы должны увеличить объем выборки в 100 раз.

б) Чем больше s, тем ниже точность. Зависимость точности от этого параметра носит линейный характер.

в) Чем выше доверительная вероятность g, тем больше значение параметра tg, т.е. тем ниже точность. При этом между g и tg существует нелинейная связь. С увеличением g значение tg резко увеличивается ( при ). Поэтому с большой уверенностью (с высокой доверительной вероятностью) мы можем гарантировать лишь относительно невысокую точность. (Доверительный интервал окажется широким.) И наоборот: когда мы указываем для неизвестного параметра a относительно узкие пределы, мы рискуем совершить ошибку – с относительно высокой вероятностью.

Отметим, что величина

                                                    (3.19)

называется средней ошибкой выборки. Для бесповторной выборки эта формула примет вид

.                                             (3.20)

Тогда предельная ошибка выборки D будет представлять собой t-кратную среднюю ошибку:

.

Пример 3.7. На основе продолжительных наблюдений за весом X пакетов орешков, заполняемых автоматически, установлено, что среднее квадратичное отклонение веса пакетов равно s=10 г. Взвешено 25 пакетов, при этом их средний вес составил . В каком интервале с надежностью 95% лежит истинное значение среднего веса пакетов?

Решение. Логично считать, случайная величина X имеет нормальный закон распределения: . Найдем среднюю ошибку выборки

.

Для определения 95%-го доверительного интервала вычислим предельную ошибку выборки

.

Следовательно 95%-й доверительный интервал для истинное значение среднего веса пакетов будет иметь вид

,

или

.

На первый взгляд может показаться, что полученный результат представляет только теоретический результат, поскольку среднее квадратичное отклонение s, как правило, тоже неизвестно и вычисляется по выборочным данным. Однако если выборка достаточно большая, то полученный результат вполне приемлем для практического использования, поскольку функция распределения  будет мало отличаться от нормальной, а оценка дисперсии s2 будет достаточно близка к истинному значению s2. Более того, полученный результат часто используют и  в том случае, когда распределение генеральной совокупности отличается нормального. Это обусловлено тем, что сумма независимых случайных величин, в силу центральной предельной теоремы, при больших выборках имеет распределение, близкое к нормальному.

Пример 3.8. Предположим, что в результате выборочного обследования жилищных условий жителей города на основе собственно-случайной повторной выборки, получен следующий вариационный ряд:

Таблица 3.5

Общая (полезная) площадь
жилищ, приходящихся на 1 чел.,
м2

До 5,0

5,0–10,0

10,0–15,0

15,0–20,0

20,0–25,0

25,0–30,0

30,0 и более

Число жителей

8

95

204

270

210

130

83

Построить 95%-доверительный интервал для изучаемого признака.

Решение. Рассчитаем выборочную среднюю величину и дисперсию изучаемого признака.

Таблица 3.6

Общая площадь жилищ, приходящаяся на 1 чел., м2

Число жителей, ni

Середина интервала, xi

До 5,0

8

2,5

20,0

50,0

5,0–10,0

95

7,5

712,5

5343,8

10,0–15,0

204

12,5

2550,0

31875,0

15,0–20,0

270

17,5

4725,0

82687,5

20,0–25,0

210

22,5

4725,0

106312,5

25,0–30,0

130

27,5

3575,0

98312,5

30,0 и более

83

32,5

2697,5

87668,8

Итого

1000

19005,0

412250,0

Тогда

;     ;     .

Средняя ошибка выборки составит

.

Определим предельную ошибку выборки с вероятностью 0,95 ():

.

Установим границы генеральной средней

,

или

.

Таким образом, на основании проведенного выборочного обследования с вероятностью 0,95 можно заключить, что средний размер общей площади, приходящейся на 1 чел., в целом по городу лежит в пределах от 18,6 до 19,4 м2.

  1.  Доверительный интервал оценки генеральной
    средней при неизвестной генеральной дисперсии

Выше была решена задача построения интервальной оценки для математического ожидания нормального распределения, когда его дисперсия известна. Однако на практике дисперсия обычно тоже неизвестна и ее вычисляют по той же самой выборке, что и математическое ожидание. Это приводит к необходимости использования другой формулы при определении доверительного интервала для математического ожидания случайной величины, имеющей нормальное распределение. Такая постановка задачи особенно актуальна при малых объемах выборки.

Пусть количественный признак X генеральной совокупности имеет нормальное распределение N(a,s), причем оба параметра a и s неизвестны. По данным выборки X1, X2, …, Xn, вычислим среднее арифметическое и исправленную дисперсию:

,     .

Для нахождения доверительного интервала в этом случае строится статистика

,                                               (3.21)

имеющая распределение Стьюдента с числом степеней свободы n=n–1 независимо от значений параметров a и s. Выбрав доверительную вероятность g и зная объем выборки n, можно найти такое число t, что будет выполняться равенство

,

или

.

Отсюда находим

интервальную оценку для генеральной средней (математического ожидания) при неизвестном s:

,                                          (3.22)

или более кратко

.                                          (3.23)

Число t (коэффициент Стьюдента) находится из таблиц для распределения Стьюдента. Отметим, что он является функцией двух аргументов: доверительной вероятности g и числа степеней свободы k=n–1, т.е. t=t(g,n).

Следует быть очень внимательным при использовании таблиц для распределения Стьюдента. Во-первых, обычно в таблицах вместо доверительной вероятности g используют уровень надежности a=1–g. Во-вторых, очень часто в таблицах приводятся значения т.н. одностороннего критерия Стьюдента

,   или   .

В этом случае в таблицах следует брать значения , если в таблице используется уровень надежности, или , если в таблице используется доверительная вероятность.

Несмотря на кажущееся сходство формул (3.17) и (3.22), между ними имеется существенное различие, заключающееся в том, что коэффициент Стьюдента t зависит не только от доверительной вероятности, но и от объема выборки. Особенно это различие заметно при малых выборках. (Напомним, что при больших выборках различие между распределением Стьюдента и нормальным распределением практически исчезает.) В этом случае использование нормального распределения приводит к неоправданному сужению доверительного интервала, т.е. к неоправданному повышению точности. Например, если n=5 и g=0,99, то, пользуясь распределением Стьюдента, получим t=4,6, а используя нормальное распределение, – t=2,58, т.е. доверительный интервал в последнем случае почти в два раза уже, чем интервал при использовании распределения Стьюдента.

Пример 3.9. Аналитик фондового рынка оценивает среднюю доходность определенных акций. Случайная выборка 15 дней показала, что средняя (годовая) доходность  со средним квадратичным отклонением . Предполагая, что доходность акций подчиняется нормальному закону распределения, постройте 95%-доверительный интервал для средней доходности интересующего аналитика вида акций.

Решение. Поскольку объем выборки n=15, то необходимо применить распределение Стьюдента с  степенями свободы. По таблицам для распределения Стьюдента находим

.

Используя это значение, строим 95%-доверительный интервал:

,

или

.

Следовательно, аналитик может быть на 95% уверен, что средняя годовая доходность по акциям находится между 8,44% и 12,3%.

  1.  Доверительный интервал оценки генеральной дисперсии

Построение доверительного интервала для дисперсии нормально распределенной генеральной совокупности основывается на том, что случайная величина:

                                              (3.24)

имеет c2-распределение Пирсона c n=n–1 степенями свободы. Зададим доверительную вероятность g и определим числа  и  из условия

.

Числа  и , удовлетворяющие этому условию, можно выбрать бесчисленным числом способов. Один из способов состоит в следующем

,

т.е.

    и     .

Значения чисел  и  определяются из таблиц для распределения Пирсона. После этого образуем неравенство

В результате получаем следующую интервальную оценку дисперсии генеральной совокупности:

.                                       (3.25)

Иногда это выражение записывают в виде

,                                       (3.26)

или

,                                                (3.27)

где для коэффициентов  и  составляют специальные таблицы.

Пример 3.10. На фабрике работает автоматическая линия по фасовке растворимого кофе в жестяные 100-граммовые банки. Если средняя масса наполняемых банок отличается от точной, то линии налаживается для подгонки средней массы в рабочем режиме. Если дисперсия массы превышает заданное значение, то линия должна быть остановлена на ремонт и переналадку. Время от времени производится отбор банок с кофе для проверки средней массы и ее колеблемости. Предположим, что с линии в случайном порядке производится отбор банок с кофе и оценка дисперсии s2=18,540. Постройте 95%-й доверительный интервал для генеральной дисперсии s2.

Решение. Предполагая, что генеральная совокупность имеет нормальное распределение, воспользуемся формулой (3.26). По условию задачи уровень значимости a=0,05 и a/2=0,025. По таблицам для c2-распределение Пирсона с n=n–1=29 степенями свободы находим

    и     .

Тогда доверительный  интервал для s2 можно записать в виде

,

или

.

Для средне квадратичного отклонения ответ будет иметь вид

.

  1. Проверка статистических гипотез
    1.  Основные понятия

Большинство эконометрических моделей требует многократного улучшения и уточнения. Для этого необходимо проведение соответствующих расчетов, связанных с установлением выполнимости или невыполнимости тех или иных предпосылок, анализом качества найденных оценок, достоверностью полученных выводов. Поэтому знание основных принципов проверки гипотез является обязательным в эконометрике.

Во многих случаях необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид, то выдвигают гипотезу: генеральная совокупность распределена по этому закону. Например, можно выдвинуть предположение, что доход населения, ежедневное количество покупателей в магазине, размер выпускаемых деталей имеют нормальный закон распределения.

Возможен случай, когда закон распределения известен, а его параметры нет. Если есть основания предположить, что неизвестный параметр q равен ожидаемому числу q0, то выдвигают гипотезу: q=q0. Например, можно выдвинуть предположение о величине среднего дохода населения, среднего ожидаемого дохода по акциям, о разбросе в доходах и т.д.

Под статистической гипотезой H понимают любое предположение о генеральной совокупности (случайной величине), проверяемое по выборке. Это может быть предположение о виде распределения генеральной совокупности, о равенстве двух выборочных дисперсий, о независимости выборок, об однородности выборок, т.е. что закон распределения не меняется от выборки к выборке и др.

Гипотеза называется простой, если она однозначно определяет какое-либо распределение или какой-либо параметр; в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина X распределена по стандартному нормальному закону N(0;1); если же высказывается предположение, что случайная величина X имеет нормальной распределение N(m;1), где amb, то это сложная гипотеза.

Проверяемая гипотеза называется основной или нулевой гипотезой и обозначается символом H0. Наряду с основной гипотезой рассматривают и противоречащую ей гипотезу, которую обычно называют конкурирующей или альтернативной гипотезой и обозначают символом H1. Если основная гипотеза будет отвергнута, то имеет место альтернативная гипотеза. Например, если проверяется гипотеза о равенства параметра q некоторому заданному значению q0, т.е. H0:q=q0, то в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез: H1:q>q0, H2:q<q0, H3:qq0, H4:q=q1. Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверка осуществляется статистическими методами, то в связи с этим с определенной долей вероятности может быть принято неправильное решение. Здесь могут быть допущены ошибки двух видов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода обозначают буквой a, т.е.

.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают буквой b, т.е.

.

Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая – к неоправданному риску. Что лучше или хуже – зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если H0 состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, последствия этой ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.

Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, т.к. задачи их уменьшения являются конкурирующими. И снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения обеих вероятностей  состоит в увеличении объема выборки.

Правило, в соответствие с которым принимается или отклоняется основная гипотеза, называется статистическим критерием. Для этого подбирается такая случайная величина K, распределение которой точно или приближенно, известно и которая служит мерой расхождения между опытными и гипотетическими значениями.

Для проверки гипотезы по данным выборки вычисляют выборочное (или наблюдаемое) значение критерия Kнабл. Затем, в соответствии с распределением выбранного критерия, строится критическая область Kкрит. Это такая совокупность значений критерия, при которых нулевую гипотезу отвергают. Оставшуюся часть возможных значений называют областью принятия гипотезы. Если ориентироваться на критическую область, то можно совершить ошибку
1-го рода, вероятность которой задана заранее и равна
a, называемой уровнем значимости гипотезы. Отсюда вытекает следующее требование к критической области Kкрит:

.

Уровень значимости a определяет "размер" критической области Kкрит. Однако ее положение на множестве значений критерия зависит от вида альтернативной гипотезы. Например, если проверяется нулевая гипотеза H0:q=q0, а альтернативная гипотеза имеет вид H1:q>q0, то критическая область будет состоять из интервала (K2, +), где точка K2 определяется из условия P(K>K2)=a (правосторонняя критическая область). Если альтернативная гипотеза имеет вид H2:q<q0, то критическая область будет состоять из интервала (–;K1), где точка K1 определяется из условия P(K<K2)=a (левосторонняя критическая область). Если альтернативная гипотеза имеет вид H3:qq0, то критическая область будет состоять из двух интервалов (–;K1) и (K2, +), где точки K1 и K2 определяются из условий: P(K>K2)=a/2 и P(K<K2)=a/2 (двухсторонняя критическая область).

Основной принцип проверки статистических гипотез можно сформулировать следующим образом. Если Kнабл попадает в критическую область, то гипотеза H0 отвергается и принимается гипотеза H1. Однако поступая таким образом, следует понимать, что здесь можно допустить ошибку 1-го рода с вероятностью a. Если Kнабл попадает в область принятия гипотезы – то нет оснований, чтобы отвергать нулевую гипотезу H0. Но это вовсе не означает, что H0 является единственно подходящей гипотезой: просто расхождения между выборочными данными и гипотезой H0 невелико; однако таким же свойством могут обладать и другие гипотезы.

Мощностью критерия называется вероятность того, что нулевая гипотеза будет отвергнута, если верна альтернативная гипотеза; т.е. мощность критерия равна 1–b, где b – вероятность совершить ошибку 2-го рода. Пусть для проверки гипотезы принят определенный уровень значимости a и выборка имеет фиксированный объем. Поскольку в выборе критической области есть определенный произвол, то ее целесообразно строить так, чтобы мощность критерия была максимальной или чтобы вероятность ошибки 2-го рода была минимальной.

Критерии, используемые для проверки гипотез о параметрах распределения, называются критериями значимости. В частности, построение критической области аналогично построению доверительного интервала. Критерии, используемые для проверки согласия между выборочным распределением и гипотетическим теоретическим распределением, называются критериями согласия.

  1.  Проверка гипотез о числовых значениях параметров

Остановимся теперь на примерах статистических критериев, при этом важные критерии относящиеся к корреляционно-регрессионному анализу будут обсуждаться в соответствующих разделах. Здесь мы опишем несколько примеров статистических критериев, предназначенных для проверки простых статистических гипотез относительно числовых параметров анализируемых законов распределения вероятностей.

Общая схема статистической проверки гипотез:

  1.  Формулируется основная H1 и альтернативная H1 гипотезы.
  2.  Выбирается соответствующий уровень значимости a.
  3.  Определяется объем выборки n.
  4.  Выбирается критерий K для проверки H0.
  5.  Строится критическая область и область принятия гипотезы (в соответствии с выбранной альтернативной гипотезой).
  6.  Вычисляется наблюдаемое значение критерия Kнабл (по данным выборки).
  7.  Принимается статистическое решение (если Kнабл попадает в область принятия решений, то нет оснований отклонять основную гипотезу, т.е. она принимается, если Kнабл попадает в критическую область, то основная гипотеза отвергается).

Критерии проверки гипотез о числовых значениях параметров нормального распределения приведены в таблице 3.

Таблица 3.7

H0

Предположения

Статистика критерия

H1

Область
принятия решения

a=a0

s2

известно

aa0

a>a0

a<a0

s2

неизвестно

aa0

a>a0

a<a0

a

неизвестно

Проверка статистических гипотез с использованием критериев значимости может быть проведена на основе доверительных интервалов. Для всех параметрических гипотез Для всех параметрических гипотез область принятия гипотезы H0: q=q0 на уровне значимости a совпадает с доверительным интервалом для параметра q при доверительной вероятности 1–a. При этом одностороннему критерию значимости соответствует односторонний доверительный интервал, а двухстороннему критерию значимости – двухсторонний доверительный интервал. Гипотеза H0 принимается, если значение q0 накрывается соответствующим доверительным интервалом; в противном случае гипотеза H0 отвергается.

Если проверяется гипотеза H0:q=q0, то рассматривается доверительный интервал для разности q1q2. Гипотеза принимается, если доверительный интервал для разности параметров q1q2 накрывает нулевые значения. Для проверки гипотезы о равенстве двух дисперсий H0: строится доверительный интервал для отношения дисперсий . В этом случае гипотеза H0 принимается, если доверительный интервал накрывает значение, равное единице.

Пример 3.11. Утверждается, что шарики, изготовленные станком-автоматом, имеют средний диаметр d0=10 мм. В выборке из n=16 шариков средний диаметр оказался равным  мм. Проверить нулевую гипотезу H0: , считая, что дисперсия известна и равна s2=1 мм2. Считать уровень значимости a=0,05.

Решение. Введем статистический критерий:

,

который при справедливости нулевой гипотезы H0, имеет стандартное нормальное распределениеN(0;1). Пусть альтернативная гипотеза имеет вид H1: , то критическая область будет иметь двухсторонний вид: (–;–Zкрит)(Zкрит;+), где Zкрит определяется из условия

,

или

.

Поскольку 

не попадает в критическую область, то нет оснований отклонять нулевую гипотезу, т.е. что шарики, изготовленные станком-автоматом, имеют средний диаметр 10 мм.

Данную задачу можно решить и при помощи доверительных интервалов. Мы уже разбирали, что доверительный интервал для нормального случайной величины при известном s имеет вид

.

Поскольку t0,95=1,96, то

.

Так как d0=10(9,84; 10,76), то гипотеза H0 принимается. 

Пример 3.12. Анализируется доход X фирм в отрасли, имеющей нормальное распределение. Предполагается, что средний доход в данной отрасли составляет не менее 1 млн $. По выборке из 49 фирм получены следующие данные:  млн $ и s=0,15 млн $. Не противоречат ли эти результаты выдвинутой гипотезе при уровне значимости a=0,01?

Решение. Сформулируем основную и альтернативную гипотезы:

,     .

Для проверки гипотезы H0 строим критерий

.

Критическая область будет левосторонней, поэтому

.

Поскольку Tнабл=–4,67<–2,404=Tкрит, то H0 должна быть отклонена в пользу H1, что дает основание считать, что средний доход в отрасли меньше, чем 1 млн $. 

Пример 3.13. Точность работы станка-автомата, заполняющего пакеты порошком, определяется совпадением веса пакетов. Дисперсия веса не должна превышать 25 г2. По выборке из 20 пакетов определена дисперсия s2=30 г2. Определите, требуется ли срочная наладка станка на уровне значимости a=0,05.

Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:

,     .

Рассчитаем наблюдаемое значение критерия

.

Найдем критическое значение критерия

.

Так как , то нет оснований отклонять основную гипотезу H0, т.е. имеющиеся данные не дают основания считать, что станок требует срочной наладки. 

  1.  Проверка гипотез о сравнении параметров
    генеральной совокупности

При анализе многих экономических показателей приходится сравнивать две генеральные совокупности. Например, можно сравнивать уровни жизни в двух странах по размеру дохода на душу населения; можно сравнивать два варианта инвестирования по размерам средних дивидендов; качество знаний студентов двух университетов – по среднему баллу на комплексном тестовом экзамене. В этих случаях логично провести сравнение по схеме анализа равенства математических ожиданий двух генеральных совокупностей X и Y.

Рассмотрим две случайные величины X~N(a1,s1) и Y~N(a2,s2), каждая из которых подчиняется нормальному закону распределения. Пусть имеются две независимые выборки с объемами n1 и n2 из генеральных совокупностей X и Y. Необходимо проверить нулевую гипотезу H0: M[X]=M[Y]. Нулевая гипотеза в приведенной формулировке является сложной, поскольку она справедлива при любых a=M[X]=M[Y], однако она может быть сведена к простой, если рассматривать разность средних, т.е. H0: M[X]–M[Y]=0.

Относительно параметров  и  можно выделить четыре варианта предположений:

  1.  обе дисперсии известны и равны между собой;
  2.  обе дисперсии известны, но неравны между собой ;
  3.  обе дисперсии неизвестны, но предполагается, что они равны между собой;
  4.  обе дисперсии неизвестны и их равенство не предполагается.

Критерии проверки гипотез о числовых значениях параметров нормального распределения приведены в таблице 3.8. Отметим, что в таблице 3.8 вариант a) рассматривается как частный случай варианта b). В случае неизвестных дисперсий, равенство которых не предполагается, используется аналог статистики варианта b) с заменой неизвестных дисперсий их оценками

.                                                             (3.29)

В этой ситуации указать точное распределение введенной статистики затруднительно. Известно, однако, что это распределение близко к распределению Стьюдента с числом степеней свободы, равным

.                                                  (3.30)

Критерий проверки устроен так же, как и для варианта c).

Таким образом, для выбора подходящей проверочной статистики в случае, когда генеральные дисперсии неизвестны, необходимо знать, какое предположение принимается. Прежде всего нужно решить, можно ли считать неизвестные генеральные дисперсии равными или нет. Для принятия решения используют F-критерий Фишера (см. далее).

Таблица 3.9

H0

Предположения

Статистика критерия

H1

Область
принятия решения

a1=a2

,

известны

a1a2

a1>a2

a1<a2

,

неизвестны, но равны

, где

a1a2

a1>a2

a1<a2

Зачастую при сравнении двух экономических показателей на первый план выходит анализ разброса значений рассматриваемых случайных величин. Например, при решении вопроса об инвестировании в одну из двух отраслей остро стоит проблема риска вложений. При сравнении уровней жизни в двух странах среднедушевые доходы могут оказаться приблизительно равными. Сопоставив разброс в доходах, мы получаем более точное представление о них. Анализ, аналогичный описанному выше, целесообразно проводить путем сравнения дисперсий исследуемых случайных величин.

Пусть X~N(a1,s1) и Y~N(a2,s2), причем их средне квадратичные отклонения s1 и s2 неизвестны. Выдвигается гипотеза о равенстве дисперсий . Однако это гипотеза в приведенной формулировке является сложной, поэтому вместо этой гипотезы рассматривается другая, простая гипотеза об отношении дисперсий, т.е. .

В качестве критерия проверки гипотезы H0 принимают случайную величину

,                                                    (3.31)

определяемую отношение большей исправленной выборочной дисперсии к меньшей (). Если нулевая гипотеза H0 верна, то данная статистика имеет F-распределение Фишера с n1=n1–1 и n2=n2–1 степенями свободы. Различные случаи использования этого критерия Фишера приведены в таблице 3.8.

Таблица 3.8

H0

Предположения

Статистика критерия

H1

Область
принятия решения

a1, a2

неизвестны

, ()

Пример 3.14. Компания по производству сахарного песка имеет производственные линии для наполнения мешочков сахарным песком по 1 кг. Используя данные, собранные в течение долгого периода времени, управляющий оценивает генеральное стандартное отклонение массы мешочков, поставляемых с линии А в 0,02 кг (s1) и с линии B в 0,04 кг (s2). Из линии A была взята случайная выборка объемом n1=10 мешочков и найдена средняя масса содержимого в мешочках . Подобная выборка объемом n2=12 мешочков была взята из линии B и найдена средняя масса . Имеется ли какое-нибудь основание предполагать, что две производственные линии развешивают сахарный песок по мешочкам, средняя масса которых отличается?

Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:

,     .

Поскольку генеральные дисперсии ( и ) известны, проверим существенность разности между выборочными средними, используя нормальное распределение на уровне значимости a=0,01. Вычисляем наблюдаемое значение критерия

Поскольку критическая область имеет двухсторонний вид, то критическое значение критерия будет определяется из условия

,

или

.

В результате получаем, что |Zнабл|<Zкрит, т.е. нет оснований отклонять нулевую гипотезу. Следовательно, можно полагать, что мешочки, наполненные сахаром на двух производственных линиях, имеют одинаковую среднюю массу. 

Пример 3.15. Для исследования качества масла были сделаны выборки по 10 единиц из каждой последовательной серии (n1 и n2) и определена доля воды в процентах x в каждой выборке. В первой серии средний процент составил  с исправленным средним квадратичным отклонением . Для второй серии средний процент воды составил  со средним квадратичным отклонением . Имеются ли основания предполагать на 5%-ом уровне значимости, что две серии масла имеют различную массовую долю воды?

Решение. Сформулируем основную и альтернативную гипотезы, соответствующие условию задачи:

,     .

Поскольку генеральные дисперсии ( и ) неизвестны, то следует предварительно проверить о равенстве генеральных дисперсий, т.е. проверяем нулевую гипотезу с соответствующей альтернативной гипотезой:

,     .

наблюдаемое значение критерия Фишера:

.

Здесь учено, что . Поскольку, в соответствии с выбранной альтернативной гипотезой, критическая область будет двухсторонней, то определяет критической значение критерия Фишера:

В результате получаем, что Fнабл<Fкрит, т.е. нет оснований отклонять нулевую гипотезу. Следовательно, можно полагать, что две генеральные дисперсии раны друг другу.

Продолжим теперь испытание гипотез о равенстве двух генеральных средних. Для этого вычислим наблюдаемое значение соответствующего критерия Стьюдента:

,

.

Поскольку критическая область также будет двухсторонней, то соответствующая критическое значение критерия Стьюдента будет равно:

.

В результате получаем, что Tнабл>Tкрит, т.е. нулевая гипотеза отклоняется. Следовательно, можно полагать, что две серии проб имеют разное содержание воды (по массе).

Дополнение 1.
МЕТОД МОМЕНТОВ

Выше мы рассмотрели методы оценки числовых характеристик генеральной совокупности, не привязываясь к какой-либо функции распределения. Однако для полного описания генеральной совокупности нужно знать  ее функцию распределения. Если известен вид функции распределения, то остается оценить  только ее параметры. Для определения используются различные методы. Один из них – метод моментов, который заключается в следующем. Определяются выборочные моменты (например, математическое ожидание, дисперсию) в количестве, равном числу оцениваемых параметров, и приравниваются соответствующим теоретическим моментам распределения, являющихся функциями от неизвестных параметров.

Пример 3.16. Найти методом моментов оценки параметров a и s нормального распределения:

.

Решение. Для отыскания двух параметров необходимо иметь два уравнения относительно этих параметров. Следуя методу моментов, приравняем, например, начальный теоретический момент 1-го порядка (математическое ожидание): эмпирическому моменту 1-го порядка (среднему значению): , а также центральный теоретический момент
2-го порядка (дисперсию):  центральному моменту 2-го порядка (исправленной выборочной дисперсии): . В результате получаем два уравнения:

,     ,

из которых и находим искомые оценки. 

Пример 3.17. Найти методом моментов оценку параметра l распределения Пуассона:

,

где , l>0.

Решение. Задачу решим двумя способами.

а) Сравним начальные моменты 1-го порядка, т.е. математические ожидания: Поскольку для распределения Пуассона , то получим

.

б) Сравним начальные моменты 2-го порядка. Для распределения Пуассона , тогда . Тогда

.

Оценки разные. По смыслу параметра распределения Пуассона лучше предпочесть первую оценку.

Как мы видим, неопределенность выбора начальных моментов приводит к получению различных оценок для одного и того же параметра. Однако метод моментов, как правило, приводит к состоятельным оценкам. Это означает, что при достаточно больших выборках различие между разными оценками будет незначительным. Недостаток метода моментов заключается в том, что его оценки (за редким исключением) – неэффективны. Поэтому метод моментов используется на практике только как первое приближение, основываясь на которых можно получить более эффективные оценки. Популярность метода моментов состоит в том, что уравнения метода моментов во многих случаях являются достаточно простыми и их решение не связано большими математическими трудностями. 

Дополнение 2.
МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ

Как мы видели, разные методы оценивания одних и тех же параметров распределения могут давать разные результаты. Когда есть несколько путей к одной цели, естественно, хочется выбрать наилучший. При определенных ограничениях таким методом является метод максимального правдоподобия, основанный на оптимальном использовании имеющейся в выборке информации о параметрах распределения.

Пусть X1, X2, …, Xn возможные результаты независимых наблюдений случайной величины X. Это означает, что X1, X2, …, Xn – независимые случайные величины, причем закон распределения любой из них совпадает с законом распределения величины X. Допустим, что вид распределения величины X задан, но неизвестен параметр q, которым определяется этот закон. Введем функцию

,                         (3.13)

где  в случае исходного непрерывного распределения интерпретируется как плотность распределения случайной величины Xi, а дискретном случае – как вероятность того, что случайная величина Xi примет значение xi. Функцию  от случайных величин Xi, рассматриваемую как функцию параметра q, называют функцией правдоподобия.

Оценкой метода максимального правдоподобия (ММП-оценкой) параметра q называется такое значение , при котором функция правдоподобия достигает наибольшего возможного значения:

.

Известно, что точка максимума не изменится, если вместо L(q) использовать lnL(q). Тогда, в соответствии с необходимым условием экстремума функции, получим следующие уравнения правдоподобия:

,                                  (3.14)

для нахождения оценки параметра q.

Пример 3.18. Найти методом максимального правдоподобия оценки параметров a и s нормального распределения.

Решение. Согласно формуле (3.13), функция правдоподобия для нормального распределения будет иметь вид

.

Логарифмируя ее, получим

.

Найдем частные производные по a и s:

,       .

Приравнивая частные производные нулю, получим систему уравнений:

Из этих уравнений находим:

  и   .

Установлено, что оценка  является состоятельной, несмещенной и эффективной оценкой параметра a, а оценка  – состоятельной, смещенной и асимптотически эффективной оценкой параметра s2.

Пример 3.19. Найти методом максимального правдоподобия оценку параметра l распределения Пуассона.

Решение. Логарифмическая функция правдоподобия в данном случае, построенная по выборке x1,x2,…,xn, будет иметь вид

.

Отсюда после дифференцирования по l получаем уравнение максимального правдоподобия

.

Отсюда

.

Установлено, что эта оценка является состоятельной, несмещенной и эффективной оценкой параметра l.

Показано, что ММП-оценки являются состоятельными, асимптотически несмещенными, асимптотически нормальными и асимптотически эффективными. Все это сделало метод максимального правдоподобия весьма популярным. Было открыто, что для многих задач самой различной статистической природы ММП дает хорошие результаты. Единственная трудность состоит в сложности решения уравнений правдоподобия (3.14). Поэтому очень долгое время ММП применялся только для теоретических расчетов. Однако в настоящее время в современные статистические пакеты для ЭВМ начинают включать методы ММП, что сильно упрощает практическое использование ММП.

Не следует думать, что ММП-оценки будут наилучшими во всех ситуациях. Во-первых, их хорошие свойства проявляются часто лишь при очень больших объемах выборки (т.е. являются асимптотическими), так что при малых n с ними могут конкурировать (и даже превосходить их) другие методы. Во-вторых, и это, пожалуй, главное «узкое место» данного подхода, для построения ММП-оценок и обеспечения их хороших свойств необходимо точное знание типа анализируемого закона распределения f(x;q), что в большинстве случаев оказывается практически нереальным. Часто бывает так, что при определенных, хотя и небольших, отклонениях реального распределения от принятого распределения f(x;q), оценки могут резко терять свои «хорошие» свойства. В связи с этим, в последние годы развиваются т.н. робастные, или устойчивые, методы оценивания, позволяющие находить оценки, хотя и не являющиеся наилучшими в рамках предполагаемого закона распределения, но обладающие достаточно устойчивыми свойствами при отклонении реального закона от предполагаемого. И, в-третьих, ММП-оценки могут не быть даже состоятельными, если число оцениваемых по выборке параметров велико (имеет тот же порядок, что и объем выборки) и растет с увеличение числа наблюдений.

Дополнение 3.
КРИТЕРИИ СОГЛАСИЯ

Часто функция распределения случайной величины бывает заранее неизвестна, и возникает необходимость ее определения по эмпирическим данным. Во многих случаях из некоторых дополнительных соображений могут быть сделаны предположения о виде функции распределения F(x). В эконометрике часто используют нормальное распределение, однако в некоторых случаях может возникнуть вопрос о законности использования нормального распределения в том или ином конкретном случае. В таких случаях нужно использовать статистические критерии, которые обосновывали тот или иной выбор распределения.

Любое предположение о виде распределения называется статистической гипотезой и математически выражается соотношением {F(x)H0}, где H0 – какое-то множество функций распределения. Если множество H0 состоит из одного элемента, то гипотеза называется простой. При статистической проверке основной гипотезы H0 формулируют также альтернативную гипотезу {F(x)H1}, где H1 –множество функций распределения, не пересекающееся с множеством H0. Если H1 – множество всех F(x), не входящих в H0, то это множество обычно вообще не упоминают. Множества H0 и H1 в каждой задаче определяются логическими, физическими и другими условиями задачи.

Рассмотрим случай простой гипотезы {F(x)=Fтеор(x)}. Пусть X1, X2, …, Xn – случайная выборка случайной величины X, и пусть  – эмпирическая функция распределения. Определим некоторую неотрицательную меру D отклонения эмпирической функции распределения  от предполагаемой теоретической функции распределения Fтеор(x). Величину D=D{F(x),Fтеор(x)} можно определить многими способами, в соответствии с которыми получаются различные критерии для проверки интересующей нас гипотезы: критерий хи-квадрат Пирсона, Колмогорова, омега-квадрат Мизеса, Смирнова и другие.

Наиболее распространенным является критерий, введенный К. Пирсоном, приводящий к распределению 2 (2–критерий Пирсона). Рассмотрим этот критерий. Для этого разобьем множество значений случайной величины X на r интервалов S1, S2, … ,Sr без общих точек. Пусть pi – вероятность того, что величина X принадлежит интервалу Si; ni – количество величин из числа наблюдаемых X2, …, Xn, принадлежащих интервалу Si. За меру D отклонения эмпирической функции распределения  от теоретической Fтеор(x) принимают величину

.                                                               (3.32)

Величина 2 случайная и нас интересует ее распределение в предположении, что принятая гипотеза верна, т.е. F(x)=Fтеор(x). Ответ на этот вопрос дает теорема Пирсона:

Теорема. Какова бы ни была функция распределения Fтеор(x) случайной величины X, при n распределение величины 2 стремится к 2–распределению с (r–1) степенями свободы.

Полностью определенное гипотетическое теоретическое распределение встречается на практике довольно редко. Гораздо чаще теоретическое распределение Fтеор(x;q1,…,qk) содержит некоторые неизвестные параметры q1,…,qk, значение которых приходится оценивать по выборке. В результате критерий Пирсона будет иметь вид

.                                                (3.33)

Однако воспользоваться теоремой Пирсона в этом случае уже нельзя, поскольку значения q1,…,qk неизвестны. Если же в приведенном выражении величины q1,…,qk заменить их оценками по выборке, то величины pi(q1,…,qk) уже будут случайными величинами, поэтому и в этом случае применять теорему Пирсона нельзя.

Отметим, что при n распределение величины 2, если параметры q1,…,qk оцениваются по методу максимального правдоподобия, является распределением 2 с (r–1-k) степенями свободы (теорема Фишера). Таким образом, наличие оцениваемых по выборке параметров (если оценка производится по методу максимального правдоподобия) не меняет характера предельного распределения величины 2, а лишь уменьшает число степеней свободы этого предельного распределения настолько единиц, каково число оцениваемых параметров. В этом состоит одно из достоинств критерия Пирсона.

Отметим, что критерий Пирсона применяется только при достаточно больших выборках (n50) и достаточно больших частотах (ni5). Если последнее условие не выполняется для какого-либо интервала вариационного ряда, то его объединяют с соседним интервалом, соответственно уменьшая общее число интервалов.

Схема применения критерия согласия Пирсона проверки гипотезы о предполагаемом законе неизвестного распределения:

  1.  Вычисляются параметры предполагаемого закона распределения.
  2.  Вычисляются теоретические частоты .
  3.  Вычисляют величину .
  4.  По вычисленному числу степеней свободы n=r–1–k, где r – число интервалов выборки, k – число параметров распределения и по выбранному уровню значимости a по таблицам распределения 2, находят .
  5.  Если , то нет оснований отклонять нулевую гипотезу, если  – нулевая гипотеза отвергается.

Пример 3.20. По распределению, заданному таблицей (таб. 3.9), выяснить при помощи критерия Пирсона можно ли на уровне значимости a=0,05 считать, что генеральная совокупность имеет нормальное распределение.

Решение. В предположении, что имеет место нормальное распределение, то можно оценить ее два параметра

,     .

Таблица 3.9

i

xixi+1

ni

1

6,67-6,69

2

–0,5

–0,43603

0,06397

12,794

1,383

2

6,69-6,71

15

3

6,71-6,73

17

–0,43603

–0,31202

0,12402

24,803

2,455

4

6,73-6,75

44

–0,31202

–0,09809

0,21393

42,785

0,035

5

6,75-6,77

52

–0,09809

0,15119

0,24928

49,856

0,092

6

6,77-6,79

44

0,15119

0,34743

0,19624

39,248

0,575

7

6,79-6,81

14

0,34743

0,45179

0,10435

20,871

2,262

8

6,81-6,83

11

9

6,83-6,85

1

0,45179

0,5

0,04821

9,643

0,576

200

,0

200

7,378

Из таблицы видно, что . Теперь найдем критическое значение . Поскольку у предполагаемой модели были неизвестны оба параметра, поэтому k=2; при расчете критерия использовались семь интервалов r=7. Таким образом, число степеней свободы
n=r–1–k=4. При заданном уровне значимости находим

.

Поскольку , то нет оснований отвергать нулевую гипотезу, т.е. что исходное распределение является нормальным.

Недостатком критерия 2 является то, что группировка данных приводит к некоторой потере информации. Кроме того, остается еще вопрос о выборе числа интервалов и длине самих интервалов. Однако критерий 2 имеет и некоторые достоинства: при его применении нет необходимости учитывать точные значения наблюдений. Несомненным преимуществом этого критерия является его универсальность. В частности, он применяется при проверке гипотезы о независимости двух случайных величин, гипотезы о равенстве параметров двух биномиальных распределений и многих других распределений.

Кроме критерия 2 можно применять и другие методы проверки гипотез о распределениях. Колмогоровым, Мизесом, Смирновым и другими предложены критерии согласия, основанные на мерах расхождения, зависящих от разности  – отклонения оценки эмпирической функции распределения от предполагаемой теоретической функции распределения F(x). К критериям такого рода относится критерий Колмогорова, основанный на предельном распределении величины

.                                                (3.34)

Очевидно, что Dn – случайная величина, поскольку ее значение зависит от объекта . Если гипотеза H0 справедлива и n, то Fn(x) F(x) при любом x. Поэтому естественно, что при этих условиях Dn0. Если же гипотеза H0 неверна, то G(x) и FG, а потому .

Теорема Колмогорова. Если функция распределения F(x) непрерывна, то при n

             (3.35)

Для функции распределения K(x) созданы таблицы.

При практической реализации критерия Колмогорова сначала по выборке составляют вариационный ряд x1, x2, …, xn. Затем находят значения F(xi) и определяют значение статистики Dn по формуле

.                                          (3.36)

Наконец, сравнивают полученное значение  с критическим значением lкрит для заданного уровня значимости a и принимают или отвергают гипотезу. Для вычисления Dn по сгруппированному вариационному ряду лучше использовать формулу

.                                        (3.37)

Критерий Колмогорова своей простотой весьма выгодно отличается от критерия Пирсона и достаточно легко реализуется в компьютерных программах, поэтому его весьма охотно применяют на практике. Следует, однако, оговорить, что этот критерий можно применять только в случае, когда гипотетическое распределение F(x) полностью известно заранее из каких-либо теоретических соображений, т.е. когда известен не только вид функции распределения, но и все входящие в нее параметры. Обычно из теоретических соображений известен только общий вид функции F(x), а входящие в нее числовые параметры определяются по данному статистическому материалу. При применении критерия Пирсона это обстоятельство учитывается соответствующим уменьшением числа степеней свободы распределения 2. Критерий Колмогорова такого согласования не предусматривает, поэтому в подобных случаях критерий Колмогорова может дать завышенное значение. Поэтому таких случаях нужно применять модифицированные критерии Колмогорова, при этом закон распределения критерия будет существенным образом зависеть от вида проверяемой функции распределения. Однако для наиболее важных распределений (нормального, показательного и других) составлены таблицы.


ЛЕКЦИЯ 2                                                                                                                                     25

Глава 3. БАЗОВЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ               25

§3.1. Выборочный метод                                                                                                              25

§3.2. Числовые характеристики статистического ряда                                                               28

§3.3. Точечные статистические оценки                                                                                      30

3.3.1. Точечные оценки и требования к ним                                                               30

3.3.2. Точечные оценки числовых характеристик  генеральной совокупности    34

§3.4. Интервальные статистические оценки                                                                          35

3.4.1. Метод доверительных интервалов                                                                          35

3.4.2. Доверительный интервал оценки генеральной средней при известной
генеральной дисперсии                                                                                      37

3.4.3. Доверительный интервал оценки генеральной средней при неизвестной
генеральной дисперсии                                                                                      40

3.4.4. Доверительный интервал оценки генеральной дисперсии                           42

§3.5. Проверка статистических гипотез                                                                                      43

3.5.1. Основные понятия                                                                                                  43

3.5.2. Проверка гипотез о числовых значениях параметров                                       46

3.5.3. Проверка гипотез о сравнении параметров  генеральной совокупности    48

Дополнение 1. Метод моментов                                                                                                  52

Дополнение 2. Метод максимального правдоподобия                                                               53

Дополнение 3. Критерии согласия                                                                                                  55

1 Здесь мы будем использовать т.н. классический подход к интерпретации доверительного интервала, при котором генеральный параметр не является случайной величиной. Однако существует альтернативный, байесовский подход, который позволяет трактовать неизвестный параметр генеральной совокупности как случайную величину.

PAGE  28

Глава 3. БАЗОВЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ


 

А также другие работы, которые могут Вас заинтересовать

18301. НЕРІВНОСТІ З ОДНІЄЮ ЗМІННОЮ 204.5 KB
  Лекція 28 НЕРІВНОСТІ З ОДНІЄЮ ЗМІННОЮ Нерівності з однією змінною як предикат та їх основні характеристики. Рівносильні нерівності. Теорема про рівносильність нерівностей та наслідки з них. Лінійні нерівності з однією змінною та їх розв’язування з аналі...
18302. ОСНОВНІ ПОНЯТТЯ ГЕОМЕТРІЇ 95 KB
  Лекція 29 ОСНОВНІ ПОНЯТТЯ ГЕОМЕТРІЇ Короткі історичні відомості про виникнення геометрії. Система геометричних понять шкільного курсу геометрії. Поняття про геометричну фігуру. Ламана та її основні характеристики. Плоскі геометричні фігури ламана...
18303. ПРОСТОРОВІ ГЕОМЕТРИЧНІ ФІГУРИ 167.5 KB
  Лекція 30 ПРОСТОРОВІ ГЕОМЕТРИЧНІ ФІГУРИ Просторові геометричні фігури та їх зображення на площині. Поняття про геометричне тіло. Многогранники. Теорема Ейлера про многогранники без доведення. Питання на самостійне опрацювання Тіла оберта
18304. ПОНЯТТЯ ПРО ВЕЛИЧИНУ ТА ЇХ ВИМІРЮВАННЯ 77 KB
  Лекція 31 ПОНЯТТЯ ПРО ВЕЛИЧИНУ ТА ЇХ ВИМІРЮВАННЯ Відображення властивостей дійсного світу через поняття величини. Додатні адитивноскалярні величини ті їх властивості. Поняття про вимірювання величин. Види величин. Довжина відрізка її основні властиво...
18305. Логіка, 2 клас. Експериментальний навчальний посібник 3.45 MB
  Логіка 2 клас. Експериментальний навчальний посібник. Київ: Початкова школа 2002 112 с Кожна людина прагне передати свої думки іншим. Для того щоб інші розуміли плин твоїх думок треба чітко їх висловлювати. Якщо думку людини неможливо зрозуміти то кажуть: В його мірк
18308. ЛОГІКА З клас Експериментальний навчальний посібник 1.75 MB
  Олександр Митник ЛОГІКА З клас Експериментальний навчальний посібник Любий друже Дякую тобі що взяв до рук цю книгу. Отож ти вирішив продовжити освоювати стежки знань і мудрості. До цієї мандрівки запрошуються діти які люблять міркувати і прагнуть опанувати мис...