494

Статистические оценки параметров распределения. Несмещенные, эффективные и состоятельные оценки

Лекция

Социология, социальная работа и статистика

Несмещенные, эффективные и состоятельные оценки. Числовые характеристики вариационных рядов. Выборочная дисперсия и выборочное среднее квадратическое отклонение. Исправленная выборочная дисперсия. Обычные, начальные и центральные эмпирические моменты.

Русский

2015-01-18

157.5 KB

302 чел.

 Лекция. Статистические оценки параметров распределения.

Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распределение.

Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака , полученные в результате  наблюдений. Через эти данные и выражают оцениваемый параметр. Рассматривая  как независимые случайные величины , можно сказать, что найти статистическую оценку неизвестного параметра распределения – это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра.

§.1. Несмещенные, эффективные и состоятельные оценки.

 Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным  требованиям. Укажем эти требования.

Пусть – наблюдаемые значения СВ . Обозначим через  статистическую оценку неизвестного параметра , вычисленного на основе данного статистического материала.

 Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру  при любом объеме выборки, т.е.

     .

 Эффективной называют статистическую оценку, которая при заданном объеме выборки  имеет наименьшую  дисперсию.

 Состоятельной называют статистическую оценку, которая при  стремится по вероятности к оцениваемому параметру, т.е. для любого  при   .

 Отметим, что смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.

§.2. Числовые характеристики вариационных рядов.

 П.1. Выборочная средняя.

Пусть для изучения генеральной совокупности относительно количественного признака  извлечена выборка объема .

 Выборочной средней  называют среднее арифметическое значение признака выборочной совокупности.

 Если все значения  признака выборки объема  различны, то

     .        (26.1)

Если же значения признака  имеют соответственно частоты , причем , то

     или      .               (26.2)

 П.2. Выборочная дисперсия и выборочное среднее квадратическое отклонение.

Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения , вводят такую характеристику как выборочная дисперсия.

 Выборочной дисперсией  называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения .

Если все значения     признака выборки объема  различны, то

     .         (26.3)

Если же значения признака  имеют соответственно частоты , причем , то

    .         (26.4)

 Пример 26.1. Выборочная совокупность задана таблицей распределения:

1

2

3

4

20

15

10

5

Найти выборочную дисперсию.

 Решение.

Найдем выборочную среднюю по формуле (26.2):          .

Найдем выборочную дисперсию:

  .

Кроме дисперсии, для характеристики рассеяния значений признака выборочной совокупности вокруг своего среднего значения пользуются средним квадратическим отклонением.

 Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии:  .

 Замечание. Вычисление дисперсии можно упростить, используя следующую формулу:    .          (26.5)

 П.3. Исправленная выборочная дисперсия.

Выборочная дисперсия является смещенной оценкой генеральной дисперсии, поэтому в статистике применяют также исправленную выборочную дисперсию, которая является несмещенной  оценкой генеральной дисперсии и обозначается .

 Исправленная выборочная дисперсия находится по формуле:

   .         (26.6)

Для оценки среднего квадратического отклонения генеральной совокупности используют «исправленное» среднее квадратическое отклонение, которое равно квадратному корню из исправленной дисперсии:

   .          (26.7)

Отметим, что  не является несмещенной оценкой.

 Замечание. Сравнивая формулы (26.4) и (26.6), видим, что они отличаются только знаменателями. Очевидно, что при больших значениях  объема выборки выборочная и исправленная дисперсии отличаются мало. На практике пользуются исправленной дисперсией, если примерно .

§.3. Обычные, начальные и центральные эмпирические моменты.

Для вычисления характеристик выборки удобно пользоваться эмпирическими моментами, определения которых аналогичны определениям соответствующих теоретических моментов. В отличие от теоретических эмпирические моменты вычисляют по данным наблюдений.

 Обычным эмпирическим моментом порядка  называют среднее значение -х степеней разностей :

    ,

где  – наблюдаемая варианта,  – частота варианты, – объем выборки, – произвольное постоянное число (ложный нуль).

 Начальным эмпирическим моментом порядка  называют обычный момент порядка  при :  .

В частности,   .

 Центральным эмпирическим моментом порядка  называют обычный момент порядка  при : .

В частности,    .

    

§.4. Точность оценки. Метод моментов.

Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, – точечные.

Можно доказать, что начальные и центральные эмпирические моменты являются состоятельными оценками соответственно начальных и центральных теоретических моментов того же порядка. На этом основан метод моментов, предложенный К. Пирсоном.

 Метод моментов точечной оценки неизвестных параметров заданного распределения состоит в приравнивании теоретических моментов рассматриваемого распределения соответствующим эмпирическим моментам того же порядка.

 Если распределение определяется одним параметром, то для его отыскания приравнивают один теоретический момент одному эмпирическому моменту того же порядка. Например, можно приравнять начальный теоретический момент первого порядка  начальному эмпирическому моменту первого порядка: . Учитывая, что  и , получим:  .              (*)

Математическое ожидание является функцией от неизвестного параметра заданного распределения, поэтому, решив уравнение (*) относительно неизвестного параметра, тем самым получим его точечную оценку.

Если распределение определяется двумя параметрами, то приравнивают два теоретических момента двум соответствующим эмпирическим моментам того же порядка.  Например, можно приравнять начальный теоретический момент первого порядка  начальному эмпирическому моменту первого порядка  и центральный теоретический момент второго порядка центральному эмпирическому моменту второго порядка:   , .

Учитывая, что , , , , имеем:

                 (**)

Левые части этих равенств являются функциями от неизвестных параметров, поэтому, решив систему (**) относительно неизвестных параметров, тем самым получим их точечные оценки.

Разумеется, для вычисления выборочной средней  и выборочной дисперсии  надо располагать выборкой  .

 

§ 26.5. Интервальные оценки. Доверительная вероятность (надежность). Доверительный интервал.

При выборке малого объема точечная оценка может приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

 Интервальной называют оценку, которая определяется двумя числами – концами интервала.  Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика  служит оценкой неизвестного параметра . Будем считать  постоянным числом ( может быть и случайной величиной). Понятно, что  тем точнее определяет параметр , чем меньше абсолютная величина разности . Другими словами, если  и , то чем меньше , тем оценка точнее. Таким образом, положительное число  характеризует точность оценки.

 Однако статистические методы не позволяют категорически утверждать, что оценка  удовлетворяет неравенству ; можно лишь говорить о вероятности , с которой это неравенство осуществляется.

 Надежностью (доверительной вероятностью) оценки  по  называют вероятность , с которой осуществляется неравенство . Обычно надежность оценки задается наперед, причем в качестве  берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99  и  0,999.

 Пусть вероятность того,  , равна .

Далее имеем:   или  .

Тогда вероятность того, что интервал  заключает в себе (покрывает) неизвестный параметр , равна , т.е.   .

 Доверительным называют интервал  , который покрывает неизвестный параметр с заданной надежностью .

 Замечание. Интервал   имеет случайные концы (их называют доверительными границами). Поэтому доверительные границы сами являются случайными величинами – функциями от .

§26.6. Интервальные оценки для математического ожидания и среднего квадратического отклонения СВ, имеющей нормальное распределение.

 Пусть количественный признак генеральной совокупности распределен нормально, причем среднее квадратическое отклонение  этого распределения  может быть известно или неизвестно. Требуется оценить неизвестное математическое ожидание  по выборочной средней .

 Интервальной оценкой (с надежностью ) математического ожидания нормально распределенного количественного признака  по выборочной средней  при  известном среднем квадратическом отклонении  генеральной совокупности служит доверительный интервал

    ,           (26.8)

где  – точность оценки, – объем выборки, – значение аргумента функции Лапласа Ф, при котором Ф=;  при неизвестном   (и объеме выборки )

    ,         (26.9)

где  – «исправленное» выборочное среднее квадратическое отклонение,  находят по таблице приложений по заданным  и .

 Пусть количественный признак  генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение  по «исправленному» выборочному среднему квадратическому отклонению .

 Интервальной оценкой (с надежностью ) среднего квадратического отклонения  нормально распределенного количественного признака  по «исправленному» выборочному среднему квадратическому отклонению  служит доверительный интервал (для )

     (при );

      (при ),     (26.10)

где  находят по таблице приложений  по заданным  и .

 Пример 26.2. Найти доверительный интервал для оценки с надежностью 0,95 неизвестного математического ожидания  нормально распределенного признака  генеральной совокупности, если генеральное среднее квадратическое отклонение , выборочная средняя , объем выборки .

 Решение. Найдем доверительный интервал по  формуле (26.8). Все величины, кроме , известны. Найдем  из соотношения Ф. По таблице приложений находим . Следовательно, искомый доверительный интервал:

     .


 

А также другие работы, которые могут Вас заинтересовать

43665. Построение твердотельных моделей в системе Unigraphics 7.25 MB
  Добавляем бобышки с двух сторон затем ставим фаски на них. Добавляем отверстие с одной стороны. Добавляем фаски и отверстия. Добавляем фаски.
43666. Проектирование технологических процессов ремонта деталей вагонов 2.85 MB
  Технологический процесс технологическая операция наплавка электрод флюс коэффициент наплавки фрикционный клин. Цель работы: Разработать технологию ремонта фрикционного клина провести подбор оборудования для ремонта В курсовом проекте произведен выбор действующего типового технологического процесса – способа восстановления изношенной поверхности детали составлен технологический процесс ремонта и произведена разработка технологических операций рассчитаны параметры режима ручной дуговой наплавки и автоматической наплавки под плавленым...
43667. Функции программ MSPowerPoint и MSExcel 2.03 MB
  Например в виде презентации можно сделать более доступной сложную правовую информацию которой социальные работники информируют своих клиентов. Создание презентации на тему Дети это наше будущее Открыть MS Word В книге Excel выделить диаграмму Вызвать контекстное меню Копировать В документе MSWord вызвать контекстное меню Вставить Файл Печать Предварительный просмотр Создание презентации средствами MS Power Point на тему Дети это наше будущее Презентация это целенаправленный информационный процесс...
43668. РАЗРАБОТКА ДИЗАЙНА САЙТА ФИТНЕС-КЛУБА 15.44 MB
  Обратите внимание, как мы структурировали тэги по строкам (с помощью клавиши Enter) и какие сделали отступы (клавишей Tab). В принципе не важно, как вы структурируете ваш HTML-документ. Но, для облегчения чтения кода, настоятельно рекомендуем структурировать ваш HTML с помощью перевода строк и отступов, как в нашем примере.
43669. Изучение особенностей отражения в учете договоров финансовой аренды (лизинга) 1.2 MB
  Лизингодатель представляет собой хозяйствующий субъект (лизинговая компания, банк и т.п.) или индивидуального предпринимателя, осуществляющего лизинговую деятельность, т.е. передачу по договору в лизинг специально приобретенного для этого имущества. Иначе говоря, лизингодатель — это арендодатель данного имущества
43670. Підвищення надійності різання деревини за рахунок удосконалення електричної схеми шляхом впровадження сучасних енергозберігаючих технологій 4.8 MB
  Одним з основних видів різання деревини є пиляння. Це операція ділення деревини на частини багаторізцевими зубчастими інструментами  пилками, які здатні видаляти з колоди або заготовки шар деревини, перетворюючи її в стружку. Існує три основних види пил - рамні, стрічкові і дискові. Стрічкові пили представляють собою сталеву нескінченну (у вигляді кільця) смугу з зубами на одній (рідше двох) кромці.
43671. ОСОБЕННОСТИ ВОЕННО-ПАТРИОТИЧЕСКОГО ВОСПИТАНИЯ С МОЛОДЕЖЬЮ 14-18 ЛЕТ С ИСПОЛЬЗОВАНИЕМ СРЕДСТВ ФИЗИЧЕСКОЙ КУЛЬТУРЫ 584.5 KB
  Психология юношеского возраста – один из самых сложных и наименее разработанных разделов возрастной психологии. Еще в 20-е годы Л.С. Выготский отмечал, что в психологии юношеского возраста значительно больше общих теорий, чем достоверно установленных фактов.
43672. Інвентаризація інформаційних активів 82.46 KB
  Оглядова частина Визначення поняття інформації. Термін цінність інформації перш за все визначає саме поняття інформації а вже потім її цінності. Єдиного визначення інформації на даний час немає. Труднощі що виникають при спробах знаходження єдиного та вичерпного визначення інформації цілком зрозумілі: поняття інформація являється одним з первісних філософських понять таких як матерія свідомість час простір та ін.
43673. Разработка программного модуля расчета статистических данных «Statistics» для Web – приложения «Office Planning System» 1.25 MB
  Данный дипломный проект посвящен разработке программного модуля расчета статистических данных Sttistics для Web – приложения Office Plnning System. В данной пояснительной записке к дипломному проекту содержится подробное изложение всех этапов разработки программного модуля: изучение предметной области; постановка задачи включающая в себя анализ требований предъявляемых к программному модулю расчета статистических данных Web – приложения Office Plnning System ознакомление с архитектурой Web – приложения изучение...