20182

Точечные оценки законов распределения

Лекция

Коммуникация, связь, радиоэлектроника и цифровые приборы

Функции распределения описывают поведение непрерывных случайных величин т. Задача нахождения точечных оценок частный случай статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выборки. В отличие от самих параметров их точечные оценки являются случайными величинами причем их значения зависят от объема экспериментальных данных а закон распределения от законов распределения самих случайных величин.

Русский

2013-07-25

114.5 KB

30 чел.

  1.  Точечные оценки законов распределения.

Функции распределения описывают поведение непрерывных случайных величин, т.е. величин, возможные значения которых неотделимы друг от друга и непрерывно заполняют некоторый конечный или бесконечный интервал. На практике все результаты измерений и случайные погрешности являются величинами дискретными, т.е. величинами хi, возможные значения которых отделимы друг от друга и поддаются счету. При использовании дискретных случайных величин возникает задача нахождения точечных оценок параметров их функций распределения на основании выборок — ряда значений хi, принимаемых случайной величиной х в n независимых опытах. Используемая выборка должна быть репрезентативной (представительной), т.е. должна достаточно хорошо представлять пропорции генеральной совокупности Х.

Оценка параметра называется точечной, если она выражается одним числом.

Задача нахождения точечных оценок — частный случай статистической задачи нахождения оценок параметров функции распределения случайной величины на основании выборки. В отличие от самих параметров их точечные оценки являются случайными величинами, причем их значения зависят от объема экспериментальных данных, а закон распределения — от законов распределения самих случайных величин.

Точечные оценки могут быть состоятельными, несмещенными и эффективными.

 Состоятельной называется оценка, которая при увеличении объема выборки стремится по вероятности к истинному значению числовой характеристики.

 Несмещенной называется оценка, математическое ожидание которой равно оцениваемой числовой характеристике. Наиболее эффективной считают ту из нескольких возможных несмещенных оценок, которая имеет наименьшую дисперсию. Требование несмещенности на практике не всегда целесообразно, так как оценка с небольшим смещением и малой дисперсией может оказаться предпочтительнее несмещенной оценки с большой дисперсией. На практике не всегда удается удовлетворить одновременно все три этих требования, однако выбору оценки должен предшествовать ее критический анализ со всех перечисленных точек зрения.

Наиболее распространенным методом получения оценок является метод наибольшего правдоподобия, который приводит к асимптотически несмещенным и эффективным оценкам с приближенно нормальным распределением. Среди других методов можно назвать методы моментов1  и наименьших квадратов.

Точечной оценкой математического ожидания (МО) результата измерений является среднее арифметическое значение измеряемой величины

 (8)

При любом законе распределения МО является состоятельной и несмещенной оценкой, а также наиболее эффективной по критерию наименьших квадратов.

Точечная оценка дисперсии является несмещенной и состоятельной, определяется по формуле

(9)

 

Более удобна для практики другая оценка распределения случайной величины Х, это – среднее квадратическое отклонение (СКО).

Оценка среднего квадратического отклонения (СКО) случайной величины х определяется как корень квадратный из дисперсии. 

Соответственно его оценка может быть найдена путем извлечения корня из оценки дисперсии. Однако эта операция является нелинейной процедурой, приводящей к смещенности получаемой оценки.  Для исправления оценки СКО вводят поправочный множитель k(n), зависящий от числа наблюдений n. Он изменяется от k(3) = 1,13 до k(∞) ≈1,03.

Оценка среднего квадратического отклонения

Полученные оценки МО и СКО являются случайными величинами. Это проявляется в том, что при повторениях серий из n наблюдений каждый раз будут получаться различные оценки  Рассеяние этих оценок целесообразно оценивать с помощью СКО .

Ввиду того, что большое число измерений проводится относительно редко, погрешность определения σ может быть весьма существенной. В любом случае она больше погрешности из-за смещенности оценки, обусловленной извлечением квадратного корня и устраняемой поправочным множителем k(n). В связи с этим на практике пренебрегают учетом смещенности оценки СКО отдельных наблюдений и определяют его по формуле

(11)

т.е. считают  k(n) = 1.

Иногда оказывается удобнее использовать следующие формулы для расчета оценок СКО отдельных наблюдений и результата измерения:

(12)

Точечные оценки других параметров распределений используются значительно реже.

  1.  Доверительная вероятность и доверительный интервал.

Рассмотренные точечные оценки параметров распределения дают оценку в виде числа, наиболее близкого к значению неизвестного параметра. Такие оценки используют только при большом числе измерений. Чем меньше объем выборки, тем легче допустить ошибку при выборе параметра.

Для практики важно не только получить точечную оценку, но и определить интервал, называемый доверительным, между границами которого с заданной доверительной вероятностью находится истинное значение оцениваемого параметра

P {xн < x < xв} = (1-q)

где q — уровень значимости; хн, хв — нижняя и верхняя границы интервала разброса Х.

В общем случае доверительные интервалы можно строить на основе неравенства Чебышева. При любом законе распределения случайной величины, обладающей моментами первых двух порядков, верхняя граница вероятности попадания отклонения случайной величины х от центра распределения Хц интервал tSx описывается неравенством Чебышева

P {|x -Xц| ≤ tSx}   ≤    (1 - 1/ t2)

где Sx — оценка СКО распределения; t — положительное число.

Для нахождения доверительного интервала не требуется знать закон распределения результатов наблюдений, но нужно знать оценку СКО.

Полученные с помощью неравенства Чебышева интервалы оказываются слишком широкими для практики. Так, доверительной вероятности 0,9 для многих законов распределений соответствует доверительный интервал 1,6Sx. Неравенство Чебышева дает в данном случае 3,16Sx. В связи с этим оно не получило широкого распространения.

В метрологической практике используют главным образом квантильные оценки доверительного интервала. Под 100*P-процентным квантилем (хр) понимают абсциссу такой вертикальной линии, слева от которой площадь под кривой плотности распределения равна Р%. Иначе говоря, квантиль — это значение случайной величины (погрешности) с заданной доверительной вероятностью Р. Например, медиана распределения является 50%-ным квантилем  - х05.

На практике 25- и 75%-ный квантили принято называть сгибами, или квантилями распределения. Между ними заключено 50% всех возможных значений случайной величины, а остальные 50% лежат вне их.

Интервал значений случайной величины х между x0.05  и x0.95 охватывает 90% всех ее возможных значений и называется интерквантильным промежутком с 90%-ной вероятностью. Его протяженность равна  

d0.9 = x0.95 - x0.05

На основании такого подхода вводится понятие квантильных значений погрешности, т.е. значений погрешности с заданной доверительной вероятностью Р — границ интервала неопределенности  

±∆Д  =  ±(хр1-р}/2  =  ±dр/2

На его протяженности встречается Р% значений случайной величины (погрешности), а q = (1-P)% общего их числа остаются за пределами этого интервала.

1) Для получения интервальной оценки нормально распределенной случайной величины необходимо:

• определить точечную оценку МО () и СКО (Sx) случайной величины по формулам (8) и (11) соответственно;

• выбрать доверительную вероятность Р из рекомендуемого ряда значений 0,90; 0,95; 0,99;

F(xн) = q/2 = (1 - P)/2;          F(xв) = (1 - q/2) = P + q /2

• найти верхнюю хв и нижнюю хн границы.

Значения хн и хв определяются из таблиц значений интегральной функции распределения А(t) или функции Лапласа Ф(t).

Полученный доверительный интервал удовлетворяет условию

              (13)

где n — число измеренных значений;

zp — аргумент функции Лапласа Ф(t), отвечающей вероятности Р/2.

В данном случае zp называется - квантильным множителем. 

Половина длины доверительного интервала Dр = zpSx/n1/2 называется доверительной границей погрешности результата измерений

Пример 1.

Произведено 50 измерений постоянного сопротивления. Определить доверительный интервал для МО значения постоянного сопротивления, если закон распределения нормальный с параметрами

mx =  = 590 Ом,

Sx = 90 Ом    при доверительной вероятности Р = 0,9.

Так как гипотеза о нормальности закона распределения не противоречит опытным данным, доверительный интервал определяется по формуле

          Ф(zр) = Р/2 = 0,45. 

Из таблицы, приведенной в приложении 1, находим, что   zp= 1,65.

Следовательно, доверительный интервал запишется в виде

(590 - 1,65 *90/501/2) <  R  < (590 + 1,65 • 90 / 501/2)   или   (590-21) < R < (590+21). Окончательно 569 Ом < R < 611 Ом.

При отличии закона распределения случайной величины от нормального необходимо построить его математическую модель и определять доверительный интервал с ее использованием.

Рассмотренный способ нахождения доверительных интервалов справедлив для достаточно большого числа наблюдений n, когда σ = Sx. Следует помнить, что вычисляемая оценка СКО Sx является лишь некоторым приближением к истинному значению  σ.

Определение доверительного интервала при заданной вероятности оказывается тем менее надежным, чем меньше число наблюдений.

Нельзя пользоваться формулами нормального распределения при малом числе наблюдений, если нет возможности теоретически на основе предварительных опытов с достаточно большим числом наблюдений определить СКО. .

2) Расчет доверительных интервалов для случая, когда распределение результатов наблюдений нормально, но их дисперсия неизвестна, т.е. при малом числе наблюдений n, возможно выполнить с использованием распределения Стьюдента S(t,k). Оно описывает плотность распределения отношения (дроби Стьюдента):

где Q — истинное значение измеряемой величины. Величины ,  и   вычисляются на основании опытных данных и представляют собой точечные оценки: МО, СКО среднего арифметического значения и СКО результатов измерений.

= / n1/2

Вероятность того, что дробь Стьюдента в результате выполненных наблюдений примет некоторое значение в интервале (-tp; +tр).

tp - называется коэффициентом Стьюдента.

 (14)

где k — число степеней свободы, равное (n - 1). Величины tp (называемые в данном случае коэффициентами Стьюдента), рассчитанные с помощью двух последних формул для различных значений доверительной вероятности и числа измерений, табулированы (см. таблицу в приложении 2). Следовательно, с помощью распределения Стьюдента можно найти вероятность того, что отклонение среднего арифметического от истинного значения измеряемой величины не превышает .

В тех случаях, когда распределение случайных погрешностей не является нормальным, все же часто пользуются распределением Стьюдента с приближением, степень которого остается неизвестной. Распределение Стьюдента применяют при числе измерений n < 30, поскольку уже при n = 20, ..., 30 оно переходит в нормальное и вместо уравнения (14) можно использовать уравнение (13).

Результат измерения записывается в виде:  

где Рд — конкретное значение доверительной вероятности.

Множитель t при большом числе измерений (n) равен квантильному множителю zр. При малом n он равен коэффициенту Стьюдента.

Полученный результат измерения не является одним конкретным числом, а представляет собой интервал, внутри которого с некоторой вероятностью Рд находится истинное значение измеряемой величины. Выделение середины интервала вовсе не предполагает, что истинное значение ближе к нему, чем к остальным точкам интервала. Оно может быть в любом месте интервала, а с вероятностью 1-Рд даже вне его.

Пример 2. 

Определение удельных магнитных потерь для различных образцов одной партии электротехнической стали марки 2212 дало следующие результаты: 1.21; 1.17; 1,18; 1,13; 1,19; 1,14; 1,20 и 1,18 Вт/кг.

Считая, что систематическая погрешность отсутствует, а случайная распределена по нормальному закону, требуется определить доверительный интервал при значениях доверительной вероятности 0,9 и 0,95. Для решения задачи использовать формулу Лапласа в распределении Стьюдента.

1) По формулам (8) и (11) находим оценки среднего арифметического значения и СКО результатов измерений.

Они соответственно равны = 1,18  и  Sx = 0,0278 Вт/кг.

Считая, что оценка СКО равна самому отклонению, находим:

Отсюда, используя значения функции Лапласа, приведенные в таблице приложения 1, определяем, что zр = 1,65 (для Р = 0,9).

Для Р = 0,95 коэффициент 2-й   zp = 1,96.

Доверительные интервалы, соответствующие Р = 0,9 и 0,95, равны 1,18±0,016 Вт/кг и 1,18±0,019 Вт/кг.

2) В том случае, когда нет оснований считать, что СКО и его оценка равны, доверительный интервал определяется на основе распределения Стьюдента:

По таблице в приложении  2  находим, что  t0.9 = 1,9   и   t0.95 = 2,37.

Отсюда доверительные интервалы соответственно равны  1,18±0,019 Вт/кг    и 

1,18±0,023 Вт/кг.

 

Литература

  1.  Приложение 1. Статистические таблицы. «Прилож.1_ф.Лапласа»
  2.  Приложение 2. «Статистическая таблица. Коэффициенты Стьюдента».
  3.  «Метрология»,  Сергеев А.Г., Крохин В.В., «Логос», Москва, 1999
  4.  «Оценка погрешностей результатов измерений», Новицкий П.В., Зограф И.А., «Энергоатомиздат», М, 1985.

 

Приложение 2.

Таблица.    Коэффициенты Стьюдента  tД, n).

1 Грановский В.А., Сирая Т.Н. Методы обработки экспериментальных данных. Л.: Энергоатомиздат, 1990


 

А также другие работы, которые могут Вас заинтересовать

83613. Определение расчетных нагрузок для сельской местности напряжением до 1 кВ 50.72 KB
  В результате протяженность сетей на единицу мощности потребителя во много раз превышает эту величину в других отраслях народного хозяйства а стоимость электроснабжения в сельском хозяйстве составляет до 6575 от общей стоимости электрификации включая затраты на приобретение рабочих машин. Определяются суммарные мощности: 5. Определяют расчётную нагрузку осветительных приёмников цеха определяется по установленной мощности и коэффициенту спроса кВт РРО 5. Определяют отдельно дневную и вечернюю полные мощности: 6.
83614. Выбор разъединителей, отделителей и короткозамыкателей 41.03 KB
  Условиями выбора разъединителей являются где номинальное напряжение сети кВ; номинальное напряжение электрического аппарата или токоведущих частей кВ; максимально возможный ток в месте установки разъединителей в рабочем режиме кА; номинальный ток электрического аппарата или токоведущих частей кА. Условия проверки электродинамической стойкости разъединителей: по способности выдерживать ударный ток Условия проверки термической стойкости разъединителей Короткозамыкатели и отделители это специальные разъединители имеющие...
83615. Выбор трансформаторов тока 38.4 KB
  В режиме короткого замыкания необходимо проверить трансформатор тока на динамическую и термическую стойкость. Условия выбора трансформатора тока: номинальное напряжение: номинальный первичный ток: по вторичной нагрузке: Проверка трансформатора тока по динамической стойкости: где кратность тока динамической стойкости. Проверка трансформатора тока по термической стойкости: где кратность тока термической стойкости.
83616. Выбор силовых трансформаторов на напряжение выше 1 кВ 44.49 KB
  Нормальный режим работы раздельная работа трансформаторов это предусматривается в целях уменьшения токов короткого замыкания и позволяет применить более легкую и дешевую аппаратуру на стороне низшего напряжения трансформаторов. Номинальная мощность цеховых SНТ выбирается по расчетной мощности исходя из условия экономичной работы трансформаторов 6080 в нормальном режиме и допустимой перегрузки на 3040 от SНТ в послеаварийном режиме. После выбора мощности трансформаторов определим их количество: где Кз это...
83617. Типы проводников, применяемые в основных электрических цепях 29.51 KB
  Все соединения внутри закрытого РУ 610 кВ включая сборные шины выполняются жесткими голыми алюминиевыми шинами прямоугольного или коробчатого сечения. Токоведущие части в РУ 35 кВ и выше обычно выполняются сталеалюминиевыми проводами АС. В некоторых конструкциях ОРУ часть или вся ошиновка может выполняться алюминиевыми трубами. От стены ГРУ до выводов установленного вблизи ГРУ соединение выполняется жесткими алюминиевыми шинами.
83618. Выбор кабелей, марки кабелей 43.25 KB
  Если условия применения проводов и кабелей отличаются от приведённых то длительно допустимые токовые нагрузки пересчитывают по формуле: I\'доп=Iдоп K1K2 где Iдоп длительно допустимый ток одиночного кабеля провода; K1 коэффициент учитывающий количество кабелей; К2 коэффициент допустимой перегрузки кабельной линии. Для кабелей напряжением до 10 кВ с бумажной пропитанной изоляцией несущих нагрузки меньше номинальных для таких кабелей допускается перегрузки в течение 5 суток в пределах указанных в таблицах справочника. Для кабелей с...
83619. Виды и системы освещения 30.21 KB
  Освещение безопасности предназначено для продолжения работы при аварийном отключении рабочего освещения. Светильники рабочего освещения и светильники освещения безопасности должны питаться от независимых источников. Устройство рабочего освещения обязательно во всех помещениях независимо от устройства в них других видов освещения.
83620. Расчет искусственного освещения методом коэффициента использования 43.18 KB
  1 где Е заданная минимальная освещенность лк; Кзап коэффициент запаса; коэффициент минимальной освещенности приближенно можно принимать z = 11 для люминесцентных ламп z = 115 для ламп накаливания и ДРЛ; S освещаемая площадь м2; Еср средняя освещенность лк; N число светильников намечается до расчета коэффициент использования светового потока источника света доли единиц. Если такое приближение не реализуется то корректируется число светильников. Если световой поток ламп в каждом светильнике составляет...
83621. Точечный метод расчета освещенности 93.26 KB
  Расположение контрольной точки А при размещении светильников по углам квадрата и В по сторонам прямоугольника 3 по пространственным изолюксам горизонтальной освещенности находится освещенность е от каждого светильника; 4 находится общая условная освещенность от всех светильников ∑е; 5 рассчитывается горизонтальная освещенность от всех светильников в точке А: Еа = F х μ 1000х kз х ∑е где μ коэффициент учитывающий дополнительную освещенность от удаленных светильников и отраженного светового потока kз коэффициент запаса. Порядок по...