6611

Описательная статистика и обработка статистических данных в процессе проектирования авиационных двигателей

Контрольная

Социология, социальная работа и статистика

Описательная статистика Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят...

Русский

2013-01-06

505.72 KB

17 чел.

Описательная статистика

Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят: числовые характеристики случайных величин (среднее, стандартное отклонение, мода, медиана, дисперсия, эксцесс, асимметрия); построение полигона частот и гистограмм; подбор закона распределения, корреляционный и регрессионный анализ, кластерный анализ и др.

Основная статистическая обработка экспериментальных данных – нахождения среднего значения, стандартного (среднеквадратического) отклонения и др., а также для построения гистограммы может осуществляться с помощью программных инструментальных средств, например пакета «Статистика».

Рис.1. Обработка статистических данных.

Результаты статистической обработки:  число вариант, среднее, минимальное и максимальное значения, стандартное отклонение..

Построение гистограммы

Рис.  Гистограмма характеризует рассеяние случайной величины (производственного параметра).

Подбор закона распределения необходим для прогнозирования параметров процессов.

Например – нормальный закон распределения:

Или закон равной вероятности

Обосновать применимость того или иного закона можно с помощью критериев проверки статистических гипотез

Статистической называют гипотезу о виде неизвестных распределений или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу H0.

Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.

или

или

Отвергнута

Принята

Отвергнута

Ошибка первого рода

Принята

Ошибка второго рода

Ложная

Соответствует действительности (правильная)

ИЛИ

Гипотеза H01)

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначается через .

Статистическим критерием (критерием) называют случайную величину К, которая служит для проверки гипотезы.

Наблюдаемым (эмпирическим) значением Кнабл называют то значение критерия, которое вычислено по выборке.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы (область допустимых значений) - совокупность значений критерия, при которых нулевую гипотезу принимают.

двусторонняя

левосторонняя

правосторонняя

Критическая область

Критическая область

0

Ккр

Ккр

К

Ккр

К

К

Ккр

Критическая область

Критическая область

Для отыскания критической области задаются уровнем значимости  и определяют критические точки.

Для правосторонней критической области Р(К>Ккр)=          (Ккр>0);

для левосторонней критической области Р(К<Ккр)=          (Ккр<0);

для двусторонней критической области Р(К>Ккр)=/2          (Ккр>0)

                                                                    Р(К<-Ккр)=/2.

Критерий согласия 2 (хи-квадрат)

Критерий согласия 2 (критерий Пирсона) разработан лучше других критериев и чаще используется. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми).

Условия применения: объем выборки n40, выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.

Выдвигаемая гипотеза Н0: f(x)=f '(x) - плотность распределения f(x) генеральной совокупности, из которой взята выборка, соответствует теоретической модели f '(x) (нормального распределения, равномерного распределения ...).

Альтернатива Н1: f(x)f '(x).

Уровень значимости .

Порядок применения:

1.Формулируется гипотеза, выбирается уровень значимости .

2.Получается выборка объема n40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.

3.Рассчитываются выборочные характеристики и S.

  - среднее выборочное (аналог математического ожидания)

          ,                                                                            (1)

где n - объем выборки, xi - варианты выборки.

Если данные сгруппированы, то среднее выборочное

        ,                                                                           (2)

где k - число интервалов группировки, ni - частоты интервалов, xi - срединные значения интервалов.

S - стандартное отклонение (среднее квадратическое отклонение).

,                                             (3)

                                                        (4)

Если данные сгруппированы

                                                        (5)

и S используют в качестве генеральных параметров  (математического ожидания) и  (среднего квадратического отклонения).

4.Вычисляются значения теоретических частот попадания в i-й интервал группировки.

В случае проверки гипотезы о нормальном распределении генеральной совокупности по выборке:

,                                         (6)

где Ф0(u) - функция Лапласа, xвi и  xнi - верхняя и нижняя границы i-го интервала группировки.

Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была бы не меньше 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.

5.Значение 2 - критерия рассчитываются по формуле

,                                                                (7)

где ni - эмпирические частоты, - ожидаемые (теоретические) частоты, k - число интервалов после группировки.

6.Из табл.1 находится критическое значение критерия Пирсона для уровня значимости  и числа степеней свободы =k-3.

7.Если - гипотезу о (нормальном, равномерном...) распределении генеральной совокупности Н0 отвергают. В противном случае нет оснований отвергать Н0.

Критерий  (ламбда) Колмогорова-Смирнова.

Гипотеза Н0 формулируется по отношению к функциям распределения F(x) и F'(x).

F(x) функция распределения генеральной совокупности, из которой получена выборка.

F'(x) - функция непрерывного теоретического (нормального) распределения.

Условия применения: объем выборки n35, эмпирическое распределение представлено в виде интервального вариационного ряда.

Гипотеза Н0: F(x)=F'(x).

Альтернатива Н1: F(x)F'(x).

Уровень значимости .

Порядок применения.

1.Формулируется гипотеза H0, выбирается уровень значимости .

2.Получается выборка объема n35 независимых наблюдений. Она группируется в интервальный вариационный ряд.

3.Рассчитываются выборочные характеристики и S (по формулам1-5).

4.Рассчитываются значения эмпирических накопленных частот nxi и теоретических накопленных частот n'xi.

,                                                   (8)

где n - объем выборки, Ф0(u) - функция Лапласа, xi - срединные значения интервалов группировки.

5.Вычисляется значение критерия :

  ,                                                                                   (9)

где - максимальное значение модуля разности между эмпирическими и теоретическими накопленными частотами.

6.Определяется критическое значение - критерия Колмогорова-Смирнова при уровне значимости . Для стандартных уровней значимости критические значения равны:

   0.05=0.895,   0.01=1.035. Они соответствуют рассматриваемому варианту применения критерия Колмогорова-Смирнова, когда для вычисления теоретических накопленных частот используются выборочные характеристики и S В качестве параметров  и  нормального распределения.

7.Вывод: если  - Н0 отвергают, иначе нет оснований отвергнуть гипотезу Н0.

Оба рассмотренных критерия (Пирсона и Колмогорова-Смирнова) применимы в одних и тех же условиях (объем выборки более 40). Сравнение мощностей этих критериев для общего случая затруднительно, но из опыта известно, что критерий  чаще обнаруживает отклонения от нормального распределения при оценки параметров по выборке.

Критерий W Шапиро-Уилки.

(применим при объеме выборки n10)

Порядок применения:

1.Формулируем гипотезу Н0 о соответствии распределения генеральной совокупности, из которой получены данные, нормальному распределению. Назначается уровень значимости  (=0.05).

2.Получить выборку n10  независимых измерений.

3.Рассчитать значение выборочной дисперсии S2.

4.Ранжировать выборку, то есть расположить выборочные значения в возрастающем порядке.

5.Образовать разности k для чего из максимального значения xn вычесть наименьшее x1, затем из xn-1 вычитаем x2 и т.д. Если n четное, то число разностей k=n/2, если n нечетное, то , при этом центральная варианта выборки в образовании разностей не участвует.

6.По табл.2. находим значение коэффициентов ank критерия W Шапиро-Уилки, соответствующие объему выборки и номерам разностей.

7.Находим произведения ankk.

8.Вычисляем величину

                                                            (10)

9.Рассчитать значения критерия  W Шапиро-Уилки.

 

                                                             (11)

10.Из табл.3. находим критическое значение критерия Шапиро - Уилки для уровня значимости : (W0.05=0.842).

12.Если W>W можно говорить о соответствии эмпирических данных нормальному распределению.

В отличие от других критериев, Н0 принимается если W>W.


Контрольные вопросы

  1.  Как понимаете понятие «Ошибка первого рода»?
  2.  Как понимаете понятие «Ошибка второго рода»?
  3.  Назовите основные методы статистической обработки данных, используемых на производстве.
  4.  Для каких производственных параметров применима гистограмма?
  5.  Какой смысл вкладывается в закон шесть сигма?
  6.  Что характеризуют приемочные границы?
  7.  Назовите основные законы распределения случайных величин, встречающиеся на производстве.
  8.  Что характеризует среднее значение?
  9.  Что характеризует стандартное отклонение?
  10.  Что понимается под «Полем рассеяния»?


 

А также другие работы, которые могут Вас заинтересовать

58238. Вирусы 209 KB
  Вопросы к зачету по разделу Молекулярный уровень живой природы Каждому варианту будет предложено 10 вопросов на каждый вопрос нужно дать ответ одним полным предложением Какие элементы входят в состав углеводов Запишите общую формулу углеводов.
58242. Носовые гласные 139.5 KB
  Носовые гласные составляют одну из особенностей французского вокализма. В образовании их принимают участие как ротовой резонатор, так и резонатор носовой полости.
58243. Ускорение. Движение с постоянным ускорением. Уравнение движения 89.5 KB
  При движении любых тел их скорость может меняться, либо по модулю, либо по направлению, или одновременно и по модулю и по направлению. Движение может быть криволинейным и неравномерным, тогда скорость будет меняться и по модулю и по направлению. В это случае тело движется с ускорением.
58244. Клеточная теория. Клеточная мембрана 113.5 KB
  Клетки различных органов животных растений грибов внешне не очень похожи друг на друга. Все клетки сходны по строению химическому составу и жизненным функциям.
58245. Носовой гласный заднего ряда 117 KB
  Язык слегка оттянут назад, кончик языка опущен вниз у альвеол нижних резцов. Рот широко открыт, губы напряжены. [ɔ̃] сохраняет полную долготу перед согласным в конце ритмической группы, сокращает долготу в неударном положении и теряет долготу в абсолютном исходе...