6611

Описательная статистика и обработка статистических данных в процессе проектирования авиационных двигателей

Контрольная

Социология, социальная работа и статистика

Описательная статистика Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят...

Русский

2013-01-06

505.72 KB

17 чел.

Описательная статистика

Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят: числовые характеристики случайных величин (среднее, стандартное отклонение, мода, медиана, дисперсия, эксцесс, асимметрия); построение полигона частот и гистограмм; подбор закона распределения, корреляционный и регрессионный анализ, кластерный анализ и др.

Основная статистическая обработка экспериментальных данных – нахождения среднего значения, стандартного (среднеквадратического) отклонения и др., а также для построения гистограммы может осуществляться с помощью программных инструментальных средств, например пакета «Статистика».

Рис.1. Обработка статистических данных.

Результаты статистической обработки:  число вариант, среднее, минимальное и максимальное значения, стандартное отклонение..

Построение гистограммы

Рис.  Гистограмма характеризует рассеяние случайной величины (производственного параметра).

Подбор закона распределения необходим для прогнозирования параметров процессов.

Например – нормальный закон распределения:

Или закон равной вероятности

Обосновать применимость того или иного закона можно с помощью критериев проверки статистических гипотез

Статистической называют гипотезу о виде неизвестных распределений или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу H0.

Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.

или

или

Отвергнута

Принята

Отвергнута

Ошибка первого рода

Принята

Ошибка второго рода

Ложная

Соответствует действительности (правильная)

ИЛИ

Гипотеза H01)

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначается через .

Статистическим критерием (критерием) называют случайную величину К, которая служит для проверки гипотезы.

Наблюдаемым (эмпирическим) значением Кнабл называют то значение критерия, которое вычислено по выборке.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы (область допустимых значений) - совокупность значений критерия, при которых нулевую гипотезу принимают.

двусторонняя

левосторонняя

правосторонняя

Критическая область

Критическая область

0

Ккр

Ккр

К

Ккр

К

К

Ккр

Критическая область

Критическая область

Для отыскания критической области задаются уровнем значимости  и определяют критические точки.

Для правосторонней критической области Р(К>Ккр)=          (Ккр>0);

для левосторонней критической области Р(К<Ккр)=          (Ккр<0);

для двусторонней критической области Р(К>Ккр)=/2          (Ккр>0)

                                                                    Р(К<-Ккр)=/2.

Критерий согласия 2 (хи-квадрат)

Критерий согласия 2 (критерий Пирсона) разработан лучше других критериев и чаще используется. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми).

Условия применения: объем выборки n40, выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.

Выдвигаемая гипотеза Н0: f(x)=f '(x) - плотность распределения f(x) генеральной совокупности, из которой взята выборка, соответствует теоретической модели f '(x) (нормального распределения, равномерного распределения ...).

Альтернатива Н1: f(x)f '(x).

Уровень значимости .

Порядок применения:

1.Формулируется гипотеза, выбирается уровень значимости .

2.Получается выборка объема n40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.

3.Рассчитываются выборочные характеристики и S.

  - среднее выборочное (аналог математического ожидания)

          ,                                                                            (1)

где n - объем выборки, xi - варианты выборки.

Если данные сгруппированы, то среднее выборочное

        ,                                                                           (2)

где k - число интервалов группировки, ni - частоты интервалов, xi - срединные значения интервалов.

S - стандартное отклонение (среднее квадратическое отклонение).

,                                             (3)

                                                        (4)

Если данные сгруппированы

                                                        (5)

и S используют в качестве генеральных параметров  (математического ожидания) и  (среднего квадратического отклонения).

4.Вычисляются значения теоретических частот попадания в i-й интервал группировки.

В случае проверки гипотезы о нормальном распределении генеральной совокупности по выборке:

,                                         (6)

где Ф0(u) - функция Лапласа, xвi и  xнi - верхняя и нижняя границы i-го интервала группировки.

Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была бы не меньше 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.

5.Значение 2 - критерия рассчитываются по формуле

,                                                                (7)

где ni - эмпирические частоты, - ожидаемые (теоретические) частоты, k - число интервалов после группировки.

6.Из табл.1 находится критическое значение критерия Пирсона для уровня значимости  и числа степеней свободы =k-3.

7.Если - гипотезу о (нормальном, равномерном...) распределении генеральной совокупности Н0 отвергают. В противном случае нет оснований отвергать Н0.

Критерий  (ламбда) Колмогорова-Смирнова.

Гипотеза Н0 формулируется по отношению к функциям распределения F(x) и F'(x).

F(x) функция распределения генеральной совокупности, из которой получена выборка.

F'(x) - функция непрерывного теоретического (нормального) распределения.

Условия применения: объем выборки n35, эмпирическое распределение представлено в виде интервального вариационного ряда.

Гипотеза Н0: F(x)=F'(x).

Альтернатива Н1: F(x)F'(x).

Уровень значимости .

Порядок применения.

1.Формулируется гипотеза H0, выбирается уровень значимости .

2.Получается выборка объема n35 независимых наблюдений. Она группируется в интервальный вариационный ряд.

3.Рассчитываются выборочные характеристики и S (по формулам1-5).

4.Рассчитываются значения эмпирических накопленных частот nxi и теоретических накопленных частот n'xi.

,                                                   (8)

где n - объем выборки, Ф0(u) - функция Лапласа, xi - срединные значения интервалов группировки.

5.Вычисляется значение критерия :

  ,                                                                                   (9)

где - максимальное значение модуля разности между эмпирическими и теоретическими накопленными частотами.

6.Определяется критическое значение - критерия Колмогорова-Смирнова при уровне значимости . Для стандартных уровней значимости критические значения равны:

   0.05=0.895,   0.01=1.035. Они соответствуют рассматриваемому варианту применения критерия Колмогорова-Смирнова, когда для вычисления теоретических накопленных частот используются выборочные характеристики и S В качестве параметров  и  нормального распределения.

7.Вывод: если  - Н0 отвергают, иначе нет оснований отвергнуть гипотезу Н0.

Оба рассмотренных критерия (Пирсона и Колмогорова-Смирнова) применимы в одних и тех же условиях (объем выборки более 40). Сравнение мощностей этих критериев для общего случая затруднительно, но из опыта известно, что критерий  чаще обнаруживает отклонения от нормального распределения при оценки параметров по выборке.

Критерий W Шапиро-Уилки.

(применим при объеме выборки n10)

Порядок применения:

1.Формулируем гипотезу Н0 о соответствии распределения генеральной совокупности, из которой получены данные, нормальному распределению. Назначается уровень значимости  (=0.05).

2.Получить выборку n10  независимых измерений.

3.Рассчитать значение выборочной дисперсии S2.

4.Ранжировать выборку, то есть расположить выборочные значения в возрастающем порядке.

5.Образовать разности k для чего из максимального значения xn вычесть наименьшее x1, затем из xn-1 вычитаем x2 и т.д. Если n четное, то число разностей k=n/2, если n нечетное, то , при этом центральная варианта выборки в образовании разностей не участвует.

6.По табл.2. находим значение коэффициентов ank критерия W Шапиро-Уилки, соответствующие объему выборки и номерам разностей.

7.Находим произведения ankk.

8.Вычисляем величину

                                                            (10)

9.Рассчитать значения критерия  W Шапиро-Уилки.

 

                                                             (11)

10.Из табл.3. находим критическое значение критерия Шапиро - Уилки для уровня значимости : (W0.05=0.842).

12.Если W>W можно говорить о соответствии эмпирических данных нормальному распределению.

В отличие от других критериев, Н0 принимается если W>W.


Контрольные вопросы

  1.  Как понимаете понятие «Ошибка первого рода»?
  2.  Как понимаете понятие «Ошибка второго рода»?
  3.  Назовите основные методы статистической обработки данных, используемых на производстве.
  4.  Для каких производственных параметров применима гистограмма?
  5.  Какой смысл вкладывается в закон шесть сигма?
  6.  Что характеризуют приемочные границы?
  7.  Назовите основные законы распределения случайных величин, встречающиеся на производстве.
  8.  Что характеризует среднее значение?
  9.  Что характеризует стандартное отклонение?
  10.  Что понимается под «Полем рассеяния»?


 

А также другие работы, которые могут Вас заинтересовать

60214. Овочева країна 70.5 KB
  На дошці напис Овочева країна мультимедійна презентація матеріали для конкурсів Слайд №2 Дивина така в природі: У бабусі на городі Різні овочі ростуть Розповзаються цвітуть. Виростила я чудові овочі.
60215. Свято «Прощавай, Букварику!» 119 KB
  На уроках читання ми познайомилися із казкою Муха – Цокотуха і від нас тобі а також всім нашим батькам і гостям які завітали до нас на свято в дарунок ця казка. Мелодія Приходи Казка Муха Цокотуха Автор: Ось на воліпід дубком жила Муха під листком.
60216. Інтегрований виховний захід: «Країна чаю» 687 KB
  Мета: розширити знання учнів про чай історію його виникнення територію поширення та цілющі властивості ознайомити учнів з китайською та британською технологіями заварювання чаю поєднати знання учнів з ряду предметів історії географії...
60217. Математическое детективное агентство 139 KB
  Ведущие: Шерлок Холмс и доктор Ватсон. Звучит музыкальная заставка из х ф Шерлок Холмс и др Ватсон. Ватсон: Добрый день Холмс Шерлок Холмс: Добрый день Ватсон Ватсон: Вы просматривали утренние газеты Опять громкое дело...
60218. Здорові діти – здорове майбутнє 96.5 KB
  Кожна правильна відповідь кожне правильно виконане завдання будуть робити наших гостей чистішими та здоровішими. годинник Завдання: Режим дня кожна команда отримує набір карток з написами сніданок обід вечеря прогулянка...
60219. СТЕЖКАМИ РІДНОЇ ДОНЕЧЧИНИ! 179 KB
  Мета: нагадати учням про найславетніші місця рідного краю, символи; формувати громадянську позицію, сталий світогляд; розвивати вміння узагальнювати матеріал, робити висновки; виховувати почуття патріотизму...
60220. ЩО МИ ЗНАЄМО, ЩО ВМІЄМО 230.5 KB
  Методична розробка відкритого поза аудиторного заходу з дисципліни Навчальна практика з хімічного аналізу тугоплавких неметалевих і силікатних матеріалів і виробів.