6611

Описательная статистика и обработка статистических данных в процессе проектирования авиационных двигателей

Контрольная

Социология, социальная работа и статистика

Описательная статистика Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят...

Русский

2013-01-06

505.72 KB

17 чел.

Описательная статистика

Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят: числовые характеристики случайных величин (среднее, стандартное отклонение, мода, медиана, дисперсия, эксцесс, асимметрия); построение полигона частот и гистограмм; подбор закона распределения, корреляционный и регрессионный анализ, кластерный анализ и др.

Основная статистическая обработка экспериментальных данных – нахождения среднего значения, стандартного (среднеквадратического) отклонения и др., а также для построения гистограммы может осуществляться с помощью программных инструментальных средств, например пакета «Статистика».

Рис.1. Обработка статистических данных.

Результаты статистической обработки:  число вариант, среднее, минимальное и максимальное значения, стандартное отклонение..

Построение гистограммы

Рис.  Гистограмма характеризует рассеяние случайной величины (производственного параметра).

Подбор закона распределения необходим для прогнозирования параметров процессов.

Например – нормальный закон распределения:

Или закон равной вероятности

Обосновать применимость того или иного закона можно с помощью критериев проверки статистических гипотез

Статистической называют гипотезу о виде неизвестных распределений или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу H0.

Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.

или

или

Отвергнута

Принята

Отвергнута

Ошибка первого рода

Принята

Ошибка второго рода

Ложная

Соответствует действительности (правильная)

ИЛИ

Гипотеза H01)

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначается через .

Статистическим критерием (критерием) называют случайную величину К, которая служит для проверки гипотезы.

Наблюдаемым (эмпирическим) значением Кнабл называют то значение критерия, которое вычислено по выборке.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы (область допустимых значений) - совокупность значений критерия, при которых нулевую гипотезу принимают.

двусторонняя

левосторонняя

правосторонняя

Критическая область

Критическая область

0

Ккр

Ккр

К

Ккр

К

К

Ккр

Критическая область

Критическая область

Для отыскания критической области задаются уровнем значимости  и определяют критические точки.

Для правосторонней критической области Р(К>Ккр)=          (Ккр>0);

для левосторонней критической области Р(К<Ккр)=          (Ккр<0);

для двусторонней критической области Р(К>Ккр)=/2          (Ккр>0)

                                                                    Р(К<-Ккр)=/2.

Критерий согласия 2 (хи-квадрат)

Критерий согласия 2 (критерий Пирсона) разработан лучше других критериев и чаще используется. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми).

Условия применения: объем выборки n40, выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.

Выдвигаемая гипотеза Н0: f(x)=f '(x) - плотность распределения f(x) генеральной совокупности, из которой взята выборка, соответствует теоретической модели f '(x) (нормального распределения, равномерного распределения ...).

Альтернатива Н1: f(x)f '(x).

Уровень значимости .

Порядок применения:

1.Формулируется гипотеза, выбирается уровень значимости .

2.Получается выборка объема n40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.

3.Рассчитываются выборочные характеристики и S.

  - среднее выборочное (аналог математического ожидания)

          ,                                                                            (1)

где n - объем выборки, xi - варианты выборки.

Если данные сгруппированы, то среднее выборочное

        ,                                                                           (2)

где k - число интервалов группировки, ni - частоты интервалов, xi - срединные значения интервалов.

S - стандартное отклонение (среднее квадратическое отклонение).

,                                             (3)

                                                        (4)

Если данные сгруппированы

                                                        (5)

и S используют в качестве генеральных параметров  (математического ожидания) и  (среднего квадратического отклонения).

4.Вычисляются значения теоретических частот попадания в i-й интервал группировки.

В случае проверки гипотезы о нормальном распределении генеральной совокупности по выборке:

,                                         (6)

где Ф0(u) - функция Лапласа, xвi и  xнi - верхняя и нижняя границы i-го интервала группировки.

Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была бы не меньше 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.

5.Значение 2 - критерия рассчитываются по формуле

,                                                                (7)

где ni - эмпирические частоты, - ожидаемые (теоретические) частоты, k - число интервалов после группировки.

6.Из табл.1 находится критическое значение критерия Пирсона для уровня значимости  и числа степеней свободы =k-3.

7.Если - гипотезу о (нормальном, равномерном...) распределении генеральной совокупности Н0 отвергают. В противном случае нет оснований отвергать Н0.

Критерий  (ламбда) Колмогорова-Смирнова.

Гипотеза Н0 формулируется по отношению к функциям распределения F(x) и F'(x).

F(x) функция распределения генеральной совокупности, из которой получена выборка.

F'(x) - функция непрерывного теоретического (нормального) распределения.

Условия применения: объем выборки n35, эмпирическое распределение представлено в виде интервального вариационного ряда.

Гипотеза Н0: F(x)=F'(x).

Альтернатива Н1: F(x)F'(x).

Уровень значимости .

Порядок применения.

1.Формулируется гипотеза H0, выбирается уровень значимости .

2.Получается выборка объема n35 независимых наблюдений. Она группируется в интервальный вариационный ряд.

3.Рассчитываются выборочные характеристики и S (по формулам1-5).

4.Рассчитываются значения эмпирических накопленных частот nxi и теоретических накопленных частот n'xi.

,                                                   (8)

где n - объем выборки, Ф0(u) - функция Лапласа, xi - срединные значения интервалов группировки.

5.Вычисляется значение критерия :

  ,                                                                                   (9)

где - максимальное значение модуля разности между эмпирическими и теоретическими накопленными частотами.

6.Определяется критическое значение - критерия Колмогорова-Смирнова при уровне значимости . Для стандартных уровней значимости критические значения равны:

   0.05=0.895,   0.01=1.035. Они соответствуют рассматриваемому варианту применения критерия Колмогорова-Смирнова, когда для вычисления теоретических накопленных частот используются выборочные характеристики и S В качестве параметров  и  нормального распределения.

7.Вывод: если  - Н0 отвергают, иначе нет оснований отвергнуть гипотезу Н0.

Оба рассмотренных критерия (Пирсона и Колмогорова-Смирнова) применимы в одних и тех же условиях (объем выборки более 40). Сравнение мощностей этих критериев для общего случая затруднительно, но из опыта известно, что критерий  чаще обнаруживает отклонения от нормального распределения при оценки параметров по выборке.

Критерий W Шапиро-Уилки.

(применим при объеме выборки n10)

Порядок применения:

1.Формулируем гипотезу Н0 о соответствии распределения генеральной совокупности, из которой получены данные, нормальному распределению. Назначается уровень значимости  (=0.05).

2.Получить выборку n10  независимых измерений.

3.Рассчитать значение выборочной дисперсии S2.

4.Ранжировать выборку, то есть расположить выборочные значения в возрастающем порядке.

5.Образовать разности k для чего из максимального значения xn вычесть наименьшее x1, затем из xn-1 вычитаем x2 и т.д. Если n четное, то число разностей k=n/2, если n нечетное, то , при этом центральная варианта выборки в образовании разностей не участвует.

6.По табл.2. находим значение коэффициентов ank критерия W Шапиро-Уилки, соответствующие объему выборки и номерам разностей.

7.Находим произведения ankk.

8.Вычисляем величину

                                                            (10)

9.Рассчитать значения критерия  W Шапиро-Уилки.

 

                                                             (11)

10.Из табл.3. находим критическое значение критерия Шапиро - Уилки для уровня значимости : (W0.05=0.842).

12.Если W>W можно говорить о соответствии эмпирических данных нормальному распределению.

В отличие от других критериев, Н0 принимается если W>W.


Контрольные вопросы

  1.  Как понимаете понятие «Ошибка первого рода»?
  2.  Как понимаете понятие «Ошибка второго рода»?
  3.  Назовите основные методы статистической обработки данных, используемых на производстве.
  4.  Для каких производственных параметров применима гистограмма?
  5.  Какой смысл вкладывается в закон шесть сигма?
  6.  Что характеризуют приемочные границы?
  7.  Назовите основные законы распределения случайных величин, встречающиеся на производстве.
  8.  Что характеризует среднее значение?
  9.  Что характеризует стандартное отклонение?
  10.  Что понимается под «Полем рассеяния»?


 

А также другие работы, которые могут Вас заинтересовать

54725. Is it easy to be young? 67.5 KB
  The United Nations Organization is an international organization to which nearly all the countries in the world belong. Its head offices are in New York . The UN tries to make sure there is peace in world and that all countries work together to deal with international problems. The UN Convention on the Rights of the Child sets out in a number of statements called articles, the rights which all children and young people up to the age of 18 should have.
54726. Розрахунок і видача кредиту на прикладі підприємства ТОВ «Іва» 893 KB
  Позики, виконуючи функції кредиту, мають різні форми і допомагають більш гнучко використовувати отримані кошти. Підприємство може отримати позику в найбільш зручній для себе формі - безпосередньо позику
54727. Система смазки 264 KB
  Новая тема - Система смазки дизелей. 1 Назначение системы и виды систем смазки дизелей – под запись -10 мин. 2 Устройство (состав) системы смазки дизелей – на экране система смазки двигателя К-661 и анимация ее работы – 5 мин. 3 1-я подгруппа идет смотреть системы смазки дизелей в лаб. №008 – 7 мин. 2-я подгруппа выписывает из учебника стр.153 состав и назначение элементов комбинированной системы смазки. - 7 мин 4 Подгруппы меняются местами.
54728. Формы музыки. Рондо 43.5 KB
  Цель урока: развитие и закрепление темы Формы музыки; знакомство с новой формой рондо; разучивание песни Новый год Задачи: развивать восприятие память внимание учащихся а также исполнительские творческие навыки; пробуждать художественно-образное мышление любовь к музыке; активизировать самостоятельную познавательную деятельность.
54729. СЕРДЕЧНО - СОСУДИСТЫЕ ЗАБОЛЕВАНИЯ - КЛИНИКА И ПРОГНОЗ 101 KB
  Толстого: Все мысли о смерти нужны для жизни а тема урока заболевания сердечнососудистой системы оказание первой помощи. На уроке мы рассмотрим с вами следующие вопросы: Причины сердечнососудистых заболеваний. Профилактика сердечнососудистых заболеваний. Часто причиной смерти являются болезни сердечнососудистой системы.
54730. Обработка накладного кармана 463.5 KB
  Задачи урока: познакомить с историческими сведениями о кармане, его роли в современной одежде, тренировать глазомер, приобщать к работе в коллективе, учить аккуратному выполнению швов. Тип урока: урок усвоения нового материала. Формы работы: фронтальная. групповая.
54732. Класс Земноводные. Особенности внешнего строения в связи со средой обитания 55.5 KB
  Цель урока: Выявить во внешнем строении лягушки черты приспособленности к обитанию в двух средах наземно-воздушной и водной и водной лягушки Да действительно сегодня на уроке мы с вами будем изучать представителей класса Земноводных или Амфибий. К классу Земноводных относятся не только лягушки. Бесхвостые лягушки жабы квакши живут в водоемах и вблизи от них.
54733. Лоскутный коллаж 61.5 KB
  1 слайд Я готова подарить вам мир модных и стильных вещей на основе лоскута. слайд 2 С чего же все началось слайд 2 Лоскутное шитье исходно возникло в среде бедняков как необходимость малыми средствами создать красивые вещи. слайд 3 В настоящее время лоскутное шитье сохраняет этот смысл однако современный его статус значительно выше. слайд 4 Лоскутная техника шитья популярна у многих народов.