6611

Описательная статистика и обработка статистических данных в процессе проектирования авиационных двигателей

Контрольная

Социология, социальная работа и статистика

Описательная статистика Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят...

Русский

2013-01-06

505.72 KB

17 чел.

Описательная статистика

Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят: числовые характеристики случайных величин (среднее, стандартное отклонение, мода, медиана, дисперсия, эксцесс, асимметрия); построение полигона частот и гистограмм; подбор закона распределения, корреляционный и регрессионный анализ, кластерный анализ и др.

Основная статистическая обработка экспериментальных данных – нахождения среднего значения, стандартного (среднеквадратического) отклонения и др., а также для построения гистограммы может осуществляться с помощью программных инструментальных средств, например пакета «Статистика».

Рис.1. Обработка статистических данных.

Результаты статистической обработки:  число вариант, среднее, минимальное и максимальное значения, стандартное отклонение..

Построение гистограммы

Рис.  Гистограмма характеризует рассеяние случайной величины (производственного параметра).

Подбор закона распределения необходим для прогнозирования параметров процессов.

Например – нормальный закон распределения:

Или закон равной вероятности

Обосновать применимость того или иного закона можно с помощью критериев проверки статистических гипотез

Статистической называют гипотезу о виде неизвестных распределений или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу H0.

Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.

или

или

Отвергнута

Принята

Отвергнута

Ошибка первого рода

Принята

Ошибка второго рода

Ложная

Соответствует действительности (правильная)

ИЛИ

Гипотеза H01)

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначается через .

Статистическим критерием (критерием) называют случайную величину К, которая служит для проверки гипотезы.

Наблюдаемым (эмпирическим) значением Кнабл называют то значение критерия, которое вычислено по выборке.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы (область допустимых значений) - совокупность значений критерия, при которых нулевую гипотезу принимают.

двусторонняя

левосторонняя

правосторонняя

Критическая область

Критическая область

0

Ккр

Ккр

К

Ккр

К

К

Ккр

Критическая область

Критическая область

Для отыскания критической области задаются уровнем значимости  и определяют критические точки.

Для правосторонней критической области Р(К>Ккр)=          (Ккр>0);

для левосторонней критической области Р(К<Ккр)=          (Ккр<0);

для двусторонней критической области Р(К>Ккр)=/2          (Ккр>0)

                                                                    Р(К<-Ккр)=/2.

Критерий согласия 2 (хи-квадрат)

Критерий согласия 2 (критерий Пирсона) разработан лучше других критериев и чаще используется. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми).

Условия применения: объем выборки n40, выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.

Выдвигаемая гипотеза Н0: f(x)=f '(x) - плотность распределения f(x) генеральной совокупности, из которой взята выборка, соответствует теоретической модели f '(x) (нормального распределения, равномерного распределения ...).

Альтернатива Н1: f(x)f '(x).

Уровень значимости .

Порядок применения:

1.Формулируется гипотеза, выбирается уровень значимости .

2.Получается выборка объема n40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.

3.Рассчитываются выборочные характеристики и S.

  - среднее выборочное (аналог математического ожидания)

          ,                                                                            (1)

где n - объем выборки, xi - варианты выборки.

Если данные сгруппированы, то среднее выборочное

        ,                                                                           (2)

где k - число интервалов группировки, ni - частоты интервалов, xi - срединные значения интервалов.

S - стандартное отклонение (среднее квадратическое отклонение).

,                                             (3)

                                                        (4)

Если данные сгруппированы

                                                        (5)

и S используют в качестве генеральных параметров  (математического ожидания) и  (среднего квадратического отклонения).

4.Вычисляются значения теоретических частот попадания в i-й интервал группировки.

В случае проверки гипотезы о нормальном распределении генеральной совокупности по выборке:

,                                         (6)

где Ф0(u) - функция Лапласа, xвi и  xнi - верхняя и нижняя границы i-го интервала группировки.

Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была бы не меньше 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.

5.Значение 2 - критерия рассчитываются по формуле

,                                                                (7)

где ni - эмпирические частоты, - ожидаемые (теоретические) частоты, k - число интервалов после группировки.

6.Из табл.1 находится критическое значение критерия Пирсона для уровня значимости  и числа степеней свободы =k-3.

7.Если - гипотезу о (нормальном, равномерном...) распределении генеральной совокупности Н0 отвергают. В противном случае нет оснований отвергать Н0.

Критерий  (ламбда) Колмогорова-Смирнова.

Гипотеза Н0 формулируется по отношению к функциям распределения F(x) и F'(x).

F(x) функция распределения генеральной совокупности, из которой получена выборка.

F'(x) - функция непрерывного теоретического (нормального) распределения.

Условия применения: объем выборки n35, эмпирическое распределение представлено в виде интервального вариационного ряда.

Гипотеза Н0: F(x)=F'(x).

Альтернатива Н1: F(x)F'(x).

Уровень значимости .

Порядок применения.

1.Формулируется гипотеза H0, выбирается уровень значимости .

2.Получается выборка объема n35 независимых наблюдений. Она группируется в интервальный вариационный ряд.

3.Рассчитываются выборочные характеристики и S (по формулам1-5).

4.Рассчитываются значения эмпирических накопленных частот nxi и теоретических накопленных частот n'xi.

,                                                   (8)

где n - объем выборки, Ф0(u) - функция Лапласа, xi - срединные значения интервалов группировки.

5.Вычисляется значение критерия :

  ,                                                                                   (9)

где - максимальное значение модуля разности между эмпирическими и теоретическими накопленными частотами.

6.Определяется критическое значение - критерия Колмогорова-Смирнова при уровне значимости . Для стандартных уровней значимости критические значения равны:

   0.05=0.895,   0.01=1.035. Они соответствуют рассматриваемому варианту применения критерия Колмогорова-Смирнова, когда для вычисления теоретических накопленных частот используются выборочные характеристики и S В качестве параметров  и  нормального распределения.

7.Вывод: если  - Н0 отвергают, иначе нет оснований отвергнуть гипотезу Н0.

Оба рассмотренных критерия (Пирсона и Колмогорова-Смирнова) применимы в одних и тех же условиях (объем выборки более 40). Сравнение мощностей этих критериев для общего случая затруднительно, но из опыта известно, что критерий  чаще обнаруживает отклонения от нормального распределения при оценки параметров по выборке.

Критерий W Шапиро-Уилки.

(применим при объеме выборки n10)

Порядок применения:

1.Формулируем гипотезу Н0 о соответствии распределения генеральной совокупности, из которой получены данные, нормальному распределению. Назначается уровень значимости  (=0.05).

2.Получить выборку n10  независимых измерений.

3.Рассчитать значение выборочной дисперсии S2.

4.Ранжировать выборку, то есть расположить выборочные значения в возрастающем порядке.

5.Образовать разности k для чего из максимального значения xn вычесть наименьшее x1, затем из xn-1 вычитаем x2 и т.д. Если n четное, то число разностей k=n/2, если n нечетное, то , при этом центральная варианта выборки в образовании разностей не участвует.

6.По табл.2. находим значение коэффициентов ank критерия W Шапиро-Уилки, соответствующие объему выборки и номерам разностей.

7.Находим произведения ankk.

8.Вычисляем величину

                                                            (10)

9.Рассчитать значения критерия  W Шапиро-Уилки.

 

                                                             (11)

10.Из табл.3. находим критическое значение критерия Шапиро - Уилки для уровня значимости : (W0.05=0.842).

12.Если W>W можно говорить о соответствии эмпирических данных нормальному распределению.

В отличие от других критериев, Н0 принимается если W>W.


Контрольные вопросы

  1.  Как понимаете понятие «Ошибка первого рода»?
  2.  Как понимаете понятие «Ошибка второго рода»?
  3.  Назовите основные методы статистической обработки данных, используемых на производстве.
  4.  Для каких производственных параметров применима гистограмма?
  5.  Какой смысл вкладывается в закон шесть сигма?
  6.  Что характеризуют приемочные границы?
  7.  Назовите основные законы распределения случайных величин, встречающиеся на производстве.
  8.  Что характеризует среднее значение?
  9.  Что характеризует стандартное отклонение?
  10.  Что понимается под «Полем рассеяния»?


 

А также другие работы, которые могут Вас заинтересовать

69919. Предмет и задачи информатики 102 KB
  Наскальная живопись клинопись устная речь музыкальные звуки нотные знаки для их записи алфавит телеграф радио телефон телевидение компьютеры вот лишь некоторые звенья цепи попыток совершенствовать способы получения сохранения обработки и передачи информации.
69920. История как наука 63.5 KB
  Историческая наука: предмет особенности функции. Историческая наука: предмет особенности функции. Предмет исторической науки прошлое человеческого общества Особенности исторической науки: гуманитарная наука субъективность исторического знания тесная связь истории с политикой...
69921. Предмет и задачи истории как науки 83 KB
  Превращение истории из отрасли культуры в науку представляло собой довольно длительный процесс и завершилось на рубеже XIX-XX вв. Объект изучения для истории вся совокупность фактов характеризующих жизнь общества и в прошлом и в настоящем.
69922. История журналистского образования 120 KB
  Общая структура курса Основы журналистики История журналистского образования Первые журналистские школы стали появляться на рубеже XIXXX вв. Родоначальницей журналистского образования в Европе считается Высшая школа социальных наук в Париже со специальным факультетом журналистики.
69923. История развития техники 51 KB
  Индустрия туризма включает туроператорские и турагентские фирмы средства размещения предприятия питания транспортные средства спортивные и культурно-анимационные учреждения. Современный туризм немыслим без развитой инфраструктуры: средств связи транспортных систем энергетических систем...
69924. ПРЕДЫСТОРИЯ СЕСТРИНСКОГО ДЕЛА 165 KB
  Медицина существует столько же, сколько существует культура. Медицина является не только наукой, но и социальным институтом, т.е. исторически обусловленной системой социальных учреждений. О сестринском деле говорят, что это самая юная наука и самое древнее искусство.
69925. Господарське право в системі права України 111.5 KB
  Своєрідність господарських відносин, що становлять предмет правового регулювання, та методів їх регулювання створюють господарське право як самостійну та особливу галузь права. Господарське право як галузь права та законодавства виникла пізніше багатьох інших правових галузей...
69926. Киевская Русь: образование и основные тенденции развития государственности 102 KB
  Вопросы: Происхождение восточных славян их социальная и общественная организация. Индоевропейская семья представлена в нашей стране в основном славянской иранской армянской и греческой группами. Самая большая славянская группа подразделяется на три подгруппы: восточную западную и южную.
69927. КРАТКАЯ ИСТОРИЯ ЗАКОНОДАТЕЛЬСТВА, РЕГЛАМЕНТИРУЮЩЕГО ДЕЯТЕЛЬНОСТЬ МЕДИЦИНСКИХ РАБОТНИКОВ 41 KB
  Элементы правового регулирования медицинской деятельности появились одновременно с зарождением медицины. Но уже появляются отдельные указы посвященные вопросам медицинской деятельности. Большую роль в истории правовой регламентации медицинской деятельности сыграл...