6611

Описательная статистика и обработка статистических данных в процессе проектирования авиационных двигателей

Контрольная

Социология, социальная работа и статистика

Описательная статистика Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят...

Русский

2013-01-06

505.72 KB

17 чел.

Описательная статистика

Описательная статистика представляется наиболее широко применяемыми методами математической статистики, используемыми для первичной обработки и наглядного представления статистических данных. К рассматриваемым методам относят: числовые характеристики случайных величин (среднее, стандартное отклонение, мода, медиана, дисперсия, эксцесс, асимметрия); построение полигона частот и гистограмм; подбор закона распределения, корреляционный и регрессионный анализ, кластерный анализ и др.

Основная статистическая обработка экспериментальных данных – нахождения среднего значения, стандартного (среднеквадратического) отклонения и др., а также для построения гистограммы может осуществляться с помощью программных инструментальных средств, например пакета «Статистика».

Рис.1. Обработка статистических данных.

Результаты статистической обработки:  число вариант, среднее, минимальное и максимальное значения, стандартное отклонение..

Построение гистограммы

Рис.  Гистограмма характеризует рассеяние случайной величины (производственного параметра).

Подбор закона распределения необходим для прогнозирования параметров процессов.

Например – нормальный закон распределения:

Или закон равной вероятности

Обосновать применимость того или иного закона можно с помощью критериев проверки статистических гипотез

Статистической называют гипотезу о виде неизвестных распределений или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу H0.

Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.

или

или

Отвергнута

Принята

Отвергнута

Ошибка первого рода

Принята

Ошибка второго рода

Ложная

Соответствует действительности (правильная)

ИЛИ

Гипотеза H01)

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначается через .

Статистическим критерием (критерием) называют случайную величину К, которая служит для проверки гипотезы.

Наблюдаемым (эмпирическим) значением Кнабл называют то значение критерия, которое вычислено по выборке.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Область принятия гипотезы (область допустимых значений) - совокупность значений критерия, при которых нулевую гипотезу принимают.

двусторонняя

левосторонняя

правосторонняя

Критическая область

Критическая область

0

Ккр

Ккр

К

Ккр

К

К

Ккр

Критическая область

Критическая область

Для отыскания критической области задаются уровнем значимости  и определяют критические точки.

Для правосторонней критической области Р(К>Ккр)=          (Ккр>0);

для левосторонней критической области Р(К<Ккр)=          (Ккр<0);

для двусторонней критической области Р(К>Ккр)=/2          (Ккр>0)

                                                                    Р(К<-Ккр)=/2.

Критерий согласия 2 (хи-квадрат)

Критерий согласия 2 (критерий Пирсона) разработан лучше других критериев и чаще используется. Он основан на сравнении эмпирических частот интервалов группировки с теоретическими (ожидаемыми).

Условия применения: объем выборки n40, выборочные данные сгруппированы в интервальный вариационный ряд с числом интервалов не менее 7, ожидаемые (теоретические) частоты интервалов не должны быть меньше 5.

Выдвигаемая гипотеза Н0: f(x)=f '(x) - плотность распределения f(x) генеральной совокупности, из которой взята выборка, соответствует теоретической модели f '(x) (нормального распределения, равномерного распределения ...).

Альтернатива Н1: f(x)f '(x).

Уровень значимости .

Порядок применения:

1.Формулируется гипотеза, выбирается уровень значимости .

2.Получается выборка объема n40 независимых наблюдений и представляется эмпирическое распределение в виде интервального вариационного ряда.

3.Рассчитываются выборочные характеристики и S.

  - среднее выборочное (аналог математического ожидания)

          ,                                                                            (1)

где n - объем выборки, xi - варианты выборки.

Если данные сгруппированы, то среднее выборочное

        ,                                                                           (2)

где k - число интервалов группировки, ni - частоты интервалов, xi - срединные значения интервалов.

S - стандартное отклонение (среднее квадратическое отклонение).

,                                             (3)

                                                        (4)

Если данные сгруппированы

                                                        (5)

и S используют в качестве генеральных параметров  (математического ожидания) и  (среднего квадратического отклонения).

4.Вычисляются значения теоретических частот попадания в i-й интервал группировки.

В случае проверки гипотезы о нормальном распределении генеральной совокупности по выборке:

,                                         (6)

где Ф0(u) - функция Лапласа, xвi и  xнi - верхняя и нижняя границы i-го интервала группировки.

Если окажется, что вычисленные ожидаемые частоты некоторых интервалов группировки меньше 5, то соседние интервалы объединяются так, чтобы сумма их ожидаемых частот была бы не меньше 5. Соответственно складываются и эмпирические частоты объединяемых интервалов.

5.Значение 2 - критерия рассчитываются по формуле

,                                                                (7)

где ni - эмпирические частоты, - ожидаемые (теоретические) частоты, k - число интервалов после группировки.

6.Из табл.1 находится критическое значение критерия Пирсона для уровня значимости  и числа степеней свободы =k-3.

7.Если - гипотезу о (нормальном, равномерном...) распределении генеральной совокупности Н0 отвергают. В противном случае нет оснований отвергать Н0.

Критерий  (ламбда) Колмогорова-Смирнова.

Гипотеза Н0 формулируется по отношению к функциям распределения F(x) и F'(x).

F(x) функция распределения генеральной совокупности, из которой получена выборка.

F'(x) - функция непрерывного теоретического (нормального) распределения.

Условия применения: объем выборки n35, эмпирическое распределение представлено в виде интервального вариационного ряда.

Гипотеза Н0: F(x)=F'(x).

Альтернатива Н1: F(x)F'(x).

Уровень значимости .

Порядок применения.

1.Формулируется гипотеза H0, выбирается уровень значимости .

2.Получается выборка объема n35 независимых наблюдений. Она группируется в интервальный вариационный ряд.

3.Рассчитываются выборочные характеристики и S (по формулам1-5).

4.Рассчитываются значения эмпирических накопленных частот nxi и теоретических накопленных частот n'xi.

,                                                   (8)

где n - объем выборки, Ф0(u) - функция Лапласа, xi - срединные значения интервалов группировки.

5.Вычисляется значение критерия :

  ,                                                                                   (9)

где - максимальное значение модуля разности между эмпирическими и теоретическими накопленными частотами.

6.Определяется критическое значение - критерия Колмогорова-Смирнова при уровне значимости . Для стандартных уровней значимости критические значения равны:

   0.05=0.895,   0.01=1.035. Они соответствуют рассматриваемому варианту применения критерия Колмогорова-Смирнова, когда для вычисления теоретических накопленных частот используются выборочные характеристики и S В качестве параметров  и  нормального распределения.

7.Вывод: если  - Н0 отвергают, иначе нет оснований отвергнуть гипотезу Н0.

Оба рассмотренных критерия (Пирсона и Колмогорова-Смирнова) применимы в одних и тех же условиях (объем выборки более 40). Сравнение мощностей этих критериев для общего случая затруднительно, но из опыта известно, что критерий  чаще обнаруживает отклонения от нормального распределения при оценки параметров по выборке.

Критерий W Шапиро-Уилки.

(применим при объеме выборки n10)

Порядок применения:

1.Формулируем гипотезу Н0 о соответствии распределения генеральной совокупности, из которой получены данные, нормальному распределению. Назначается уровень значимости  (=0.05).

2.Получить выборку n10  независимых измерений.

3.Рассчитать значение выборочной дисперсии S2.

4.Ранжировать выборку, то есть расположить выборочные значения в возрастающем порядке.

5.Образовать разности k для чего из максимального значения xn вычесть наименьшее x1, затем из xn-1 вычитаем x2 и т.д. Если n четное, то число разностей k=n/2, если n нечетное, то , при этом центральная варианта выборки в образовании разностей не участвует.

6.По табл.2. находим значение коэффициентов ank критерия W Шапиро-Уилки, соответствующие объему выборки и номерам разностей.

7.Находим произведения ankk.

8.Вычисляем величину

                                                            (10)

9.Рассчитать значения критерия  W Шапиро-Уилки.

 

                                                             (11)

10.Из табл.3. находим критическое значение критерия Шапиро - Уилки для уровня значимости : (W0.05=0.842).

12.Если W>W можно говорить о соответствии эмпирических данных нормальному распределению.

В отличие от других критериев, Н0 принимается если W>W.


Контрольные вопросы

  1.  Как понимаете понятие «Ошибка первого рода»?
  2.  Как понимаете понятие «Ошибка второго рода»?
  3.  Назовите основные методы статистической обработки данных, используемых на производстве.
  4.  Для каких производственных параметров применима гистограмма?
  5.  Какой смысл вкладывается в закон шесть сигма?
  6.  Что характеризуют приемочные границы?
  7.  Назовите основные законы распределения случайных величин, встречающиеся на производстве.
  8.  Что характеризует среднее значение?
  9.  Что характеризует стандартное отклонение?
  10.  Что понимается под «Полем рассеяния»?


 

А также другие работы, которые могут Вас заинтересовать

34367. Взаимосвязь технологии с экономикой и другими науками 24.5 KB
  Все факторы влияющие на рост производительных сил человека: искусность и квалификация эффективность и оснащенность производства прогресс науки как производительной силы все это прямо или косвенно находит свое воплощение в технических средствах труда. По мере исторического развития процесса труда происходит обогащение производительных сил новыми моментами и новыми производительными силами носящими общественный характер. Технологические отношения охватывают отношения между человеком средствами труда и предметом труда в производственном...
34368. Производственные системы и производственные процессы 25 KB
  Производственные системы и производственные процессы. Так даже для получения сельскохозяйственных продуктов основа природные процессы произрастания необходимо создавать производственные системы. Производственные системы включают все необходимое для производства продукции: 1. Примером производственной системы в материальном производстве являются: завод фабрика организация колхоз и т.
34369. Критерии оценки экономической эффективности пр-ва 23.5 KB
  Показатель экономической эффективности технго процесса должен учитывать все виды затрат. Себестоимость это совокупность материальных и трудовых затрат предприятия на изготовление и реализацию продукции выраженных в денежной форе. Различают основные затраты непосредственно связанные с процессом прва расходы на основные материалы технологическое топливо энергию покупные полуфабрикаты зарплату основных рабочих и расходы связанные с обслуживанием процесса и управлением. В зависимости от доли отдельных элементов затрат в себестоимости...
34370. Оптимизация и экономическая оценка технологических процессов 23 KB
  Другими словами можно определить что расходные коэффициенты – это затраты на единицу продукции с учетом качества потребляемого сырья и стоимости. Эти затраты связаны с увеличением степени чистоты используемого сырья. характеризует сколько может получится целевого продукта с единицы сырья. К= m сырья m целевого продукта C1 C2 = Пц Пп В технологических процессах используется несколько видов сырья.
34371. Понятие технологического процесса, основные его параметры и характеристики 30 KB
  Производственный процесс это совокупность всех действий людей и орудий труда необходимых для изготовления или ремонта продукции. Технологический процесс это основная часть производственного процесса направленная на получения из сырья готовой продукции. Экономические: производительность выпускаемой продукции П = Q t кГ ч т ч; где Q количество произведенной продукции кГ т шт. 100 где Qф фактическое количество произведенной продукции кГ т шт.
34372. Динамика произв. затрат при развитии технол. процесса 55 KB
  Прошлого овеществленного труда Тп включающего в себя все затраты труда связанные с получением исходного для данной технологии продукта а также затраты на орудия труда используемые в анализируемом технологическом процессе; 2. Живого труда Тж включающего все затраты человеческого труда предусмотренные в анализируемом технологическом процессе на выпуск готовой продукции. Общие удельные затраты на единицу продукции представляющие собой сумму прошлого и живого труда Тс = Тп Тж min являются наиболее обобщенными технологическими...
34373. Структура технологического процесса 50 KB
  Структура технологического процесса. Любой технологический процесс можно рассматривать как систему более мелких технологических процессов или как часть более сложного техн. В структуре сложного техн. процесса можно выделить всегда элементарный техн.
34374. Основные варианты развития технологических процессов и их характеристика 23 KB
  элементов приводит к росту производительности живого труда за счет высвобождения человека и сокр. труда за счет увеличения доли прошлого труда что соотв. такое развитие процессов при котором увеличение производительности совокупного труда происходит при увеличении затрат прошлого труда за счет механизации и автоматизации вспом. за счет уменьшения как живого так и прошлого труда на единицу продукции.
34375. Закон рационалистического развития технологических процессов 24.5 KB
  развития технологического процесса происходит прямая замена живого труда прошлым. При этом каждое последующее увеличение производительности труда требует все больших затрат прошлого труда на единицу прироста производительности совокупного труда. Достигнутый уровень затрат прошлого труда это техн. Годовые затраты прошлого труда сумма годовых амортизационных отчислений от стоимости оборудования и всех остальных годовых затрат за исключением затрат на предмет труда обозначим через Фт руб год.