10982

Однофакторный анализ в системе statistica 6.0

Лекция

Математика и математический анализ

Однофакторный анализ в системе statistica 6.0 Рассмотрим типичную задачу однофакторного анализа реально возникшую на производстве. Пример.На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить как изменится дневная производительность при переходе на новые техн...

Русский

2013-04-03

168.06 KB

5 чел.

Однофакторный анализ в системе statistica 6.0

Рассмотрим типичную задачу однофакторного анализа, реально возникшую на производстве.

Пример. На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить, как изменится дневная производительность при переходе на новые технологии, завод в течение 10 дней работал по каждой, включая существующую Т0. Дневная производительность в условных единицах (отклики) и способ обработки (уровни фактора, соответствующие технологиям Т0, Т1, и Т2) приведены в табл. 1.

Таблица 1.

Number

Technology

Power

Number

Technology

Power

Number

Technology

Power

1

T0

46

11

T1

74

21

T2

52

2

T0

48

12

T1

82

22

T2

63

3

T0

73

13

T1

64

23

T2

72

4

T0

52

14

T1

72

24

T2

64

5

T0

72

15

T1

84

25

T2

48

6

T0

44

16

T1

68

26

T2

70

7

T0

66

17

T1

76

27

T2

78

8

T0

46

18

T1

88

28

T2

68

9

T0

60

19

T1

70

29

T2

70

10

T0

48

20

T1

60

30

T2

54

Выдвигаем нулевую гипотезу – отклики (производительность) принадлежат одному и тому же распределению. То есть, влияние фактора (технологии) не существенно.

Сначала воспользуемся более мощными, свободными от распределений ранговыми критериями. И только в том случае, если при проверке ранговых критериев нулевая гипотеза будет отвергнута в пользу альтернативной гипотезы влияние фактора существенное, воспользуемся методами дисперсионного анализа для количественной оценки влияния фактора.

Критерий Краскела – Уоллиса

Для проверки данного критерия последовательно выбираем программу (модуль):

StatisticsNonparametricsComparing Multiple Indep. Samples (Groups) рис.1.

Рис.1. Тест Краскела – Уоллиса

Для выбора переменных нажимаем клавишу Variables и выбираем Dependent variableотклики (Power) и Indep.(grouping) variableуровни фактора (Technology) рис.2.

Рис. 2. Окно выбора переменных

В закладке Для выбора группы факторов, в нашем примере переменная Technology разбита на группы Т0, Т1 и Т2, выбираем пункт меню Code (см.рис.1). Для выбора всех групп нажимаем кнопку All.

Рис. 3. Выбор групп факторов для анализа

Этот параметр необходим для корректной работы пакета Statistica, т.к. исходные данные в файле могут идти в случайном порядке, программа объединит их в соответствующие группы рис. 3.

По умолчанию при запуске теста факторы объединяются на максимально возможное количество групп. Выполнив все необходимые действия, нажимаем кнопку Summary, после чего получим результат тестирования. Полный результат теста Краскела - Уоллиса представлен на рис.4.

Рис. 4. Результаты теста Краскела - Уоллиса

В приведенных результатах приняты следующие обозначения:

Codes – уникальный код группы (число);

Valid N – число значений в группе;

Sum of Ranks – сумма рангов;

H – статистика Краскела - Уоллиса;

р – вероятность принятия гипотезы Н0.

Анализируя суммы рангов, представленные в результирующем отчете можно говорить о влиянии уровня фактора на производительность. Из результатов видно что лучшая производительность обеспечивается технологией Т1, а худшая – существующей технологией Т0.

Вспомним, что в статистике Краскела – Уоллиса вычисляется сумма квадратов разностей средних рангов в группе и среднего ранга по всей выборке. Тогда, если верна гипотеза  и влияние фактора незначимо, то значение статистики мало. В нашем примере  и нулевую гипотезу можно принять с вероятностью p = 0.0065. Поскольку заданный нами уровень значимости много больше α = 0.05, то нулевую гипотезу следует отвергнуть в пользу альтернативной гипотезы H1 – влияние фактора существенное.

Медианный тест (критерий)

Как и в критерии Краскела – Уоллиса заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Учтем, что медиана объединенной выборки равна , здесь объем объединенной выборки. Введем обозначение:

То есть это число наблюдений из j-й выборки (уровня фактора), больших, чем медиана объединенной выборки. Мы прибавляем ½ к этому числу в том и только том случае, если  нечетно и эта медиана принадлежит j-й выборке. Тогда можно ввести статистику медианного критерия

Показано, что статистика  при гипотезе  асимптотически подчиняется  распределению с  степенями свободы.

Результат медианного теста в системе Statistica представлен на рис. 5.

Рис. 5. Результаты медианного теста

В верхней части таблицы приведены количества рангов в группах, которые были меньше или равны медиане. В нижней части таблицы – аналогичные значения, превышающие значение медианы.

Проанализируем полученные результаты на качественном уровне. По значению разности предсказанных и полученных значений можно сделать следующие выводы:

  1.  верхняя половина таблицы – максимальное значение указывает на худшую технологию;
  2.  нижняя половина таблицы – максимальное значение указывает на лучшую технологию.

Количественная оценка статистики  свидетельствует о том, что нулевую гипотезу можно принять с вероятностью p = 0.0273, что меньше уровня значимости, следовательно, принимается гипотеза H1.

В системе Statistica при проведении рангового однофакторного анализа предлагаются дополнительные графические возможности. В исходном окне модуля (см. рис.1) выбор пункта Categorized Histogram позволяет посмотреть и оценить виды распределения выборок (групп). В данном случае нас интересует распределение исходных данных о производительности по группам (технологиям).

Выбираем переменную для гистограмм рис. 6, построенные гистограммы приведены на рис. 7.

Рис. 6. Выбор переменной для гистограммы

Рис. 7. Гистограммы распределения производительности

На построенных гистограммах сплошной линией проведены гауссовы распределения с соответствующими параметрами. Визуальный анализ подтверждает, что лучшая технология Т1, т.к. при этой технологии минимальная и максимальная производительности больше, чем при технологиях Т0 и Т2, Эта же технология обеспечивает 70 % значений производительности в интервале
[65, 85], что значительно лучше, чем в других группах.


 

А также другие работы, которые могут Вас заинтересовать

45754. Критика способности суждения 24.5 KB
  Критика способности суждения нем. Кант также замечает что эстетическое не исчерпывается прекрасным нем. Помимо него существует возвышенное нем.
45755. Критика чистого разума 32.5 KB
  Кант начинает свои рассуждения со специфической классификации суждений. Он выделяет суждения синтетическиеаналитические и априорныеапостериорные.Синтетическими называются суждения несущие новое знание не содержащееся в понятии которое является их субъектом.Аналитическими называются суждения которые всего лишь раскрывают свойства присущие понятию субъекта содержащиеся в нём самом и не несут нового знания.
45756. Кун. Структуры научных революций 28.5 KB
  сформулировал новую концепцию развития науки и научного знания которая произвела настоящий переворот во всей философии науки. Внутри парадигмы существование науки определяется Куном как нормальная наука; ученые еще не подвергают сомнению свою научную деятельность которая состоит в вписывании фактов в уже существующую теорию. Прогресс имеет место только внутри нормальной науки.Периоду нормальной науки Кун противопоставляет деятельность ученых в рамках кризиса то есть период экстраординарной науки причем если целью нормальной науки...
45757. Лейбниц. Об основных аксиомах познания 31 KB
  Если чтото отрицается как истинное то очевидно оно является ложным; а если чтото отрицается как ложное то оно является истинным. Подобным же образом если истинно то что нечто ложно или ложно то что нечто истинно то утверждение является ложным; а если истинно то что нечто истинно и лоншо то что нечто ложпо то оно является истинным. С другой стороны среди истинных предложений первыми являются те которые обычно называют тождественными как А есть Л Не А есть не А Если истинно предложение L то следовательно истинно...
45758. Лейбниц. Монадология 53.5 KB
  Согласно Лейбницу основаниями существующих явлений или феноменов служат простые субстанции или монады. Все монады просты и не содержат частей. Монады не могут претерпеть изменения в своём внутреннем состоянии от действия какихлибо внешних причин кроме Бога. Монада способна к изменению своего состояния и все естественные изменения монады исходят из её внутреннего принципа.
45759. Джон Локк. Опыты о человеческом разумении 28 KB
  Опыты о человеческом разумении 4 книги Локк впервые дал систематическую теорию эмпиризма. Средоточие философии Локка его теория познания изложенная в Опыте о человеческом разумении Ее задача объяснить происхождение и основы человеческого познания и найти границы познавательной способности рассудка. Задачи философии Предмет философии по Локку исследование происхождения знания.
45760. Маклюэн. Понимание медиа 37.5 KB
  Понимание медиа. посвящённа осмыслению средств массовой коммуникации медиа. Средства массовой коммуникации медиа Маклюэн понимает чрезвычайно широко как расширение человека. По мнению Маклюэна глубочайшим заблуждением является убеждение в нейтральности медиа.
45761. Маркс К. К критике политической экономии 30.5 KB
  Маркс считает что анатомию гражданского общества следует искать в политической экономии. Совокупность этих производственных отношений составляет экономическую структуру общества реальный базис на котором возвышается юридическая и политическая надстройка и которому соответствуют опре формы общго сознания. На известной ступени своего развития материальные производительные силы общества приходят в противоречие с существующими производственными отношениями внутри которых они до сих пор развивались. Ни одна общая формация не погибает раньше...