10982

Однофакторный анализ в системе statistica 6.0

Лекция

Математика и математический анализ

Однофакторный анализ в системе statistica 6.0 Рассмотрим типичную задачу однофакторного анализа реально возникшую на производстве. Пример.На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить как изменится дневная производительность при переходе на новые техн...

Русский

2013-04-03

168.06 KB

4 чел.

Однофакторный анализ в системе statistica 6.0

Рассмотрим типичную задачу однофакторного анализа, реально возникшую на производстве.

Пример. На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить, как изменится дневная производительность при переходе на новые технологии, завод в течение 10 дней работал по каждой, включая существующую Т0. Дневная производительность в условных единицах (отклики) и способ обработки (уровни фактора, соответствующие технологиям Т0, Т1, и Т2) приведены в табл. 1.

Таблица 1.

Number

Technology

Power

Number

Technology

Power

Number

Technology

Power

1

T0

46

11

T1

74

21

T2

52

2

T0

48

12

T1

82

22

T2

63

3

T0

73

13

T1

64

23

T2

72

4

T0

52

14

T1

72

24

T2

64

5

T0

72

15

T1

84

25

T2

48

6

T0

44

16

T1

68

26

T2

70

7

T0

66

17

T1

76

27

T2

78

8

T0

46

18

T1

88

28

T2

68

9

T0

60

19

T1

70

29

T2

70

10

T0

48

20

T1

60

30

T2

54

Выдвигаем нулевую гипотезу – отклики (производительность) принадлежат одному и тому же распределению. То есть, влияние фактора (технологии) не существенно.

Сначала воспользуемся более мощными, свободными от распределений ранговыми критериями. И только в том случае, если при проверке ранговых критериев нулевая гипотеза будет отвергнута в пользу альтернативной гипотезы влияние фактора существенное, воспользуемся методами дисперсионного анализа для количественной оценки влияния фактора.

Критерий Краскела – Уоллиса

Для проверки данного критерия последовательно выбираем программу (модуль):

StatisticsNonparametricsComparing Multiple Indep. Samples (Groups) рис.1.

Рис.1. Тест Краскела – Уоллиса

Для выбора переменных нажимаем клавишу Variables и выбираем Dependent variableотклики (Power) и Indep.(grouping) variableуровни фактора (Technology) рис.2.

Рис. 2. Окно выбора переменных

В закладке Для выбора группы факторов, в нашем примере переменная Technology разбита на группы Т0, Т1 и Т2, выбираем пункт меню Code (см.рис.1). Для выбора всех групп нажимаем кнопку All.

Рис. 3. Выбор групп факторов для анализа

Этот параметр необходим для корректной работы пакета Statistica, т.к. исходные данные в файле могут идти в случайном порядке, программа объединит их в соответствующие группы рис. 3.

По умолчанию при запуске теста факторы объединяются на максимально возможное количество групп. Выполнив все необходимые действия, нажимаем кнопку Summary, после чего получим результат тестирования. Полный результат теста Краскела - Уоллиса представлен на рис.4.

Рис. 4. Результаты теста Краскела - Уоллиса

В приведенных результатах приняты следующие обозначения:

Codes – уникальный код группы (число);

Valid N – число значений в группе;

Sum of Ranks – сумма рангов;

H – статистика Краскела - Уоллиса;

р – вероятность принятия гипотезы Н0.

Анализируя суммы рангов, представленные в результирующем отчете можно говорить о влиянии уровня фактора на производительность. Из результатов видно что лучшая производительность обеспечивается технологией Т1, а худшая – существующей технологией Т0.

Вспомним, что в статистике Краскела – Уоллиса вычисляется сумма квадратов разностей средних рангов в группе и среднего ранга по всей выборке. Тогда, если верна гипотеза  и влияние фактора незначимо, то значение статистики мало. В нашем примере  и нулевую гипотезу можно принять с вероятностью p = 0.0065. Поскольку заданный нами уровень значимости много больше α = 0.05, то нулевую гипотезу следует отвергнуть в пользу альтернативной гипотезы H1 – влияние фактора существенное.

Медианный тест (критерий)

Как и в критерии Краскела – Уоллиса заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Учтем, что медиана объединенной выборки равна , здесь объем объединенной выборки. Введем обозначение:

То есть это число наблюдений из j-й выборки (уровня фактора), больших, чем медиана объединенной выборки. Мы прибавляем ½ к этому числу в том и только том случае, если  нечетно и эта медиана принадлежит j-й выборке. Тогда можно ввести статистику медианного критерия

Показано, что статистика  при гипотезе  асимптотически подчиняется  распределению с  степенями свободы.

Результат медианного теста в системе Statistica представлен на рис. 5.

Рис. 5. Результаты медианного теста

В верхней части таблицы приведены количества рангов в группах, которые были меньше или равны медиане. В нижней части таблицы – аналогичные значения, превышающие значение медианы.

Проанализируем полученные результаты на качественном уровне. По значению разности предсказанных и полученных значений можно сделать следующие выводы:

  1.  верхняя половина таблицы – максимальное значение указывает на худшую технологию;
  2.  нижняя половина таблицы – максимальное значение указывает на лучшую технологию.

Количественная оценка статистики  свидетельствует о том, что нулевую гипотезу можно принять с вероятностью p = 0.0273, что меньше уровня значимости, следовательно, принимается гипотеза H1.

В системе Statistica при проведении рангового однофакторного анализа предлагаются дополнительные графические возможности. В исходном окне модуля (см. рис.1) выбор пункта Categorized Histogram позволяет посмотреть и оценить виды распределения выборок (групп). В данном случае нас интересует распределение исходных данных о производительности по группам (технологиям).

Выбираем переменную для гистограмм рис. 6, построенные гистограммы приведены на рис. 7.

Рис. 6. Выбор переменной для гистограммы

Рис. 7. Гистограммы распределения производительности

На построенных гистограммах сплошной линией проведены гауссовы распределения с соответствующими параметрами. Визуальный анализ подтверждает, что лучшая технология Т1, т.к. при этой технологии минимальная и максимальная производительности больше, чем при технологиях Т0 и Т2, Эта же технология обеспечивает 70 % значений производительности в интервале
[65, 85], что значительно лучше, чем в других группах.


 

А также другие работы, которые могут Вас заинтересовать

67291. КУЛЬТУРА 19 ВЕКА: ПОЗИТИВИЗМ 70 KB
  Вместе с изменением представлений о строении материи пространстве времени движении путях развития флоры и фауны месте человека в природе о происхождении жизни на Земле изменяется и отношение человека к природе и обществу. В отличие от героя-романтика герой-реалист активно участвует в жизни пытаясь изменить её в лучшую сторону.
67292. Выбор характеристик качества в проектах программных средств 93 KB
  Описание в стандарте ISO 9126:14 характеристик качества программных средств не содержит рекомендаций и методик выбора их значений в требованиях к конкретным проектам. Далее должны быть разработаны процессы выбора установления...
67293. РАНЫ 123.5 KB
  Раной называется любое механическое повреждение при котором нарушается целостность покровов тела кожи или слизистых с возможным нарушением глубжележащих тканей и органов. Классификация ран По механизму повреждения...
67294. Международное сотрудничество области безопасности жизнедеятельности 19.49 KB
  Международное сотрудничество по охране труда осуществляется в рамках Международной организации труда МОТ Всемирной организации здравоохранения ВОЗ Федерации специалистов по охране труда и промышленной гигиене ИФАС а также международной организации по безопасности и охране труда...
67295. Монотеистические религии 34.5 KB
  Согласно Библейским преданиям основы религиозного и нравственного учения Христа наиболее полно изложены в Нагорной проповеди которая начинается девятью Заповедями Блаженства. Блаженны нищие духом ибо их есть царство небесное. Блаженны плачущие ибо они утешатся. Блаженны кроткие ибо они наследуют землю.
67296. НОРМЫ ПРАВА 132 KB
  Право состоит из действующих в данном обществе юридических или правовых норм. Однако из этого положения не следует что понятия права и нормы права совпадают. Поскольку нормы права одна из разновидностей социальных норм на них распространяются общие черты присущие этим нормам.
67298. ИНТЕГРАТИВНЫЕ МЕХАНИЗМЫ РЕГУЛЯЦИИ ПОВЕДЕНИЯ, ОСНОВАННОГО НА БИОЛОГИЧЕСКИХ МОТИВАЦИЯХ 202 KB
  Гипоталамус важнейшая мотивационная структура мозга В кибернетическом понимании гипоталамус является управляющим устройством к которому поступает вся необходимая информация о сохранении гомеостатических параметров или их отклонении от заданного значения.
67299. Ідеологія та політика 124 KB
  Політична ідеологія виникає із суспільної потреби в узгодженні істотних інтересів кожного класу і соціальної групи з інтересами інших класів і соціальних груп з точки зору їх боротьби за державну владу або інших форм участі у справах держави. Ліберали виступають за ринкове...