10982

Однофакторный анализ в системе statistica 6.0

Лекция

Математика и математический анализ

Однофакторный анализ в системе statistica 6.0 Рассмотрим типичную задачу однофакторного анализа реально возникшую на производстве. Пример.На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить как изменится дневная производительность при переходе на новые техн...

Русский

2013-04-03

168.06 KB

5 чел.

Однофакторный анализ в системе statistica 6.0

Рассмотрим типичную задачу однофакторного анализа, реально возникшую на производстве.

Пример. На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить, как изменится дневная производительность при переходе на новые технологии, завод в течение 10 дней работал по каждой, включая существующую Т0. Дневная производительность в условных единицах (отклики) и способ обработки (уровни фактора, соответствующие технологиям Т0, Т1, и Т2) приведены в табл. 1.

Таблица 1.

Number

Technology

Power

Number

Technology

Power

Number

Technology

Power

1

T0

46

11

T1

74

21

T2

52

2

T0

48

12

T1

82

22

T2

63

3

T0

73

13

T1

64

23

T2

72

4

T0

52

14

T1

72

24

T2

64

5

T0

72

15

T1

84

25

T2

48

6

T0

44

16

T1

68

26

T2

70

7

T0

66

17

T1

76

27

T2

78

8

T0

46

18

T1

88

28

T2

68

9

T0

60

19

T1

70

29

T2

70

10

T0

48

20

T1

60

30

T2

54

Выдвигаем нулевую гипотезу – отклики (производительность) принадлежат одному и тому же распределению. То есть, влияние фактора (технологии) не существенно.

Сначала воспользуемся более мощными, свободными от распределений ранговыми критериями. И только в том случае, если при проверке ранговых критериев нулевая гипотеза будет отвергнута в пользу альтернативной гипотезы влияние фактора существенное, воспользуемся методами дисперсионного анализа для количественной оценки влияния фактора.

Критерий Краскела – Уоллиса

Для проверки данного критерия последовательно выбираем программу (модуль):

StatisticsNonparametricsComparing Multiple Indep. Samples (Groups) рис.1.

Рис.1. Тест Краскела – Уоллиса

Для выбора переменных нажимаем клавишу Variables и выбираем Dependent variableотклики (Power) и Indep.(grouping) variableуровни фактора (Technology) рис.2.

Рис. 2. Окно выбора переменных

В закладке Для выбора группы факторов, в нашем примере переменная Technology разбита на группы Т0, Т1 и Т2, выбираем пункт меню Code (см.рис.1). Для выбора всех групп нажимаем кнопку All.

Рис. 3. Выбор групп факторов для анализа

Этот параметр необходим для корректной работы пакета Statistica, т.к. исходные данные в файле могут идти в случайном порядке, программа объединит их в соответствующие группы рис. 3.

По умолчанию при запуске теста факторы объединяются на максимально возможное количество групп. Выполнив все необходимые действия, нажимаем кнопку Summary, после чего получим результат тестирования. Полный результат теста Краскела - Уоллиса представлен на рис.4.

Рис. 4. Результаты теста Краскела - Уоллиса

В приведенных результатах приняты следующие обозначения:

Codes – уникальный код группы (число);

Valid N – число значений в группе;

Sum of Ranks – сумма рангов;

H – статистика Краскела - Уоллиса;

р – вероятность принятия гипотезы Н0.

Анализируя суммы рангов, представленные в результирующем отчете можно говорить о влиянии уровня фактора на производительность. Из результатов видно что лучшая производительность обеспечивается технологией Т1, а худшая – существующей технологией Т0.

Вспомним, что в статистике Краскела – Уоллиса вычисляется сумма квадратов разностей средних рангов в группе и среднего ранга по всей выборке. Тогда, если верна гипотеза  и влияние фактора незначимо, то значение статистики мало. В нашем примере  и нулевую гипотезу можно принять с вероятностью p = 0.0065. Поскольку заданный нами уровень значимости много больше α = 0.05, то нулевую гипотезу следует отвергнуть в пользу альтернативной гипотезы H1 – влияние фактора существенное.

Медианный тест (критерий)

Как и в критерии Краскела – Уоллиса заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Учтем, что медиана объединенной выборки равна , здесь объем объединенной выборки. Введем обозначение:

То есть это число наблюдений из j-й выборки (уровня фактора), больших, чем медиана объединенной выборки. Мы прибавляем ½ к этому числу в том и только том случае, если  нечетно и эта медиана принадлежит j-й выборке. Тогда можно ввести статистику медианного критерия

Показано, что статистика  при гипотезе  асимптотически подчиняется  распределению с  степенями свободы.

Результат медианного теста в системе Statistica представлен на рис. 5.

Рис. 5. Результаты медианного теста

В верхней части таблицы приведены количества рангов в группах, которые были меньше или равны медиане. В нижней части таблицы – аналогичные значения, превышающие значение медианы.

Проанализируем полученные результаты на качественном уровне. По значению разности предсказанных и полученных значений можно сделать следующие выводы:

  1.  верхняя половина таблицы – максимальное значение указывает на худшую технологию;
  2.  нижняя половина таблицы – максимальное значение указывает на лучшую технологию.

Количественная оценка статистики  свидетельствует о том, что нулевую гипотезу можно принять с вероятностью p = 0.0273, что меньше уровня значимости, следовательно, принимается гипотеза H1.

В системе Statistica при проведении рангового однофакторного анализа предлагаются дополнительные графические возможности. В исходном окне модуля (см. рис.1) выбор пункта Categorized Histogram позволяет посмотреть и оценить виды распределения выборок (групп). В данном случае нас интересует распределение исходных данных о производительности по группам (технологиям).

Выбираем переменную для гистограмм рис. 6, построенные гистограммы приведены на рис. 7.

Рис. 6. Выбор переменной для гистограммы

Рис. 7. Гистограммы распределения производительности

На построенных гистограммах сплошной линией проведены гауссовы распределения с соответствующими параметрами. Визуальный анализ подтверждает, что лучшая технология Т1, т.к. при этой технологии минимальная и максимальная производительности больше, чем при технологиях Т0 и Т2, Эта же технология обеспечивает 70 % значений производительности в интервале
[65, 85], что значительно лучше, чем в других группах.


 

А также другие работы, которые могут Вас заинтересовать

9006. Философия Платона. Теория идей, познание, человек и государство у Платона 42.5 KB
  Философия Платона. Теория идей, познание, человек и государство у Платона После казни Сократа один из его лучших учеников Аристокл, получивший за свои широкие плечи прозвище Платон («широкоплечий»), надолго покинул Афины. Тяжело переживая смерть учи...
9007. Философия Аристотеля. Бытие, сущность, причинность, душа, материя и форма 44 KB
  Философия Аристотеля. Бытие, сущность, причинность, душа, материя и форма Аристотель (384 – 322 гг. до н. э.) - древнегреческий философ, энциклопедист, основоположник науки логики и ряда отраслей специального знания. Образование Аристотель...
9008. Античные школы стоиков, скептиков и эпикурейцев 28.5 KB
  Античные школы стоиков, скептиков и эпикурейцев Философия в период эллинизма частично изменила содержание и свои основные цели. Эти изменения были обусловлены социально-экономическими и политическими процессами в развивавшемся эллинистическом общест...
9009. Идеи рационализма в учениях Р. Декарта, Б. Спинозы и Г. В. Лейбница 50 KB
  Идеи рационализма в учениях Р. Декарта, Б. Спинозы и Г. В. Лейбница Идеи мыслителей эпохи Возрождения были развиты философией Нового времени. Прогресс опытного знания, науки требовал замены схоластического метода мышления новым методом познания, обр...
9010. Периоды, представители и проблемы философии Средневековья и Возрождения 44 KB
  Периоды, представители и проблемы философии Средневековья и Возрождения Средневековая европейская философия - важный этап в истории философии, связанный прежде всего с христианством. Хронологически этот период охватывает V –XV вв. Специфик...
9011. Британская философия XVII – XVIII вв. (Ф. Бэкон, Т. Гоббс, Дж. Локк, Дж. Беркли, Д. Юм) 53 KB
  Британская философия XVII – XVIII вв. (Ф. Бэкон, Т. Гоббс, Дж. Локк, Дж. Беркли, Д. Юм) Эмпиризм - учение в теории познания, считающее чувственный опыт единственным источником знаний, утверждающее, будто все знание обосновывается в опыте и...
9012. Французский материализм XVIII в 42.5 KB
  Французский материализм XVIII в. Вторая половина XVIII в. явилась эпохой резкого обострения кризиса феодализма во Франции, вылившегося в буржуазную революцию важнейшую роль в ее идеологической подготовке сыграли философы-материалисты Ламетри, Гольб...
9013. Основные идеи философии И. Канта 42 KB
  Основные идеи философии И. Канта Иммануил Кант (1724 - 1804 гг.) - немецкий философ и ученый, родоначальник немецкой классической философии. Прожил всю жизнь в Кёнигсберге, где окончил университет и был в 1755 - 1770 гг. доцентом, а в...
9014. Система и метод философии Гегеля 47 KB
  Система и метод философии Гегеля Георг Фридрих Гегель (1770 - 1831 гг.) - создатель грандиозной системы Абсолютного идеализма. Все действительное, по Гегелю, разумно, постижимо средствами логики, т. е. постижимо в понятиях (такая концепция...