10982

Однофакторный анализ в системе statistica 6.0

Лекция

Математика и математический анализ

Однофакторный анализ в системе statistica 6.0 Рассмотрим типичную задачу однофакторного анализа реально возникшую на производстве. Пример.На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить как изменится дневная производительность при переходе на новые техн...

Русский

2013-04-03

168.06 KB

4 чел.

Однофакторный анализ в системе statistica 6.0

Рассмотрим типичную задачу однофакторного анализа, реально возникшую на производстве.

Пример. На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить, как изменится дневная производительность при переходе на новые технологии, завод в течение 10 дней работал по каждой, включая существующую Т0. Дневная производительность в условных единицах (отклики) и способ обработки (уровни фактора, соответствующие технологиям Т0, Т1, и Т2) приведены в табл. 1.

Таблица 1.

Number

Technology

Power

Number

Technology

Power

Number

Technology

Power

1

T0

46

11

T1

74

21

T2

52

2

T0

48

12

T1

82

22

T2

63

3

T0

73

13

T1

64

23

T2

72

4

T0

52

14

T1

72

24

T2

64

5

T0

72

15

T1

84

25

T2

48

6

T0

44

16

T1

68

26

T2

70

7

T0

66

17

T1

76

27

T2

78

8

T0

46

18

T1

88

28

T2

68

9

T0

60

19

T1

70

29

T2

70

10

T0

48

20

T1

60

30

T2

54

Выдвигаем нулевую гипотезу – отклики (производительность) принадлежат одному и тому же распределению. То есть, влияние фактора (технологии) не существенно.

Сначала воспользуемся более мощными, свободными от распределений ранговыми критериями. И только в том случае, если при проверке ранговых критериев нулевая гипотеза будет отвергнута в пользу альтернативной гипотезы влияние фактора существенное, воспользуемся методами дисперсионного анализа для количественной оценки влияния фактора.

Критерий Краскела – Уоллиса

Для проверки данного критерия последовательно выбираем программу (модуль):

StatisticsNonparametricsComparing Multiple Indep. Samples (Groups) рис.1.

Рис.1. Тест Краскела – Уоллиса

Для выбора переменных нажимаем клавишу Variables и выбираем Dependent variableотклики (Power) и Indep.(grouping) variableуровни фактора (Technology) рис.2.

Рис. 2. Окно выбора переменных

В закладке Для выбора группы факторов, в нашем примере переменная Technology разбита на группы Т0, Т1 и Т2, выбираем пункт меню Code (см.рис.1). Для выбора всех групп нажимаем кнопку All.

Рис. 3. Выбор групп факторов для анализа

Этот параметр необходим для корректной работы пакета Statistica, т.к. исходные данные в файле могут идти в случайном порядке, программа объединит их в соответствующие группы рис. 3.

По умолчанию при запуске теста факторы объединяются на максимально возможное количество групп. Выполнив все необходимые действия, нажимаем кнопку Summary, после чего получим результат тестирования. Полный результат теста Краскела - Уоллиса представлен на рис.4.

Рис. 4. Результаты теста Краскела - Уоллиса

В приведенных результатах приняты следующие обозначения:

Codes – уникальный код группы (число);

Valid N – число значений в группе;

Sum of Ranks – сумма рангов;

H – статистика Краскела - Уоллиса;

р – вероятность принятия гипотезы Н0.

Анализируя суммы рангов, представленные в результирующем отчете можно говорить о влиянии уровня фактора на производительность. Из результатов видно что лучшая производительность обеспечивается технологией Т1, а худшая – существующей технологией Т0.

Вспомним, что в статистике Краскела – Уоллиса вычисляется сумма квадратов разностей средних рангов в группе и среднего ранга по всей выборке. Тогда, если верна гипотеза  и влияние фактора незначимо, то значение статистики мало. В нашем примере  и нулевую гипотезу можно принять с вероятностью p = 0.0065. Поскольку заданный нами уровень значимости много больше α = 0.05, то нулевую гипотезу следует отвергнуть в пользу альтернативной гипотезы H1 – влияние фактора существенное.

Медианный тест (критерий)

Как и в критерии Краскела – Уоллиса заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Учтем, что медиана объединенной выборки равна , здесь объем объединенной выборки. Введем обозначение:

То есть это число наблюдений из j-й выборки (уровня фактора), больших, чем медиана объединенной выборки. Мы прибавляем ½ к этому числу в том и только том случае, если  нечетно и эта медиана принадлежит j-й выборке. Тогда можно ввести статистику медианного критерия

Показано, что статистика  при гипотезе  асимптотически подчиняется  распределению с  степенями свободы.

Результат медианного теста в системе Statistica представлен на рис. 5.

Рис. 5. Результаты медианного теста

В верхней части таблицы приведены количества рангов в группах, которые были меньше или равны медиане. В нижней части таблицы – аналогичные значения, превышающие значение медианы.

Проанализируем полученные результаты на качественном уровне. По значению разности предсказанных и полученных значений можно сделать следующие выводы:

  1.  верхняя половина таблицы – максимальное значение указывает на худшую технологию;
  2.  нижняя половина таблицы – максимальное значение указывает на лучшую технологию.

Количественная оценка статистики  свидетельствует о том, что нулевую гипотезу можно принять с вероятностью p = 0.0273, что меньше уровня значимости, следовательно, принимается гипотеза H1.

В системе Statistica при проведении рангового однофакторного анализа предлагаются дополнительные графические возможности. В исходном окне модуля (см. рис.1) выбор пункта Categorized Histogram позволяет посмотреть и оценить виды распределения выборок (групп). В данном случае нас интересует распределение исходных данных о производительности по группам (технологиям).

Выбираем переменную для гистограмм рис. 6, построенные гистограммы приведены на рис. 7.

Рис. 6. Выбор переменной для гистограммы

Рис. 7. Гистограммы распределения производительности

На построенных гистограммах сплошной линией проведены гауссовы распределения с соответствующими параметрами. Визуальный анализ подтверждает, что лучшая технология Т1, т.к. при этой технологии минимальная и максимальная производительности больше, чем при технологиях Т0 и Т2, Эта же технология обеспечивает 70 % значений производительности в интервале
[65, 85], что значительно лучше, чем в других группах.


 

А также другие работы, которые могут Вас заинтересовать

68319. Оптичні явища у фотонних кристалах та методи їх дослідження 174.5 KB
  Робота забезпечує вивчення існуючої теорії поширення електромагнітних хвиль у періодичних структурах. ЇЇ виконання дозволяє систематизувати, закріпити та розширити теоретичні і практичні знання з оптичної фізики. Це також забезпечує розвиток навичок самостійної роботи і опанування методикою дослідження й експериментування
68320. Обгрунтування економічної ефективності відкриття магазину подарунків «Радість» в місті Запоріжжі 606 KB
  Магазин подарунків «Радість» в місті Запоріжжя відкривається з метою задовольнити потреби людей в купівлі подарунків. Аби покупці з легкістю могли підібрати потрібний їм подарунок, сувенір для своїх рідних та близьких. Туристи зможуть тут знайти безліч сувенірів, які будуть нагадувати їм про подорож до міста
68321. Механизм функционирования финансового менеджмента и его место в системе управления организацией 160 KB
  Рассмотреть цели, задачи и принципы финансового менеджмента; определить базовые концепции и функции финансового менеджмента; установить сущность и структуру финансового менеджмента; выявить место финансового менеджмента в системе управления организацией и механизмы его функционирования.
68322. Функції мікрофлори ШКТ, можливі порушення, профілактика 128.5 KB
  Життєдіяльність людини не можлива без нормального функціонування єдиного екологічного комплексу макро- і мікроорганізму. За останні 20-30 років зросла кількість різних патологічних станів, в основі яких є порушення нормального мікробіоценозу організму людини – дисбактеріоз.
68324. Транспозон. Типи транспозонів та механізми їх пересування 36.5 KB
  Мобільні генетичні елементи за типом транспозиції можна поділити на два класи: ДНК-транспозони які застосовують метод вирізати й вставити та ретротранспозони пересування яких має в своєму алгоритмі синтез РНК з ДНК та подальшим зворотнім синтезом ДНК з молекули РНК тобто метод копіювати й вставити.
68325. УЧЕБНЫЙ ПЛАН 32 KB
  В ответ нам покажут один максимум три листика с аккуратным указанием количества часов по каждому предмету в каждом классе. То есть практически учебный план сетка часов. Учебный план должен состоять из двух частей: объяснительная записка и сетка часов.
68326. УЧЕБНАЯ ПРОГРАММА 74.5 KB
  Нормативный текст определяющий цели ценности образования учебный план учебные программы педагогические технологии и методики их практической реализации и определения результата. Организационно-управленческое знание позволяющее реализовать принцип личностной ориентации...
68327. Учебник. Учебный материал 66 KB
  Как известно содержание единицы учебника параграфы главы характеризуется следующими параметрами: структурная сложность число разнородных единиц элементов их иерархия связи и отношения; содержательная сложность категория цели; информативность степень изменения тезауруса учебника...