10982

Однофакторный анализ в системе statistica 6.0

Лекция

Математика и математический анализ

Однофакторный анализ в системе statistica 6.0 Рассмотрим типичную задачу однофакторного анализа реально возникшую на производстве. Пример.На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить как изменится дневная производительность при переходе на новые техн...

Русский

2013-04-03

168.06 KB

5 чел.

Однофакторный анализ в системе statistica 6.0

Рассмотрим типичную задачу однофакторного анализа, реально возникшую на производстве.

Пример. На заводе разработаны две новые технологии Т1 и Т2. Чтобы оценить, как изменится дневная производительность при переходе на новые технологии, завод в течение 10 дней работал по каждой, включая существующую Т0. Дневная производительность в условных единицах (отклики) и способ обработки (уровни фактора, соответствующие технологиям Т0, Т1, и Т2) приведены в табл. 1.

Таблица 1.

Number

Technology

Power

Number

Technology

Power

Number

Technology

Power

1

T0

46

11

T1

74

21

T2

52

2

T0

48

12

T1

82

22

T2

63

3

T0

73

13

T1

64

23

T2

72

4

T0

52

14

T1

72

24

T2

64

5

T0

72

15

T1

84

25

T2

48

6

T0

44

16

T1

68

26

T2

70

7

T0

66

17

T1

76

27

T2

78

8

T0

46

18

T1

88

28

T2

68

9

T0

60

19

T1

70

29

T2

70

10

T0

48

20

T1

60

30

T2

54

Выдвигаем нулевую гипотезу – отклики (производительность) принадлежат одному и тому же распределению. То есть, влияние фактора (технологии) не существенно.

Сначала воспользуемся более мощными, свободными от распределений ранговыми критериями. И только в том случае, если при проверке ранговых критериев нулевая гипотеза будет отвергнута в пользу альтернативной гипотезы влияние фактора существенное, воспользуемся методами дисперсионного анализа для количественной оценки влияния фактора.

Критерий Краскела – Уоллиса

Для проверки данного критерия последовательно выбираем программу (модуль):

StatisticsNonparametricsComparing Multiple Indep. Samples (Groups) рис.1.

Рис.1. Тест Краскела – Уоллиса

Для выбора переменных нажимаем клавишу Variables и выбираем Dependent variableотклики (Power) и Indep.(grouping) variableуровни фактора (Technology) рис.2.

Рис. 2. Окно выбора переменных

В закладке Для выбора группы факторов, в нашем примере переменная Technology разбита на группы Т0, Т1 и Т2, выбираем пункт меню Code (см.рис.1). Для выбора всех групп нажимаем кнопку All.

Рис. 3. Выбор групп факторов для анализа

Этот параметр необходим для корректной работы пакета Statistica, т.к. исходные данные в файле могут идти в случайном порядке, программа объединит их в соответствующие группы рис. 3.

По умолчанию при запуске теста факторы объединяются на максимально возможное количество групп. Выполнив все необходимые действия, нажимаем кнопку Summary, после чего получим результат тестирования. Полный результат теста Краскела - Уоллиса представлен на рис.4.

Рис. 4. Результаты теста Краскела - Уоллиса

В приведенных результатах приняты следующие обозначения:

Codes – уникальный код группы (число);

Valid N – число значений в группе;

Sum of Ranks – сумма рангов;

H – статистика Краскела - Уоллиса;

р – вероятность принятия гипотезы Н0.

Анализируя суммы рангов, представленные в результирующем отчете можно говорить о влиянии уровня фактора на производительность. Из результатов видно что лучшая производительность обеспечивается технологией Т1, а худшая – существующей технологией Т0.

Вспомним, что в статистике Краскела – Уоллиса вычисляется сумма квадратов разностей средних рангов в группе и среднего ранга по всей выборке. Тогда, если верна гипотеза  и влияние фактора незначимо, то значение статистики мало. В нашем примере  и нулевую гипотезу можно принять с вероятностью p = 0.0065. Поскольку заданный нами уровень значимости много больше α = 0.05, то нулевую гипотезу следует отвергнуть в пользу альтернативной гипотезы H1 – влияние фактора существенное.

Медианный тест (критерий)

Как и в критерии Краскела – Уоллиса заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Учтем, что медиана объединенной выборки равна , здесь объем объединенной выборки. Введем обозначение:

То есть это число наблюдений из j-й выборки (уровня фактора), больших, чем медиана объединенной выборки. Мы прибавляем ½ к этому числу в том и только том случае, если  нечетно и эта медиана принадлежит j-й выборке. Тогда можно ввести статистику медианного критерия

Показано, что статистика  при гипотезе  асимптотически подчиняется  распределению с  степенями свободы.

Результат медианного теста в системе Statistica представлен на рис. 5.

Рис. 5. Результаты медианного теста

В верхней части таблицы приведены количества рангов в группах, которые были меньше или равны медиане. В нижней части таблицы – аналогичные значения, превышающие значение медианы.

Проанализируем полученные результаты на качественном уровне. По значению разности предсказанных и полученных значений можно сделать следующие выводы:

  1.  верхняя половина таблицы – максимальное значение указывает на худшую технологию;
  2.  нижняя половина таблицы – максимальное значение указывает на лучшую технологию.

Количественная оценка статистики  свидетельствует о том, что нулевую гипотезу можно принять с вероятностью p = 0.0273, что меньше уровня значимости, следовательно, принимается гипотеза H1.

В системе Statistica при проведении рангового однофакторного анализа предлагаются дополнительные графические возможности. В исходном окне модуля (см. рис.1) выбор пункта Categorized Histogram позволяет посмотреть и оценить виды распределения выборок (групп). В данном случае нас интересует распределение исходных данных о производительности по группам (технологиям).

Выбираем переменную для гистограмм рис. 6, построенные гистограммы приведены на рис. 7.

Рис. 6. Выбор переменной для гистограммы

Рис. 7. Гистограммы распределения производительности

На построенных гистограммах сплошной линией проведены гауссовы распределения с соответствующими параметрами. Визуальный анализ подтверждает, что лучшая технология Т1, т.к. при этой технологии минимальная и максимальная производительности больше, чем при технологиях Т0 и Т2, Эта же технология обеспечивает 70 % значений производительности в интервале
[65, 85], что значительно лучше, чем в других группах.


 

А также другие работы, которые могут Вас заинтересовать

16414. Планирование, как функция управления 113.5 KB
  Планирование как функция управления Понятие функции управления. Функция планирование. Процесс стратегического планирования. I. Суть любого управления это достижение организацией целей при наиболее оптимальном использовании ресурсов. ...
16415. Функция организация 166 KB
  Функция организация Сущность функции организация Построение организации Делегирование полномочий I. Организация как функция управления нацелена на то чтобы претворить намеченные планы и решения в жизнь. Ранее мы рассматривал...
16416. Функция мотивация 108 KB
  Функция мотивация Сущность функции мотивации Теории мотивации I. Руководителю чтобы эффективно двигаться к намеченной цели необходимо координировать работу и заставить персонал выполнять ее. Функция мотивации состоит в побуждении перс
16417. Функция контроль 107.5 KB
  Функция контроль Цели задачи и содержание функции контроль Процесс контроля I. Контроль процесс обеспечения достижения организацией своих целей постоянное сравнение того что есть с тем что должно быть. Функция контроль состоит в наблю...
16418. Антропоцентрический подход в исследовании текстов (на основе документов официально-делового стиля) 201 KB
  В данной работе рассматривается жанровая организация официально-делового дискурса на примере объяснительных записок с целью многоаспектного исследования их коммуникативно-прагматических характеристик. В работе преобладает антропоцентрический подход, что находится в русле современных лингвистических исследований.
16419. Функции Excel для расчета амортизации АМР, АМГД, ДОБ и ДДОБ 43 KB
  Функции Excel для расчета амортизации АМР АМГД ДОБ и ДДОБ. Под амортизацией подразумевается уменьшение обычно на единицу времени стоимости имущества в процессе эксплуатации. Функция АМР SLN возвращает величину амортизации имущества за один период времени используя ...
16420. Функции Excel для расчета амортизации АПЛ, АСЧ, ФУО и ДДОБ 44 KB
  Функции Excel для расчета амортизации АПЛ АСЧ ФУО и ДДОБ. Под амортизацией подразумевается уменьшение обычно на единицу времени стоимости имущества в процессе эксплуатации. Функция АПЛ SLN возвращает величину амортизации имущества за один период времени используя м...
16421. Функции в Excel 23.88 KB
  Функции в Excel Использование стандартных функций значительно облегчает проведение вычислений в ЭТ После этого урока вы сможете использовать стандартные функции для проведения более сложных вычислений в ЭТ. В поставку EXCEL 2007 входит более 400 функций. Используя VBA м
16422. Правовое регулирование порядка обеспечения коммерческой тайны при заключении хозяйственных договоров 49.35 KB
  В условиях рынка является не только оправданной, но и актуальной ориентация юридических и физических лиц на их особую ответственность за передачу деловым партнерам или их представителям экономических, научно-технических и других сведений, составляющих коммерческую тайну