10983

Однофакторный анализ в системе statistica 6.0. Критерий Кронкхиера

Лекция

Математика и математический анализ

ОДНОФАКТОРНЫЙ АНАЛИЗ В СИСТЕМЕ Statistica 6.0 Критерий Кронкхиера Если известно что имеющиеся группы результатов упорядочены по возрастанию убыванию влияния фактора то в таких случаях можно использовать статистику Джонкхиера более чувствительную более мощную против...

Русский

2013-04-03

257.69 KB

13 чел.

ОДНОФАКТОРНЫЙ АНАЛИЗ В СИСТЕМЕ Statistica 6.0

Критерий Кронкхиера

Если известно, что имеющиеся группы результатов упорядочены по возрастанию (убыванию) влияния фактора, то в таких случаях можно использовать статистику Джонкхиера, более чувствительную (более мощную) против альтернатив об упорядоченном влиянии фактора.

Так как в системе Statistica статистика Джонкхиера не реализована, воспользуемся критерием проверки двух выборок, в нашей задаче (с тремя уровнями фактора) можно выделить три пары выборок. Для сравнения двух способов обработки (два уровня фактора) воспользуемся статистикой Манна – Уитни, реализованной в данной системе.

В критерии Манна – Уитни сформулируем нулевую гипотезу  исходные две выборки – однородны, соответственно гипотеза  утверждает, что выборки не однородны, т. е. влияние фактора значимо.

Данный критерий проверяется в модуле:

StatisticsNonparametricsComparing Two Independent Samples (Groups)
(рис. 1).

Рис. 1. Тест Манна-Уитни

С помощью клавиши Variables выбираем Dependent variableотклики (Power) и Indep.(grouping) variableуровни фактор. Далее выбираем группы факторов (технологии), которые будут анализироваться (Group 1 и Group 2).

После данных действий, нажав на кнопку Mann-Whitney U test либо
M-W U Test, можно получить результат тестирования. Результаты теста Манна - Уитни для всех возможных пар выборок представлены на рис. 2.

Рис. 2. Результаты теста Манна - Уитни

В приведенных таблицах приняты следующие обозначения:

Rank Sum Ti – сумма рангов выборки Тi;

Rank Sum Tj – сумма рангов выборки Тj;

U –статистика Манна - Уитни для малых выборок;

Z – нормальная аппроксимация статистики Манна - Уитни для больших выборок;

p - level – вероятность принятия гипотезы Н0;

Z adjusted – скорректированная нормальная аппроксимация статистики Манна - Уитни;

p - level – скорректированная вероятность принятия гипотезы Н0;

Valid Nобъем выборки;

2*1 sided exact pздесь вероятность p равна 1 минус кумулятивная односторонняя вероятность соответствующей статистики Манна – Уитни.

Анализ результатов:

  1.  Для двух технологий (уровней факторов) Т0-Т1 статистика U достаточно велика и нулевую гипотезу можно принять с вероятностью
    р = 0,004072. При 5% уровне значимости гипотезу Н0 следует признать ложной и принять гипотезу Н1 – влияния фактора значительное.
  2.  Сравнивая технологии Т0 и Т2, мы убедились, что изменение откликов незначимо и две выборки можно признать однородными.
  3.  Что касается двух новых технологий Т1 и Т2, то нулевую гипотезу можно принять с вероятностью р = 0,045155, что меньше уровня значимости. На основании этого нулевую гипотезу отвергаем в пользу альтернативной – влияния фактора значительное.

Как и в случае теста Краскела - Уоллиса в закладке Categorized Histogram By Group можно посмотреть и оценить виды распределения отдельных выборок.

ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Так как предварительный ранговый однофакторный анализ подтвердил гипотезу о значимом влиянии фактора, попробуем оценить это влияние количественно в рамках дисперсионного анализа.

Проверяем нулевую гипотезу  – влияние фактора на распределение данных не существенно. Дисперсионный анализ проведем в модуле:

StatisticsBasic StatisticsBreakdown&One-way ANOVA (рис. 3).

Рис. 3. Модуль дисперсионного анализа данных

В закладке Variables выбираются Dependent variable и Grouping variables. В закладке Codes for grouping variables выбираются группы факторов, в нашем примере переменная Technology разбивается на группы Т0, Т1 и Т2.

Рис. 4. Настройка таблицы результатов дисперсионного анализа

Выбор всех групп осуществляем нажатием на кнопку All. В окне настройки результирующих таблиц выбираем группирующие переменные Grouping Variables, ставим галочки в позиции Summary table of means и в позиции Analysis of variance, аналогично галочкой отмечаем те статистические данные, которые хотим более подробно проанализировать (см. рис. 4). После нажатия клавиши OK получим таблицу (рис. 5).

Рис.5. Результаты дисперсионного анализа

Поясним принятые в таблице обозначения:

SS (Sum of Squares) Effect – сумма квадратов факторов (вторая оценка дисперсии (18.7)) умноженная на k - 1;

df Effect – число степеней свободы фактора;

MS (Mean Square) Effect – средний квадрат фактора;

SS Error – сумма квадратов (оценка дисперсии (18.3)) умноженная на Nk;

df Error – число степеней свободы равная Nk;

MS Error – оценка дисперсии (18.3);

F – значение статистики Фишера;

p –вероятность принятия гипотезы Н0.

Статистика Фишера  незначимо отличается от единицы с вероятностью , что значительно меньше уровня значимости. Следовательно, нулевую гипотезу следует отвергнуть в пользу альтернативной гипотезы  влияние фактора существенно.

Так как наряду с дисперсионным анализом в системе Statistica мы позаботились о получении оценок эффектов обработки Summary table of means рис. 6, проанализируем полученные результаты.

Рис. 6. Влияние технологии (уровня фактора) на производительность (отклики)

Полученные результаты (средние) свидетельствуют о существенном различии точечных характеристик для различных групп. Отметим, что наряду со средними значениями мы можем проанализировать такие групповые параметры как дисперсия, медиана, нижний и верхний квартили, минимальное и максимальное значения.

Наряду с точечными оценками в результирующей таблице приведены 95 % доверительные интервалы для каждого параметра (группового среднего).

Фактически исследования в рамках однофакторного анализа можно считать законченными, но анализируя последние данные (см. рис. 6) возникает вопрос. Какие технологии можно считать значимо различными? Для ответа на этот вопрос вернемся в окно Statistics by Groups (Breakdown)→OKSheffe test.

Результат сравнения средних по методу Шеффе для различных пар уровней приведен на рис. 7.

Рис. 7. Тест Шеффа

В результата проверки гипотезы о незначимом различии средних, только для пары Т1 – Т0 вероятность нулевой гипотезы равная 0.001514 много меньше уровня значимости. Поэтому нулевая гипотеза отклоняется, влияние фактора значительное.


 

А также другие работы, которые могут Вас заинтересовать

75607. Сигналы. Электрический сигнал в радиотехнике 390 KB
  Сигнал это информационная функция несущая сообщение о физических свойствах состоянии или поведении какойлибо физической системы объекта или среды а цель обработки сигналов извлечение сведений которые отображены в этих сигналах и преобразование этой информации в форму удобную для восприятия и использования. Для выявления общих свойств сигналов их классифицируют по ряду признаков рис. По возможности предсказания мгновенных значений сигналов в любые моменты времени различают сигналы детерминированные и случайные. Информативным...
75608. РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 259.5 KB
  Ортонормированный базис Для представления одномерных величин достаточно одного параметра. Возникает вопрос нельзя ли ввести ортонормированную систему в пространство функций так же как она вводится для векторного пространства Иначе говоря нельзя ли ввести множество взаимно перпендикулярных единичных функций Если это возможно то рассматриваемую функцию можно выразить в виде линейной комбинации таких функций. Рассмотрим некоторое множество функций семейство функций. Если число этих функций невелико можно...
75609. МАТЕМАТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИГНАЛА. МЕТОДЫ ИССЛЕДОВАНИЯ ПОДОБИЯ СИГНАЛОВ. КОРРЕЛЯЦИЯ 136 KB
  Элемент из этого числового набора называется компонентом вектора. Это означает что анализ вектора f аналогичен анализу функции непрерывного сигнала ft если она не имеет точек разрыва. Для этого необходимо определить понятия: расстояния между векторами скалярное расстояние норма вектора...
75610. РАЗЛОЖЕНИЕ ФУНКЦИЙ В ДЕЙСТВИТЕЛЬНЫЙ РЯД ФУРЬЕ 282.5 KB
  В последнем соотношении колебание самого большого периода, представленное суммой cost и sint, называют колебанием основной частоты или первой гармоникой. Колебание с периодом, равным половине основного периода, называют второй гармоникой
75611. РАЗЛОЖЕНИЕ ФУНКЦИЙ В КОМПЛЕКСНЫЙ РЯД ФУРЬЕ 60.5 KB
  Это и есть разложение в комплексный ряд Фурье. Коэффициенты Сk называются комплексными коэффициентами Фурье и, подобно действительным коэффициентам Фурье, вычисляются как скалярные произведения
75612. КЛЮЧЕВЫЕ ОПЕРАЦИИ ЦОС 191 KB
  Применяется для вычисления выходного сигнала yt линейной системы по заданному входному xt и известному импульсному отклику ht рис. Линейными называются системы для которых справедлив принцип суперпозиции отклик на сумму входных сигналов равен сумме откликов на эти сигналы по отдельности и принцип однородности изменение амплитуды входного сигнала вызывает пропорциональное изменение амплитуды выходного сигнала. Для реальных систем объектов свойство линейности может выполняться приближенно В системах цифровой обработки...
75613. ПРОГРАММИРОВАНИЕ КЛЮЧЕВЫХ ОПЕРАЦИЙ ЦОС В MATLAB 51.5 KB
  Основные арифметические операции в MATLAB: сложение, вычитание, умножение , деление и возведение в степень. Операции умножения, деления и возведения в степень рассчитаны на работу с матрицами, поэтому при поэлементных операциях они записываются
75614. Цифровая фильтрация 152 KB
  согласованные фильтры; фильтры для борьбы с шумами при нелинейных и нестационарных процессах фильтр ГильбертаХуанга Выбор способа борьбы с шумами должен производится с учетом свойств и особенностей информативного сигнала и помехи. Чем в большей степени свойства сигнала и шума априори известны тем может быть получен больший эффект от цифровой обработки. Кроме того несмотря на обилие стандартных доведенных до уровня готовых программ цифровой обработки с учетом конкретных априори известных свойствах информативного сигнала и шума может...
75615. ОПТИМАЛЬНАЯ И СОГЛАСОВАННАЯ ФИЛЬТРАЦИЯ 170.5 KB
  Оптимальная фильтрация Оптимальное выделение сигнала из шума можно проводить различными методами в зависимости от того какая задача ставится: обнаружение сигнала сохранение формы сигнала и т. В каждом методе оптимальной фильтрации вводится понятие критерия оптимальности согласно которому строится оптимальный алгоритм обработки сигнала. Оптимальный фильтр КолмогороваВинера Фильтры низкой частоты высокой частоты и полосовые фильтры эффективны в том случае когда частотные спектры сигнала и шума не...