10984

Двухфакторный анализ

Лекция

Математика и математический анализ

Двухфакторный анализ Бывает что в рамках однофакторной модели влияние интересующего нас фактора не проявляется хотя логические соображения указывают что такое влияние должно быть. Иногда это влияние проявляется но точность выводов о количественной оценке этого вли...

Русский

2013-04-03

146.5 KB

42 чел.

Двухфакторный анализ

Бывает, что в рамках однофакторной модели влияние интересующего нас фактора не проявляется, хотя логические соображения указывают, что такое влияние должно быть. Иногда это влияние проявляется, но точность выводов о количественной оценке этого влияния недостаточна. Причиной этого может быть большой внутригрупповой разброс, на фоне которого действие фактора остается незаметным или почти незаметным. Очень часто такой разброс вызывается не только случайными причинами, но также действием еще одного фактора. Если мы в состоянии указать такой фактор, можно попытаться включить его в модель, чтобы уменьшить статистическую неоднородность наблюдений и благодаря этому выявить действие на отклик закономерных причин. Конечно, не всегда удается поправить дело введением одного "мешающего" фактора и переходом к двухфакторным схемам. Иногда приходится рассматривать и трех–, и многофакторные модели.

К задачам двухфакторного или многофакторного анализа часто приводят исследования по оптимизации технологических процессов. Иногда факторы разделяют на важные и мешающие, но это совершенно не обязательно. В ряде задач факторы для экспериментатора содержательно равноправны.

Рассмотрим таблицу двухфакторного анализа (см. табл. 1). Назовем главный фактор фактором , а мешающий фактор – фактором . Пусть фактор принимает , а фактор различных значений. Фактор разбивает все объекты наблюдения на блоков. Каждый блок образует наблюдения, проведенные при одном уровне фактора . В блоке отклики могут значимо различаться только за счет применения к ним различных обработок (уровнях фактора ). Уровни фактора отображаются в таблице по столбцам, а уровни фактора по строкам.

Отличие таблицы двухфакторного анализа от аналогичной таблицы однофакторного анализа заключается в том, что наблюдения в одном столбце не являются однородными, т.е. могут не образовывать выборки (если влияние мешающего фактора значимо).

Таблица 1

Уровни фактора

Блоки

1

2

3

...

...

...

Замечание:  На практике часто рассматриваются таблицы с повторными измерениями, т.е. в каждой клетке табл. 1 могут содержаться несколько наблюдений, что не сможет существенно усложнить анализ.

Аддитивная модель данных двухфакторного эксперимента
при независимом действии факторов

В аддитивной двухфакторной модели каждое наблюдение представляется в виде:

 (21.1)

В этой модели (21.1) числа являются результатом воздействия на отклик мешающего фактора , действие которого разбивает все данные на блоки. Поэтому величины называют эффектами блоков. Числа отражают действие на отклик интересующего нас фактора и именуются эффектами обработки.

Относительно предполагается, что они одинаково распределены и независимы в совокупности. Существуют различные методы двухфакторного анализа, которые требуют от их распределения () либо только непрерывности, либо принадлежности к нормальному распределению .

Очевидно, что даже при справедливости выражения (21.1), величины вкладов факторов и не могут быть восстановлены однозначно. Действительно, увеличение всех на одну и ту же const и одновременное уменьшение всех на эту же const, оставляет выражение (21.1) неизменным. Для однозначной определенности вкладов факторов удобно перейти к представлению наблюдений в ином виде:

 (21.2)

Здесь полагаем, что . При этом параметр интерпретируется как среднее значение , присущее всем величинам , а и как отклонения от в результате действия факторов и .

Гипотеза  Как и в однофакторном анализе, вначале целесообразно проверить гипотезу о значимости эффектов обработки (уровней факторов
). Сформулируем нулевую гипотезу . Т.е. предполагаем, что влияние фактора отсутствует.

На первом этапе рассмотрим ранговые критерии, которые не требуют знания вида распределения случайной величины.

РАНГОВЫЕ КРИТЕРИИ

Критерий Фридмана

В этом критерии полагаем, что значения непрерывны, а сами величины независимы в совокупности. В двухфакторном анализе ранжирование проводится не по всей совокупности , а поблочно, т.е. (см. табл. 1) рассматривается каждая отдельная строка. При этом устраняется влияние "мешающего" фактора , значение которого для каждой строки постоянно.

Итак, подсчитываем ранги: . При этом известно, что изменяется от до , а каждая строка представляется соответствующей перестановкой чисел от до . Для простоты, считаем, что одинаковые значения отсутствуют, в противном случае берем средние ранги. При истинности нулевой гипотезы ; каждая строка рангов – случайная перестановка чисел. Причем все перестановок – равновероятны. Введем средние ранги (по столбцу):

.     (21.3)

При гипотезе все перестановки рангов равновозможны, поэтому значения не должны сильно отличаться от общего среднего ранга таблицы:

.      (21.4)

Статистика Фридмана имеет вид:

. (21.5)

Если гипотеза верна, то величины сравнительно малы для всех , тогда и не велико. Если значение велико, то гипотеза отвергается.

Замечание  При больших для выбора критических значений пользуются аппроксимацией, основанной на том, что при справедливости гипотезы и статистика Фридмана асимптотически распределена как с степенями свободы. Т.о. гипотеза принимается, если , в противном случае принимается альтернативная гипотеза .

Критерий Пейджа
(альтернативы с упорядочением)

Данный критерий применяется в тех случаях, когда хотим определить преимущества различной обработки. Здесь, как и в критерии Фридмана, проверяем нулевую гипотезу , против альтернативы . Причем в альтернативной гипотезе хотя бы одно из неравенств – строгое. Статистика Пейджа имеет вид:

.  (21.6)

Нулевая гипотеза отклоняется с достоверностью α, если
, где
 критические значения статистики Пейджа. При  справедлива аппроксимация

Здесь

При  нулевая гипотеза отклоняется ( квантиль стандартного нормального распределения).

ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Если предположить, что имеет распределение , то можно предложить более мощный критерий для гипотезы и построить более эффективные оценки параметров и . Отметим, что при этом используются методы аналогичные тем, что использовались при однофакторном дисперсионном анализе.

Как и в однофакторном анализе, получим две различные оценки дисперсии: оценка не зависит от того, верна ли гипотеза или нет; оценка справедлива лишь при истинности гипотезы .

Оптимальная в классе несмещенных оценок оценка получается методом наименьших квадратов. Для этого сначала оценим неизвестные параметры и в модели (21.2). Найдем значения  и  такие, при которых достигается min функции:

,    (21.9)

при условии, что . Решая задачу (21.9) получим:

Полученные оценки параметров имеют следующие распределения:

.

Оценка имеет распределение с числом степеней свободы равным . Сама оценка равна:

.  (21.11)

Вторую оценку получим, воспользовавшись тем, что СВ являются средними значениями по соответствующим столбцам таблицы двухфакторного анализа. Эти СВ при нулевой гипотезе независимы и одинаково распределены по нормальному закону . На основе этого можно считать, что оценка имеет распределение с числом степеней свободы и равна:

.   (21.12)

Как и в однофакторном анализе, составляем отношение двух оценок дисперсий:

.  (21.13)

распределение (распределение Фишера–Снедекора) с числом степеней свободы и . Критерий проверки гипотезы имеет вид:

  1.  гипотеза отвергается на уровне значимости , если ;
  2.  гипотеза принимается на уровне значимости , если

Здесь и – число степеней свободы распределения Фишера–Снедекора.


 

А также другие работы, которые могут Вас заинтересовать

4286. Основные понятия бинарных деревьев 92.5 KB
  Бинарные деревья Рассмотрим структуры данных, определяемые с помощью рекурсии. Среди них наиболее важными являются деревья. Деревья имеют широкое применение при реализации трансляторов таблиц решений, при работе с арифметическими выражениями, при со...
4287. Массивы. Основные операции над ними. Алгоритмы обработки массивов 131.5 KB
  Массивы. Основные операции над ними. Алгоритмы обработки массивов. Структурные типы данных. Способы представления в памяти. Переменные структурного типа содержат более одного значения. К структурным типам относятся множества, массивы, записи, файлы,...
4288. Модули. Структура модуля. Стандартные модули Delphi 97 KB
  Модули. Структура модуля. Стандартные модули Delphi. Структура модуля. Модули – одно из ключевых понятий языка Паскаль. Они предназначены для разбиения проекта на части. В каждом модуле могут быть собраны константы, типы, переменные...
4289. Связные списки, стеки, очереди 237 KB
  Связные списки, стеки и очереди Как и массивы, связные списки представляют собой универсальную структуру данных, широко используемую многими программистами. Однако, в отличие от массивов, связные списки не входят в состав стандартного языка...
4290. Виртуальный маркетинг и его применение на отечественных рынках 31 KB
  Виртуальный маркетинг и его применение на отечественных рынках Получают развитие сетевые или виртуальные организации, т.е. организации, в которых границы между его участниками, ресурсами и подразделениями размыты благодаря интенсивному информационно...
4291. Организация ветвления и его алгоритмическая структура 49.5 KB
  Организация ветвления Цель работы: освоить алгоритмическую структуру ветвление, а также работу команды ветвления. Образец решения задачи. Задача. В компьютер вводится информация: количество знаков в рекламе на какой странице в газете будет печатать...
4292. Становлення та розвиток української та європейської культури в 19 - початку 20 ст. Частина 2. Українське мистецтво 55 KB
  В першій половині 19 ст. в Україні зявився перший професійний театр. Спершу це були бродячі акторські групи. Потім з'являються перші театральні приміщення, що приймають у себе гастролерів і дають сцену для власних театральних труп. У 1818 р. Іван Котляревський очолив професійний театр у Полтаві...
4293. Освоение приемов объявления, обращения и использования двумерных массивов при решении задач. 78.5 KB
  Цель работы: освоение приемов объявления, обращения и использования двумерных массивов при решении задач. Один из возможных вариантов объявления двумерного массива в программе: объявляем две константы – максимально возможное количество строк и...
4294. Освоение приемов объявления, обращения и использования массивов при решении задач 64.5 KB
  Цель работы: освоение приемов объявления, обращения и использования массивов при решении задач. Типовые алгоритмы обработки одномерных массивов Рассмотрим некоторые типовые алгоритмы обработки массивов. Положим, что в декларативной части программы о...