10980

Факторный анализ. Задача однофакторного анализа

Лекция

Математика и математический анализ

Факторный анализ Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи т.е. проверки существенности различия выборочных средних совокупностей . Например требуется оцен

Русский

2013-04-03

89.48 KB

17 чел.

Факторный анализ

Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи, т.е. проверки существенности различия выборочных средних совокупностей . Например, требуется оценить влияние различных режимов плавок на механические свойства металла, свойств сырья на показатели качества продукции, количества вносимых удобрений на урожайность и т.п.

Для эффективного решения таких задач нужен новый подход, который реализуется в рамках теории ранговых критериев и в дисперсионном анализе.

Ранговые критерии (непараметрические критерии) – предназначены, в первую очередь, для задач проверки согласия и сравнения двух  и более выборок.

Ранговые критерии применяются не только при отсутствии информации о виде распределения, но и тогда, когда наблюдения могут быть только упорядочены, как это часто бывает с социологии, медицине и т.п.

Дисперсионный анализэто статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Первоначально (1918 г.) дисперсионный анализ был разработан английским математиком – статистиком Р.А. Фишером. По числу факторов, влияние которых исследуется, различают однофакторный и многофакторный анализ.

Задача однофакторного анализа

При исследовании зависимостей одной из наиболее простых является ситуация, когда можно указать только один фактор, влияющий на конечный результат, и этот фактор может принимать лишь конечное число значений (уровней). Такие задачи, называемые задачами однофакторного анализа, весьма часто встречаются на практике. Типичный пример задач однофакторного анализа – сравнение по достигаемым результатам нескольких различных способов действия, направленных на достижение одной цели, скажем, нескольких школьных учебников или нескольких лекарств.

Терминология

Фактором (факторами) называют то, что, как мы считаем, должно оказывать влияние на конечный результат. В приведенных выше примерах факторами являются понятия "школьный учебник" или "лекарство".

Уровень фактора или способ обработкиэто конкретная реализация фактора (например, определённый школьный учебник, или выбранное лекарство).

Откликом часто называют значения измеряемого признака (т.е. величину результата).

Для сравнения влияния фактора (факторов) на результат необходим определённый статистический материал. Обычно его получают следующим образом: каждый из способов обработки применяют несколько раз (не обязательно одно и то же число раз) к исследуемому объекту и регистрируют отклик (результат). Итогом подобных испытаний являются выборок, вообще говоря, разных объемов. В зависимости от количества влияющих факторов (в нашем случае один фактор), говорят, что данные сведены в таблицу, с одним, двумя и т. д. входами.

Таблица 1  

Уровни фактора

1

2

3

...

Отклики (результаты измерений)

...

...

Здесь объёмы выборок при соответствующем уровне фактора, общее число наблюдений.

Прежде, чем судить о количественном влиянии фактора на измеряемый признак, полезно вначале решить, а есть ли такое влияние вообще. Нельзя ли объяснить расхождение наблюденных значений в опыте для различных уровней факторов действием чистой случайности? Ведь присущая исследуемому явлению внутренняя изменчивость уже привела к тому, что результаты оказываются различными даже при неизменном значении фактора (т.е. в табл. 1 значения в одном столбце различны). Может той же причиной (изменчивость, случайность) можно объяснить и различие между столбцами?

Выдвинем статистическое предположение – все данные принадлежат одному и тому же распределению. Это предположение называется нулевой гипотезой . Если она считается справедливой, то анализ закончен. В противном случае возникает задача оценки величины эффектов обработки и выяснения качества полученных оценок.

РАНГОВЫЙ ОДНОФАКТОРНЫЙ АНАЛИЗ

Если ничего не известно о распределении неизвестных, то использовать для проверки гипотезы количественные наблюдения становится затруднительно. В этих случаях проще основывать свои выводы на отношениях "больше – меньше" между наблюдениями, т.к. они не зависят от вида распределения. Теперь вся информация, включенная в табл. 1, содержится в тех рангах, что, получают числа при  упорядочении всей совокупности (направление упорядочивания minmax, или maxmin – не существенно).

Тогда таблица 1 преобразуется в таблицу 2:

Таблица 2  

Обработки (Уровни фактора)

1

2

3

...

Ранги результатов измерений

...

...

Критерий Краскела – Уоллиса

Заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Затем для каждой обработки (фактора) вычисляем:

и    (17.1)

это средний ранг по столбцу. Если по столбцам нет систематических различий, средние ранги не должны значительно отличатся от среднего ранга, рассчитанного по всей совокупности . Ясно, что последний равен . Поэтому величины при в совокупности должны быть небольшими. В качестве оценки меры отступления от чистой случайности и для учета различия в числе наблюдений для разных обработок предложена статистика Краскела – Уоллеса:

 (17.2)

Статистика имеет распределение с степенями свободы.

Замечание: Если в измерениях много совпадающих значений, то используется модифицированная статистика

Здесь число групп, совпадающих наблюдений,  число совпадающих наблюдений в группе с номером

Критерий Кронкхиера
(альтернативы с упорядочиванием)

Нередко известно, что имеющиеся группы результатов упорядочены по возрастанию (убыванию) влияния фактора. Пусть для определённости, первый столбец соответствует min фактору (см. табл. 2), а последний – max. В таких случаях можно использовать статистику Джонкхиера, более чувствительную (более мощную) против альтернатив об упорядоченном влиянии фактора. Разумеется, против других альтернатив свойства этого критерия могут оказаться хуже свойств критерия Краскела – Уоллиса.

Статистика Джонкхиера

Для простоты сначала рассмотрим статистику этого критерия в случае, когда сравниваются только 2 способа обработки (два уровня фактора). Тогда в нашей таблице (см. выше) будет всего два столбца. Фактически здесь идет речь о проверке однородности двух выборок. Вспомним, что для решения этой задачи используется статистика Манна – Уитни. А именно, пусть имеются две выборки: и  .

Положим:

   (17.4)

Статистика Манна – Уитни это:

    (17.5)

Теперь, в случае, когда сравниваются способов обработки (уровней), поступим следующим образом. Для каждой пары чисел и , где , составляем по выборкам с номерами и статистику
Манна – Уитни:

   (17.6)

Определим статистику Джонкхиера как

     (17.7)

Свидетельством в пользу альтернативы упорядоченности эффектов (против гипотезы однородности) служат большие значения статистики , полученные в эксперименте.

Статистика – табулирована для малых выборок с небольшим значением . Для больших выборок в отношении действует нормальная аппроксимация:

,  где и соответственно равны:

     (17.8)

 (17.9)

Свидетельством против гипотезы однородности служат большие (сравнительно с процентными точками нормального распределения) значения статистики .

Замечание  В результате проверки рангового критерия (критериев) можно однозначно (статистически) решить, если верна гипотеза , то влияние фактора не значимо и на этом однофакторный анализ закончен. Если же верна альтернативная гипотеза влияние фактора значительное, то хотелось бы продолжить однофакторный анализ и перейти от качественной оценки к количественной.


 

А также другие работы, которые могут Вас заинтересовать

40799. Переходные процессы в линейных электрических цепях с сосредоточенными параметрами 66.4 KB
  Для цепей с заданными постоянными или периодическими напряжениями токами источников принужденная составляющая определяется путем расчета стационарного режима работы схемы после коммутации любым из рассмотренных ранее методов расчета линейных электрических цепей. общее решение уравнения 2 имеет вид 4 Соотношение 4 показывает что при классическом методе расчета послекоммутационный процесс рассматривается как наложение друг на друга двух режимов – принужденного наступающего как бы сразу после коммутации и свободного имеющего...
40800. Способы составления характеристического уравнения 81.02 KB
  Характеристическое уравнение составляется для цепи после коммутации. путем исключения из системы уравнений описывающих электромагнитное состояние цепи на основании первого и второго законов Кирхгофа всех неизвестных величин кроме одной относительно которой и записывается уравнение 2; путем использования выражения для входного сопротивления цепи на синусоидальном токе; на основе выражения главного определителя. Согласно первому способу в предыдущей лекции было получено дифференциальное уравнение относительно напряжения на...
40801. Переходные процессы в цепи с одним накопителем энергии и произвольным числом резисторов 81.22 KB
  Переходные процессы в цепи с одним накопителем энергии и произвольным числом резисторов. Общий подход к расчету переходных процессов в таких цепях основан на применении теоремы об активном двухполюснике: ветвь содержащую накопитель выделяют из цепи а оставшуюся часть схемы рассматривают как активный двухполюсник А эквивалентный генератор см. Совершенно очевидно что постоянная времени здесь для цепей с индуктивным элементом определяется как: и с емкостным как: где входное сопротивление цепи по отношению к зажимам 12 подключения...
40802. Расчет переходных процессов с использованием интеграла Дюамеля 64.54 KB
  Метод переменных состояния Уравнения элекромагнитного состояния – это система уравнений определяющих режим работы состояние электрической цепи. Метод переменных состояния основывается на упорядоченном составлении и решении системы дифференциальных уравнений первого порядка которые разрешены относительно производных т. Количество переменных состояния а следовательно число уравнений состояния равно числу независимых накопителей энергии. К уравнениям состояния выдвигаются два основных требования: независимость уравнений; возможность...
40803. Сущность операторного метода 83.67 KB
  В результате этого производные и интегралы от оригиналов заменяются алгебраическими функциями от соответствующих изображений дифференцирование заменяется умножением на оператор р а интегрирование – делением на него что в свою очередь определяет переход от системы интегродифференциальных уравнений к системе алгебраических уравнений относительно изображений искомых переменных. Изображения типовых функций Оригинал А Изображение Некоторые свойства изображений Изображение суммы функций равно сумме изображений слагаемых: . Законы...
40804. Применение кривых второго порядка в компьютерных системах 158 KB
  Программа для построения графиков является наукой, но простой в использовании. Она позволяет создавать анимированные 3D графики уравнений в табличных данных. В одной системе координат может быть неограниченное количество графиков, каждый из которых может отображаться при помощи точек, линий и поверхностей.
40805. Частотный (спектральный) метод анализа электрических цепей 67.46 KB
  Поскольку частотные характеристики являются характеристиками установившегося режима гармонических колебаний то целесообразно произвольное воздействие представить в виде совокупности гармонических и реакцию линейной цепи искать как совокупность реакций вызванных каждым гармоническим воздействием в отдельности. Таким образом частотный метод анализа включает в себя задачу частотного или спектрального представления воздействия в виде суммы гармонических составляющих с определенными амплитудами начальными фазами и частотами а также задачу...
40806. Цепи с распределенными параметрами 65.82 KB
  Однако на практике часто приходится иметь дело с цепями линии электропередачи передачи информации обмотки электрических машин и аппаратов и т. уже при к линии следует подходить как к цепи с распределенными параметрами. Для исследования процессов в цепи с распределенными параметрами другое название – длинная линия введем дополнительное условие о равномерности распределения вдоль линии ее параметров: индуктивности сопротивления емкости и проводимости. Уравнения однородной линии в стационарном режиме Под первичными параметрами линии...
40807. Линии без искажений 80.64 KB
  Пусть сигнал который требуется передать без искажений по линии является периодическим т. Таким образом для отсутствия искажений что очень важно например в линиях передачи информации необходимо чтобы все гармоники распространялись с одинаковой скоростью и одинаковым затуханием поскольку только в этом случае сложившись они образуют в конце линии сигнал подобный входному. Однако искажения могут отсутствовать и в линии с потерями.