10980

Факторный анализ. Задача однофакторного анализа

Лекция

Математика и математический анализ

Факторный анализ Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи т.е. проверки существенности различия выборочных средних совокупностей . Например требуется оцен

Русский

2013-04-03

89.48 KB

17 чел.

Факторный анализ

Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи, т.е. проверки существенности различия выборочных средних совокупностей . Например, требуется оценить влияние различных режимов плавок на механические свойства металла, свойств сырья на показатели качества продукции, количества вносимых удобрений на урожайность и т.п.

Для эффективного решения таких задач нужен новый подход, который реализуется в рамках теории ранговых критериев и в дисперсионном анализе.

Ранговые критерии (непараметрические критерии) – предназначены, в первую очередь, для задач проверки согласия и сравнения двух  и более выборок.

Ранговые критерии применяются не только при отсутствии информации о виде распределения, но и тогда, когда наблюдения могут быть только упорядочены, как это часто бывает с социологии, медицине и т.п.

Дисперсионный анализэто статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Первоначально (1918 г.) дисперсионный анализ был разработан английским математиком – статистиком Р.А. Фишером. По числу факторов, влияние которых исследуется, различают однофакторный и многофакторный анализ.

Задача однофакторного анализа

При исследовании зависимостей одной из наиболее простых является ситуация, когда можно указать только один фактор, влияющий на конечный результат, и этот фактор может принимать лишь конечное число значений (уровней). Такие задачи, называемые задачами однофакторного анализа, весьма часто встречаются на практике. Типичный пример задач однофакторного анализа – сравнение по достигаемым результатам нескольких различных способов действия, направленных на достижение одной цели, скажем, нескольких школьных учебников или нескольких лекарств.

Терминология

Фактором (факторами) называют то, что, как мы считаем, должно оказывать влияние на конечный результат. В приведенных выше примерах факторами являются понятия "школьный учебник" или "лекарство".

Уровень фактора или способ обработкиэто конкретная реализация фактора (например, определённый школьный учебник, или выбранное лекарство).

Откликом часто называют значения измеряемого признака (т.е. величину результата).

Для сравнения влияния фактора (факторов) на результат необходим определённый статистический материал. Обычно его получают следующим образом: каждый из способов обработки применяют несколько раз (не обязательно одно и то же число раз) к исследуемому объекту и регистрируют отклик (результат). Итогом подобных испытаний являются выборок, вообще говоря, разных объемов. В зависимости от количества влияющих факторов (в нашем случае один фактор), говорят, что данные сведены в таблицу, с одним, двумя и т. д. входами.

Таблица 1  

Уровни фактора

1

2

3

...

Отклики (результаты измерений)

...

...

Здесь объёмы выборок при соответствующем уровне фактора, общее число наблюдений.

Прежде, чем судить о количественном влиянии фактора на измеряемый признак, полезно вначале решить, а есть ли такое влияние вообще. Нельзя ли объяснить расхождение наблюденных значений в опыте для различных уровней факторов действием чистой случайности? Ведь присущая исследуемому явлению внутренняя изменчивость уже привела к тому, что результаты оказываются различными даже при неизменном значении фактора (т.е. в табл. 1 значения в одном столбце различны). Может той же причиной (изменчивость, случайность) можно объяснить и различие между столбцами?

Выдвинем статистическое предположение – все данные принадлежат одному и тому же распределению. Это предположение называется нулевой гипотезой . Если она считается справедливой, то анализ закончен. В противном случае возникает задача оценки величины эффектов обработки и выяснения качества полученных оценок.

РАНГОВЫЙ ОДНОФАКТОРНЫЙ АНАЛИЗ

Если ничего не известно о распределении неизвестных, то использовать для проверки гипотезы количественные наблюдения становится затруднительно. В этих случаях проще основывать свои выводы на отношениях "больше – меньше" между наблюдениями, т.к. они не зависят от вида распределения. Теперь вся информация, включенная в табл. 1, содержится в тех рангах, что, получают числа при  упорядочении всей совокупности (направление упорядочивания minmax, или maxmin – не существенно).

Тогда таблица 1 преобразуется в таблицу 2:

Таблица 2  

Обработки (Уровни фактора)

1

2

3

...

Ранги результатов измерений

...

...

Критерий Краскела – Уоллиса

Заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Затем для каждой обработки (фактора) вычисляем:

и    (17.1)

это средний ранг по столбцу. Если по столбцам нет систематических различий, средние ранги не должны значительно отличатся от среднего ранга, рассчитанного по всей совокупности . Ясно, что последний равен . Поэтому величины при в совокупности должны быть небольшими. В качестве оценки меры отступления от чистой случайности и для учета различия в числе наблюдений для разных обработок предложена статистика Краскела – Уоллеса:

 (17.2)

Статистика имеет распределение с степенями свободы.

Замечание: Если в измерениях много совпадающих значений, то используется модифицированная статистика

Здесь число групп, совпадающих наблюдений,  число совпадающих наблюдений в группе с номером

Критерий Кронкхиера
(альтернативы с упорядочиванием)

Нередко известно, что имеющиеся группы результатов упорядочены по возрастанию (убыванию) влияния фактора. Пусть для определённости, первый столбец соответствует min фактору (см. табл. 2), а последний – max. В таких случаях можно использовать статистику Джонкхиера, более чувствительную (более мощную) против альтернатив об упорядоченном влиянии фактора. Разумеется, против других альтернатив свойства этого критерия могут оказаться хуже свойств критерия Краскела – Уоллиса.

Статистика Джонкхиера

Для простоты сначала рассмотрим статистику этого критерия в случае, когда сравниваются только 2 способа обработки (два уровня фактора). Тогда в нашей таблице (см. выше) будет всего два столбца. Фактически здесь идет речь о проверке однородности двух выборок. Вспомним, что для решения этой задачи используется статистика Манна – Уитни. А именно, пусть имеются две выборки: и  .

Положим:

   (17.4)

Статистика Манна – Уитни это:

    (17.5)

Теперь, в случае, когда сравниваются способов обработки (уровней), поступим следующим образом. Для каждой пары чисел и , где , составляем по выборкам с номерами и статистику
Манна – Уитни:

   (17.6)

Определим статистику Джонкхиера как

     (17.7)

Свидетельством в пользу альтернативы упорядоченности эффектов (против гипотезы однородности) служат большие значения статистики , полученные в эксперименте.

Статистика – табулирована для малых выборок с небольшим значением . Для больших выборок в отношении действует нормальная аппроксимация:

,  где и соответственно равны:

     (17.8)

 (17.9)

Свидетельством против гипотезы однородности служат большие (сравнительно с процентными точками нормального распределения) значения статистики .

Замечание  В результате проверки рангового критерия (критериев) можно однозначно (статистически) решить, если верна гипотеза , то влияние фактора не значимо и на этом однофакторный анализ закончен. Если же верна альтернативная гипотеза влияние фактора значительное, то хотелось бы продолжить однофакторный анализ и перейти от качественной оценки к количественной.


 

А также другие работы, которые могут Вас заинтересовать

62098. Овощи. Приготовление блюд из овощей. Питание и здоровье 28.49 KB
  Задачи урока: Обучающие О способствовать формированию и развитию умений и навыков по приготовлению блюд из вареных овощей; способствовать осознанию основного технологического материала...
62099. Внутренний мир человека и профессиональное самоопределение 214.46 KB
  Цели урока: Воспитательная: Воспитывать толерантность по отношению друг к другу; Воспитывать уважительное отношение к труду людей; Образовательная: Познакомить учащихся с внутренним миром человека и его составляющими...
62100. Плетіння гачком як вид декоративно-ужиткового мистецтва. Вироби, плетені гачком. Правила безпечної праці, санітарно-гігієнічні вимоги та організація робочого місця 423.19 KB
  Мета уроку: Освітня: засвоєння учнями знань про плетіння гачкомяк вид декоративно прикладного мистецтва види виробів плетених гачком правила безпечної праці та санітарно-гігієнічні вимоги до організація робочого місця.
62101. Вишивка як вид ДПМ. Технологія виконання мережки «Одинарний прутик» 200.22 KB
  Мета уроку: Освітня: засвоєння учнями знань про вишивку як вид декоративно-прикладного мистецтва інструменти та матеріали для вишивки мережкою формування практичних умінь виконання мережки одинарний прутик з дотриманням правил техніки безпеки...
62102. Природні зони Північної Америки 342.89 KB
  Тип уроку: засвоєння нових знань Обладнання: учнівські презентації; атласи школярів; авторська презентація ppt Природні зони Північної Америки; листи опорноінформаційних схем школярів. Природні зони Як незвично вони розташовані.
62103. Нумерація чисел 11-20 95.52 KB
  Про що йде в задачі про завод який виготовляв плеєри і телефони Скільки завод виготовив плеєрів 9 Скільки завод виготовив телефонів 7 Про що ми дізнаємося якщо до 9 7 скільки разом виготовили плеєрів і телефонів...
62105. Теорема Виета 31.88 KB
  В соответствии с этим можно выделить следующие структурные элементы данного урока: 1 проверка домашнего задания; 2 подведение учащихся к теореме Виета; 3 формулирование теоремы Виета; 4 доказательство теоремы Виета...