10980

Факторный анализ. Задача однофакторного анализа

Лекция

Математика и математический анализ

Факторный анализ Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи т.е. проверки существенности различия выборочных средних совокупностей . Например требуется оцен

Русский

2013-04-03

89.48 KB

17 чел.

Факторный анализ

Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи, т.е. проверки существенности различия выборочных средних совокупностей . Например, требуется оценить влияние различных режимов плавок на механические свойства металла, свойств сырья на показатели качества продукции, количества вносимых удобрений на урожайность и т.п.

Для эффективного решения таких задач нужен новый подход, который реализуется в рамках теории ранговых критериев и в дисперсионном анализе.

Ранговые критерии (непараметрические критерии) – предназначены, в первую очередь, для задач проверки согласия и сравнения двух  и более выборок.

Ранговые критерии применяются не только при отсутствии информации о виде распределения, но и тогда, когда наблюдения могут быть только упорядочены, как это часто бывает с социологии, медицине и т.п.

Дисперсионный анализэто статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Первоначально (1918 г.) дисперсионный анализ был разработан английским математиком – статистиком Р.А. Фишером. По числу факторов, влияние которых исследуется, различают однофакторный и многофакторный анализ.

Задача однофакторного анализа

При исследовании зависимостей одной из наиболее простых является ситуация, когда можно указать только один фактор, влияющий на конечный результат, и этот фактор может принимать лишь конечное число значений (уровней). Такие задачи, называемые задачами однофакторного анализа, весьма часто встречаются на практике. Типичный пример задач однофакторного анализа – сравнение по достигаемым результатам нескольких различных способов действия, направленных на достижение одной цели, скажем, нескольких школьных учебников или нескольких лекарств.

Терминология

Фактором (факторами) называют то, что, как мы считаем, должно оказывать влияние на конечный результат. В приведенных выше примерах факторами являются понятия "школьный учебник" или "лекарство".

Уровень фактора или способ обработкиэто конкретная реализация фактора (например, определённый школьный учебник, или выбранное лекарство).

Откликом часто называют значения измеряемого признака (т.е. величину результата).

Для сравнения влияния фактора (факторов) на результат необходим определённый статистический материал. Обычно его получают следующим образом: каждый из способов обработки применяют несколько раз (не обязательно одно и то же число раз) к исследуемому объекту и регистрируют отклик (результат). Итогом подобных испытаний являются выборок, вообще говоря, разных объемов. В зависимости от количества влияющих факторов (в нашем случае один фактор), говорят, что данные сведены в таблицу, с одним, двумя и т. д. входами.

Таблица 1  

Уровни фактора

1

2

3

...

Отклики (результаты измерений)

...

...

Здесь объёмы выборок при соответствующем уровне фактора, общее число наблюдений.

Прежде, чем судить о количественном влиянии фактора на измеряемый признак, полезно вначале решить, а есть ли такое влияние вообще. Нельзя ли объяснить расхождение наблюденных значений в опыте для различных уровней факторов действием чистой случайности? Ведь присущая исследуемому явлению внутренняя изменчивость уже привела к тому, что результаты оказываются различными даже при неизменном значении фактора (т.е. в табл. 1 значения в одном столбце различны). Может той же причиной (изменчивость, случайность) можно объяснить и различие между столбцами?

Выдвинем статистическое предположение – все данные принадлежат одному и тому же распределению. Это предположение называется нулевой гипотезой . Если она считается справедливой, то анализ закончен. В противном случае возникает задача оценки величины эффектов обработки и выяснения качества полученных оценок.

РАНГОВЫЙ ОДНОФАКТОРНЫЙ АНАЛИЗ

Если ничего не известно о распределении неизвестных, то использовать для проверки гипотезы количественные наблюдения становится затруднительно. В этих случаях проще основывать свои выводы на отношениях "больше – меньше" между наблюдениями, т.к. они не зависят от вида распределения. Теперь вся информация, включенная в табл. 1, содержится в тех рангах, что, получают числа при  упорядочении всей совокупности (направление упорядочивания minmax, или maxmin – не существенно).

Тогда таблица 1 преобразуется в таблицу 2:

Таблица 2  

Обработки (Уровни фактора)

1

2

3

...

Ранги результатов измерений

...

...

Критерий Краскела – Уоллиса

Заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Затем для каждой обработки (фактора) вычисляем:

и    (17.1)

это средний ранг по столбцу. Если по столбцам нет систематических различий, средние ранги не должны значительно отличатся от среднего ранга, рассчитанного по всей совокупности . Ясно, что последний равен . Поэтому величины при в совокупности должны быть небольшими. В качестве оценки меры отступления от чистой случайности и для учета различия в числе наблюдений для разных обработок предложена статистика Краскела – Уоллеса:

 (17.2)

Статистика имеет распределение с степенями свободы.

Замечание: Если в измерениях много совпадающих значений, то используется модифицированная статистика

Здесь число групп, совпадающих наблюдений,  число совпадающих наблюдений в группе с номером

Критерий Кронкхиера
(альтернативы с упорядочиванием)

Нередко известно, что имеющиеся группы результатов упорядочены по возрастанию (убыванию) влияния фактора. Пусть для определённости, первый столбец соответствует min фактору (см. табл. 2), а последний – max. В таких случаях можно использовать статистику Джонкхиера, более чувствительную (более мощную) против альтернатив об упорядоченном влиянии фактора. Разумеется, против других альтернатив свойства этого критерия могут оказаться хуже свойств критерия Краскела – Уоллиса.

Статистика Джонкхиера

Для простоты сначала рассмотрим статистику этого критерия в случае, когда сравниваются только 2 способа обработки (два уровня фактора). Тогда в нашей таблице (см. выше) будет всего два столбца. Фактически здесь идет речь о проверке однородности двух выборок. Вспомним, что для решения этой задачи используется статистика Манна – Уитни. А именно, пусть имеются две выборки: и  .

Положим:

   (17.4)

Статистика Манна – Уитни это:

    (17.5)

Теперь, в случае, когда сравниваются способов обработки (уровней), поступим следующим образом. Для каждой пары чисел и , где , составляем по выборкам с номерами и статистику
Манна – Уитни:

   (17.6)

Определим статистику Джонкхиера как

     (17.7)

Свидетельством в пользу альтернативы упорядоченности эффектов (против гипотезы однородности) служат большие значения статистики , полученные в эксперименте.

Статистика – табулирована для малых выборок с небольшим значением . Для больших выборок в отношении действует нормальная аппроксимация:

,  где и соответственно равны:

     (17.8)

 (17.9)

Свидетельством против гипотезы однородности служат большие (сравнительно с процентными точками нормального распределения) значения статистики .

Замечание  В результате проверки рангового критерия (критериев) можно однозначно (статистически) решить, если верна гипотеза , то влияние фактора не значимо и на этом однофакторный анализ закончен. Если же верна альтернативная гипотеза влияние фактора значительное, то хотелось бы продолжить однофакторный анализ и перейти от качественной оценки к количественной.


 

А также другие работы, которые могут Вас заинтересовать

191. Общие понятия и аксиомы кинетики. Простейшие действия с силами и системами сил 793.3 KB
  Аналитическое создание вектора силы тока. Движение материальной точки по параболе. Условия движения плоскопараллельного тела, его поступательное, равномерное и прямолинейное движение.
192. Финансовое планирование в коммерческой организации 436.5 KB
  Цели, задачи, принципы и этапы финансового планирования. Классификация финансовых планов. Особенности бюджетирования: сущность, функции, виды. Миссия и сущность стратегии финансового планирования организации.
193. Реализация игры жизнь 276 KB
  Установка начальных значений ячеек сетки, анализ поведения различных комбинаций клеток на доске в математический игре Жизнь. Хранение значений клеток методом использования двумерного массива и заполнение его соответственными комбинациями.
194. Автоматизированные системы управления технологическими процессами 257.5 KB
  Изучение функционирования программы Electronics Workbench для приобретения навыков по исследованию электрических схем с помощью виртуальных электроизмерительных приборов. Снятие нагрузочных характеристик с помощью амперметра и вольтметра.
195. Расчет устойчивости естественных откосов 187 KB
  Метод круглоцилиндрической поверхности скольжения. Метод горизонтальных сил и расчет устойчивости склона. Определённые возможности появления и степени распространения активных (движущихся) оползней при инженерно–геологических условиях и действующих нагрузках.
196. Контроль качества и определение свойств материалов 777 KB
  Кратковременное механическое растяжение, типичные графические зависимости напряжения от деформации. Методы определения теплопроводности, температуропроводности и теплоемкости. Методы определения электрических свойств.
197. Определение договорной цены и расчет эффективности строительства 620.5 KB
  Расчет сметной стоимости строящегося здания по заданному аналогу. Сводная ведомость стоимости работ выполненных по объекту. Определение сметной стоимости на благоустройство территории (дороги и тротуары).
198. Створення сайту 422.52 KB
  Парні теги, позначають початок і кінець дії команди. Тег, що закриває область дії, має косу риску. Головні параметри тега body, основний текст, до якого застосовуються теги форматування. Написання заголовку сторінки.
199. Разработка конструкции транзисторного радиопередатчика, размещенного в кабине планера 9.15 MB
  Передающий тракт систем радиосвязи, расчет режимов транзистора мощного усилителя. Расчет режима мощного усилителя СВЧ и некоторое значение тока возбуждения. Расчет режима транзистора по схеме ОЭ без учета индуктивности выводов.