10980

Факторный анализ. Задача однофакторного анализа

Лекция

Математика и математический анализ

Факторный анализ Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи т.е. проверки существенности различия выборочных средних совокупностей . Например требуется оцен

Русский

2013-04-03

89.48 KB

18 чел.

Факторный анализ

Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи, т.е. проверки существенности различия выборочных средних совокупностей . Например, требуется оценить влияние различных режимов плавок на механические свойства металла, свойств сырья на показатели качества продукции, количества вносимых удобрений на урожайность и т.п.

Для эффективного решения таких задач нужен новый подход, который реализуется в рамках теории ранговых критериев и в дисперсионном анализе.

Ранговые критерии (непараметрические критерии) – предназначены, в первую очередь, для задач проверки согласия и сравнения двух  и более выборок.

Ранговые критерии применяются не только при отсутствии информации о виде распределения, но и тогда, когда наблюдения могут быть только упорядочены, как это часто бывает с социологии, медицине и т.п.

Дисперсионный анализэто статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Первоначально (1918 г.) дисперсионный анализ был разработан английским математиком – статистиком Р.А. Фишером. По числу факторов, влияние которых исследуется, различают однофакторный и многофакторный анализ.

Задача однофакторного анализа

При исследовании зависимостей одной из наиболее простых является ситуация, когда можно указать только один фактор, влияющий на конечный результат, и этот фактор может принимать лишь конечное число значений (уровней). Такие задачи, называемые задачами однофакторного анализа, весьма часто встречаются на практике. Типичный пример задач однофакторного анализа – сравнение по достигаемым результатам нескольких различных способов действия, направленных на достижение одной цели, скажем, нескольких школьных учебников или нескольких лекарств.

Терминология

Фактором (факторами) называют то, что, как мы считаем, должно оказывать влияние на конечный результат. В приведенных выше примерах факторами являются понятия "школьный учебник" или "лекарство".

Уровень фактора или способ обработкиэто конкретная реализация фактора (например, определённый школьный учебник, или выбранное лекарство).

Откликом часто называют значения измеряемого признака (т.е. величину результата).

Для сравнения влияния фактора (факторов) на результат необходим определённый статистический материал. Обычно его получают следующим образом: каждый из способов обработки применяют несколько раз (не обязательно одно и то же число раз) к исследуемому объекту и регистрируют отклик (результат). Итогом подобных испытаний являются выборок, вообще говоря, разных объемов. В зависимости от количества влияющих факторов (в нашем случае один фактор), говорят, что данные сведены в таблицу, с одним, двумя и т. д. входами.

Таблица 1  

Уровни фактора

1

2

3

...

Отклики (результаты измерений)

...

...

Здесь объёмы выборок при соответствующем уровне фактора, общее число наблюдений.

Прежде, чем судить о количественном влиянии фактора на измеряемый признак, полезно вначале решить, а есть ли такое влияние вообще. Нельзя ли объяснить расхождение наблюденных значений в опыте для различных уровней факторов действием чистой случайности? Ведь присущая исследуемому явлению внутренняя изменчивость уже привела к тому, что результаты оказываются различными даже при неизменном значении фактора (т.е. в табл. 1 значения в одном столбце различны). Может той же причиной (изменчивость, случайность) можно объяснить и различие между столбцами?

Выдвинем статистическое предположение – все данные принадлежат одному и тому же распределению. Это предположение называется нулевой гипотезой . Если она считается справедливой, то анализ закончен. В противном случае возникает задача оценки величины эффектов обработки и выяснения качества полученных оценок.

РАНГОВЫЙ ОДНОФАКТОРНЫЙ АНАЛИЗ

Если ничего не известно о распределении неизвестных, то использовать для проверки гипотезы количественные наблюдения становится затруднительно. В этих случаях проще основывать свои выводы на отношениях "больше – меньше" между наблюдениями, т.к. они не зависят от вида распределения. Теперь вся информация, включенная в табл. 1, содержится в тех рангах, что, получают числа при  упорядочении всей совокупности (направление упорядочивания minmax, или maxmin – не существенно).

Тогда таблица 1 преобразуется в таблицу 2:

Таблица 2  

Обработки (Уровни фактора)

1

2

3

...

Ранги результатов измерений

...

...

Критерий Краскела – Уоллиса

Заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Затем для каждой обработки (фактора) вычисляем:

и    (17.1)

это средний ранг по столбцу. Если по столбцам нет систематических различий, средние ранги не должны значительно отличатся от среднего ранга, рассчитанного по всей совокупности . Ясно, что последний равен . Поэтому величины при в совокупности должны быть небольшими. В качестве оценки меры отступления от чистой случайности и для учета различия в числе наблюдений для разных обработок предложена статистика Краскела – Уоллеса:

 (17.2)

Статистика имеет распределение с степенями свободы.

Замечание: Если в измерениях много совпадающих значений, то используется модифицированная статистика

Здесь число групп, совпадающих наблюдений,  число совпадающих наблюдений в группе с номером

Критерий Кронкхиера
(альтернативы с упорядочиванием)

Нередко известно, что имеющиеся группы результатов упорядочены по возрастанию (убыванию) влияния фактора. Пусть для определённости, первый столбец соответствует min фактору (см. табл. 2), а последний – max. В таких случаях можно использовать статистику Джонкхиера, более чувствительную (более мощную) против альтернатив об упорядоченном влиянии фактора. Разумеется, против других альтернатив свойства этого критерия могут оказаться хуже свойств критерия Краскела – Уоллиса.

Статистика Джонкхиера

Для простоты сначала рассмотрим статистику этого критерия в случае, когда сравниваются только 2 способа обработки (два уровня фактора). Тогда в нашей таблице (см. выше) будет всего два столбца. Фактически здесь идет речь о проверке однородности двух выборок. Вспомним, что для решения этой задачи используется статистика Манна – Уитни. А именно, пусть имеются две выборки: и  .

Положим:

   (17.4)

Статистика Манна – Уитни это:

    (17.5)

Теперь, в случае, когда сравниваются способов обработки (уровней), поступим следующим образом. Для каждой пары чисел и , где , составляем по выборкам с номерами и статистику
Манна – Уитни:

   (17.6)

Определим статистику Джонкхиера как

     (17.7)

Свидетельством в пользу альтернативы упорядоченности эффектов (против гипотезы однородности) служат большие значения статистики , полученные в эксперименте.

Статистика – табулирована для малых выборок с небольшим значением . Для больших выборок в отношении действует нормальная аппроксимация:

,  где и соответственно равны:

     (17.8)

 (17.9)

Свидетельством против гипотезы однородности служат большие (сравнительно с процентными точками нормального распределения) значения статистики .

Замечание  В результате проверки рангового критерия (критериев) можно однозначно (статистически) решить, если верна гипотеза , то влияние фактора не значимо и на этом однофакторный анализ закончен. Если же верна альтернативная гипотеза влияние фактора значительное, то хотелось бы продолжить однофакторный анализ и перейти от качественной оценки к количественной.


 

А также другие работы, которые могут Вас заинтересовать

3867. Запуск Excel. Основные понятия 830.33 KB
  Запуск Excel. Основные понятия Запустить электронную таблицу Excel можно из главного меню, пункт Программы. При частом обращении к этой программе удобно поместить ее ярлык на рабочий стол, и пользоваться им для запуска Excel. Кроме того, двойное щел...
3868. Моделирование решения уравнений в среде электронных таблиц MS Excel 74.9 KB
  Моделирование решения уравнений в среде электронных таблиц MS Excel Основная задача нашего сегодняшнего урока - это научиться решать уравнения различными методами, а также моделировать процесс решения определенного вида уравнений в зависимости от зн...
3869. Формулы в Microsoft Excel 407.37 KB
  Формулы в Microsoft Excel Общие сведения Excel - программируемый табличный калькулятор. Все расчеты в Excel выполняют формулы. Формулой Excel считает все, что начинается со знака "=". Если в ячейке написать просто "1+1", Excel не будет вычислять это...
3870. Формат представления данных в ячейках 182.39 KB
  Формат представления данных в ячейках По умолчанию после создания документа все ячейки находятся в формате "Общий". Этот формат имеет ряд хитростей: числа выравниваются по правому краю, а текст — по левому если, изменяя ширину столбца, сделать...
3871. Введение в Microsoft Excel 173.34 KB
  Введение в Microsoft Excel Microsoft Excel — одна из программ пакета Microsoft Office, представляющая из себя программируемый табличный калькулятор. Область применения Microsoft Excel Область применения Excel широка: благодаря тому, что л...
3872. Управління ризиками 57.5 KB
  Управління ризиками Основні поняття Управління ризиками розглядається на адміністративному рівні ІБ, оскільки тільки керівництво організації здатне виділити необхідні ресурси, ініціювати і контролювати виконання відповідних програм. Взагалі кажучи, ...
3873. Транспортная задача 199.04 KB
  Транспортная задача Транспортная задача — задача о поиске оптимального распределения поставок однородного товара от поставщиков к потребителям при известных затратах на перевозку (тарифах) между пунктами отправления и назначения. Является задач...
3874. Чисельний метод розв’язання задач стаціонарної теплопровідності 202.5 KB
  Чисельний метод розв’язання задач стаціонарної теплопровідності Умова задачі Використовуючи чисельний метод, визначити розподіл температури в поперечному перерізі довгого стального стержня при кроці розрахункової сітки ...