10980

Факторный анализ. Задача однофакторного анализа

Лекция

Математика и математический анализ

Факторный анализ Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи т.е. проверки существенности различия выборочных средних совокупностей . Например требуется оцен

Русский

2013-04-03

89.48 KB

18 чел.

Факторный анализ

Ранее была рассмотрена проверка значимости различия выборочных средних двух совокупностей. На практике часто возникает необходимость обобщения задачи, т.е. проверки существенности различия выборочных средних совокупностей . Например, требуется оценить влияние различных режимов плавок на механические свойства металла, свойств сырья на показатели качества продукции, количества вносимых удобрений на урожайность и т.п.

Для эффективного решения таких задач нужен новый подход, который реализуется в рамках теории ранговых критериев и в дисперсионном анализе.

Ранговые критерии (непараметрические критерии) – предназначены, в первую очередь, для задач проверки согласия и сравнения двух  и более выборок.

Ранговые критерии применяются не только при отсутствии информации о виде распределения, но и тогда, когда наблюдения могут быть только упорядочены, как это часто бывает с социологии, медицине и т.п.

Дисперсионный анализэто статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Первоначально (1918 г.) дисперсионный анализ был разработан английским математиком – статистиком Р.А. Фишером. По числу факторов, влияние которых исследуется, различают однофакторный и многофакторный анализ.

Задача однофакторного анализа

При исследовании зависимостей одной из наиболее простых является ситуация, когда можно указать только один фактор, влияющий на конечный результат, и этот фактор может принимать лишь конечное число значений (уровней). Такие задачи, называемые задачами однофакторного анализа, весьма часто встречаются на практике. Типичный пример задач однофакторного анализа – сравнение по достигаемым результатам нескольких различных способов действия, направленных на достижение одной цели, скажем, нескольких школьных учебников или нескольких лекарств.

Терминология

Фактором (факторами) называют то, что, как мы считаем, должно оказывать влияние на конечный результат. В приведенных выше примерах факторами являются понятия "школьный учебник" или "лекарство".

Уровень фактора или способ обработкиэто конкретная реализация фактора (например, определённый школьный учебник, или выбранное лекарство).

Откликом часто называют значения измеряемого признака (т.е. величину результата).

Для сравнения влияния фактора (факторов) на результат необходим определённый статистический материал. Обычно его получают следующим образом: каждый из способов обработки применяют несколько раз (не обязательно одно и то же число раз) к исследуемому объекту и регистрируют отклик (результат). Итогом подобных испытаний являются выборок, вообще говоря, разных объемов. В зависимости от количества влияющих факторов (в нашем случае один фактор), говорят, что данные сведены в таблицу, с одним, двумя и т. д. входами.

Таблица 1  

Уровни фактора

1

2

3

...

Отклики (результаты измерений)

...

...

Здесь объёмы выборок при соответствующем уровне фактора, общее число наблюдений.

Прежде, чем судить о количественном влиянии фактора на измеряемый признак, полезно вначале решить, а есть ли такое влияние вообще. Нельзя ли объяснить расхождение наблюденных значений в опыте для различных уровней факторов действием чистой случайности? Ведь присущая исследуемому явлению внутренняя изменчивость уже привела к тому, что результаты оказываются различными даже при неизменном значении фактора (т.е. в табл. 1 значения в одном столбце различны). Может той же причиной (изменчивость, случайность) можно объяснить и различие между столбцами?

Выдвинем статистическое предположение – все данные принадлежат одному и тому же распределению. Это предположение называется нулевой гипотезой . Если она считается справедливой, то анализ закончен. В противном случае возникает задача оценки величины эффектов обработки и выяснения качества полученных оценок.

РАНГОВЫЙ ОДНОФАКТОРНЫЙ АНАЛИЗ

Если ничего не известно о распределении неизвестных, то использовать для проверки гипотезы количественные наблюдения становится затруднительно. В этих случаях проще основывать свои выводы на отношениях "больше – меньше" между наблюдениями, т.к. они не зависят от вида распределения. Теперь вся информация, включенная в табл. 1, содержится в тех рангах, что, получают числа при  упорядочении всей совокупности (направление упорядочивания minmax, или maxmin – не существенно).

Тогда таблица 1 преобразуется в таблицу 2:

Таблица 2  

Обработки (Уровни фактора)

1

2

3

...

Ранги результатов измерений

...

...

Критерий Краскела – Уоллиса

Заменим все наблюдения их рангами , упорядочивая всю совокупность в порядке возрастания. Затем для каждой обработки (фактора) вычисляем:

и    (17.1)

это средний ранг по столбцу. Если по столбцам нет систематических различий, средние ранги не должны значительно отличатся от среднего ранга, рассчитанного по всей совокупности . Ясно, что последний равен . Поэтому величины при в совокупности должны быть небольшими. В качестве оценки меры отступления от чистой случайности и для учета различия в числе наблюдений для разных обработок предложена статистика Краскела – Уоллеса:

 (17.2)

Статистика имеет распределение с степенями свободы.

Замечание: Если в измерениях много совпадающих значений, то используется модифицированная статистика

Здесь число групп, совпадающих наблюдений,  число совпадающих наблюдений в группе с номером

Критерий Кронкхиера
(альтернативы с упорядочиванием)

Нередко известно, что имеющиеся группы результатов упорядочены по возрастанию (убыванию) влияния фактора. Пусть для определённости, первый столбец соответствует min фактору (см. табл. 2), а последний – max. В таких случаях можно использовать статистику Джонкхиера, более чувствительную (более мощную) против альтернатив об упорядоченном влиянии фактора. Разумеется, против других альтернатив свойства этого критерия могут оказаться хуже свойств критерия Краскела – Уоллиса.

Статистика Джонкхиера

Для простоты сначала рассмотрим статистику этого критерия в случае, когда сравниваются только 2 способа обработки (два уровня фактора). Тогда в нашей таблице (см. выше) будет всего два столбца. Фактически здесь идет речь о проверке однородности двух выборок. Вспомним, что для решения этой задачи используется статистика Манна – Уитни. А именно, пусть имеются две выборки: и  .

Положим:

   (17.4)

Статистика Манна – Уитни это:

    (17.5)

Теперь, в случае, когда сравниваются способов обработки (уровней), поступим следующим образом. Для каждой пары чисел и , где , составляем по выборкам с номерами и статистику
Манна – Уитни:

   (17.6)

Определим статистику Джонкхиера как

     (17.7)

Свидетельством в пользу альтернативы упорядоченности эффектов (против гипотезы однородности) служат большие значения статистики , полученные в эксперименте.

Статистика – табулирована для малых выборок с небольшим значением . Для больших выборок в отношении действует нормальная аппроксимация:

,  где и соответственно равны:

     (17.8)

 (17.9)

Свидетельством против гипотезы однородности служат большие (сравнительно с процентными точками нормального распределения) значения статистики .

Замечание  В результате проверки рангового критерия (критериев) можно однозначно (статистически) решить, если верна гипотеза , то влияние фактора не значимо и на этом однофакторный анализ закончен. Если же верна альтернативная гипотеза влияние фактора значительное, то хотелось бы продолжить однофакторный анализ и перейти от качественной оценки к количественной.


 

А также другие работы, которые могут Вас заинтересовать

30143. Мицеллярные эффекты в кинетикереакций взаимодействия малахитового зеленого, кристаллического фиолетового та бриллиантового зеленого с гидроксид ионом 771 KB
  Установлено, что не все используемые в опытах ПАВ влияют на скорость реакции обесцвечивания ФФ в щелочном растворе и все используемые в опытах ПАВ влияют на скорость реакции обесцвечивания КФ в щелочном растворе. Мицеллы ТХ-100 и смешанные мицеллы ТХ-100 с ДСН, ТХ-100 с Brij-35 не влияют на скорость реакции обесцвечивания ФФ в щелочном растворе
30144. ТЕОРИЯ УЧЕТА ОПЕРАЦИЙ ПО РАСЧЕТНОМУ СЧЕТУ 138.08 KB
  Директор общества распоряжается средствами общества на основе законодательства Российской Федерации и в порядке установленном контрактом трудовым договором. Чтобы выжить в условиях рыночной экономики и не допустить банкротства предприятия нужно хорошо знать как управлять финансами какой должна быть структура капитала по составу и источникам образования какую должны занимать собственные средства а какую заемные. Сведения которые находятся в пассиве баланса позволяют определить какие изменения произошли в структуре собственного...
30145. Развитие выносливости у детей старшего дошкольного возраста посредством подвижных игр 65.08 KB
  Теоретические основы развития выносливости у детей старшего дошкольного возраста по средствам подвижных игр. Проблема развития выносливости в исследованиях педагогов и психологов. Виды выносливости. Факторы влияющие на проявление выносливости.
30147. Введение изучается значение станций технического обслуживания необходимость их планирования приводится. 2.31 MB
  Она будет представлена деревьями и кустарниками как лиственных пород так и хвойных пород. Еще в течение года специалисты ООО РесурсАудит выезжают на АЗС чтобы удостовериться что работа станции соответствует нормативам. Эти устройства могут принести немалую пользу автомобилистам.час; численность рабочих 84 чел; число постов 70 ; количество автомобиле мест ожидания и хранения 51; площадь территории 1929 м2; Генеральный план СТО и технологическая планировка участка представлены в графической части на листах формата А1...
30148. АУ «ТЕХНОПАРК – МОРДОВИЯ»: КОНЦЕПЦИЯ, ИНТЕГРАЦИЯ ИДЕЙ И РАЗРАБОТОК, ИХ КОММЕРЦИАЛИЗАЦИЯ. АНАЛИЗ ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ 204.23 KB
  Приоритетные цели реализации проекта развития ТехнопаркаМордовия: развитие инфраструктуры в интересах реализации инновационного потенциала Республики Мордовия создание условий для работы и ускоренного взаимодействия высокотехнологичных компаний научных организаций высших учебных заведений инвесторов заказчиков. ускорение коммерциализации рыночно ориентированных проектов активное продвижение продуктов компаний технопарка помощь в поиске партнеров и в выходе на рынок стимулирование...
30149. Анализ предприятия ДОАО “Механизированная колонна-№88” 704.8 KB
  Предприятие включает в себя автомобильную колонну 88 автомобилей и 27 прицепа ремонтномеханические мастерские зону ТО и ТР автозаправочный пункт вспомогательные службы и органы управления. Состояние дорог в городской и пригородной зоне Архангельска неудовлетворительное что негативно сказывается на состояние автомобилей .1 представлен генеральный план ДОАО €œМеханизированная колонна№88€ 1 контора 2 зона ТО и Р 3 мойка 4 стоянка автомобилей 5 ремонтные мастерские 6 теплый бокс 7 эстакада 8 ОТК 9 ...
30150. Расчёт количества ТО и текущих ремонтов для парка машин и тракторов 64.19 KB
  Установив число ремонтов и ТО по каждой группе машин одной марки рассчитываем их годовую трудоёмкость по формуле: чел.16 где Тто суммарная трудоёмкость ТО и устранение неисправностей чел. Ттр...
30151. Описание технологического процесса приготовления салата фирменного «Пикантный», стейка из свинины 227.67 KB
  Правильно организованный, подготовленный и проведённый на научной основе технологический процесс приготовления блюд и кулинарных изделий позволит полностью исключить присутствие в готовых блюдах вредных веществ и соединений, сохранить в них полезные для человека вещества.