39078

Дисперсионный анализ

Лабораторная работа

Информатика, кибернетика и программирование

m и одинаковыми дисперсиями Рассмотрим соотношения общая или полная сумма квадратов отклонений межгрупповая факторная сумма квадратов отклонений внутригрупповая остаточная сумма квадратов отклонений В дисперсионном анализе используются усредненные квадраты отклонений В терминах NOV: эффект ошибка MS эффект MS ошибка. Описание процедуры Fctoril NOV Для запуска программы в верхнем меню Sttistics надо выбрать команду NOV. Появиться два списка: Typeofnlysis вид анализа Onewy NOV однофакторный...

Русский

2013-09-30

434 KB

6 чел.

В ДА исследуется зависимость количественного признака (зависимой переменной) от одного или  нескольких качественных признаков (факторов).

Данные представляются в таблице, строки и столбцы которой отображают различные уровни фактора, а в ячейках таблицы расположены значения анализируемого признака (зависимой переменной).  Таблица - план эксперимента

Предположим , что элементы строк таблицы  - реализация случайных величин  x1, x2, ... , xm, имеющих нормальный закон распределения с математическим ожиданием  a1, a2, ... , am  и одинаковыми дисперсиями  

Рассмотрим соотношения

- общая или полная сумма квадратов отклонений

- межгрупповая (факторная) сумма квадратов отклонений

- внутригрупповая (остаточная) сумма квадратов отклонений

В дисперсионном анализе используются усредненные квадраты отклонений  

В терминах ANOVA:   - эффект,  - ошибка,   - MS эффект,  - MS ошибка.

Проверка   сводиться к проверке существенных различий  и , которые являются оценками дисперсии .

отвергается,  если по критерию Фишера:

ДА более эффективен , чем t - критерий, при сравнении средних, и для малых выборок более информативен. Кроме того он позволяет определить взаимодействия между факторами и, следовательно, изучать более сложные модели.

Для двухфакторного анализа

Применение дисперсионного анализа целесообразно, если анализируемые признаки измерены минимум в интервальной шкале и имеют нормальное  распределение внутри сравниваемых групп, дисперсии в группах однородны.  Если эти условия не выполнены, можно воспользоваться

непараметрическими критериями сравнения средних или модулем «Общие  линейные модели» (GLM).

Ключевыми понятиями дисперсионного анализа являются главные  эффекты и сложные эффекты, которые позволяют обнаружить и исследовать  взаимодействия между факторами.

Описание процедуры Factorial ANOVA

Для запуска программы в верхнем меню Statistics надо выбрать команду ANOVA.

Появиться два  списка:

  1.  Typeofanalysis (вид анализа)
    1.  One-way ANOVA (однофакторный дисперсионный анализ);
    2.  Maineffects ANOVA (дисперсионный анализ главных эффектов);
    3.  Factorial ANOVA (многофакторный дисперсионный анализ);
    4.  Repeatmeasures ANOVA (дисперсионный анализ повторных измерений).
  2.  Specificationmethod позволяет задать три типа интерфейса  
    1.  QuickSpecsDialog (диалог быстрых спецификаций);
    2.   AnalysisWizard (мастер анализа);
    3.  Analysissyntaxeditor (редактор кода).

Пример, который рассматриваем (в многофакторном анализе): количество крабов, в зависимости от цветов (COLOR), состояния клешней (SPINE) размеров (CATWIDTH, WIDTH) и веса (WEIGHT). Если число спутников больше 0, то переменная y в первом столбце принимает значение 1, в противном случае 0.

Выбираем Factorial ANOVA и Quick Specs Dialog на вкладке Quick нажмите Variable. В появившемся окне выбираете группирующие переменные COLOR и SPINE, зависимые WIDTH, CATWIDTH. Можно задать коды факторов Factor Codes.

Кодами предиктора COLOR являются цвета крабов: серый, светло-серый, темный,  темно-серый. Кодами предиктора SPINE являются состояния клешней крабов: обе клешни целые, одна клешня повреждена, обе клешни повреждены.

Щелкните по кнопке ОК, откроется диалоговое окно  ANOVA Results 1 (результаты анализа).

На вкладке Means можно указать различные способы вычисления средних: невзвешенные средние, взвешенные средние, оценки МНК (средние наименьшие квадраты).

На вкладке Quick нажмите кнопку All effects/Graphs . Откроется  Table of All Effects (таблицы всех эффектов), которая содержит результаты и используется для просмотра выбранных из данной таблицы  эффектов в виде графиков средних или таблиц. Значимые эффекты (р<0,05) помечены *. В нашем примере

Можно изменить значимость критерия, введя необходимое значение параметра α в поле Significance level (уровень значимости) вкладки Quick окна ANOVA Results 1.

Выделите  Spreadsheet (таблица) в рамке Display  на вкладке Table of All Effects и два раза  щелкнуть по эффекту SPINE. Появится  таблица со значениями средних всех зависимых переменных и другими статистиками в группах

Если выделить опцию Graph, нажмите ОК, выберете переменную, например, WIDTH. Программа построит средних этой переменной.

Можно посмотреть взаимодействие факторов, например, WIDTH и COLOR. Переменные выбираются так: Graf в рамке Display, OK, Dependent vars for the... укажите переменную WIDTH, ОК, появится Arrangement of Factors, в котором  указывается  порядок выбора факторов. Выбираем  COLOR и SPINE , ОК. Появится нужный график. Из этих графиков можно заметить, что независимо от цвета средняя ширина крабов с одной поврежденной клешней меньше, чем средняя ширина крабов с двумя целыми клешнями. Приведенные результаты показывают, что существуют различия между средними в группах,  соответствующих различным межгрупповым факторам. Чтобы выяснить значимы ли эти  различия, нужно использовать апостериорные сравнения для проверки разности средних.

В диалоге ANOVA Results 1 нажмите кнопку More results и в открывшемся окне выберите вкладку Post-hoc. Выберите зависимую переменную WIDTH, эффект SPINE и нажмите кнопку Fisher LSD. Откроется таблица

Если  в диалоге ANOVA Results 1  выбрать эффект COLOR*SPINE, то будет открыта таблица другого вида. Для проверки предположений, лежащих в основе метода дисперсионного  анализа, необходимо воспользоваться вкладкой Assumptions (предположения) в окне ANOVA Results 1.

Здесь представлены различные критерии проверки однородности дисперсии и графические средства проверки соответствия закона распределения нормальному закону.

Выберите эффект SPINE,  нажмите  Histograms. В  окне выберите переменную WIDTH,  укажите группу, если нужно проанализировать распределение внутри каждой группы, или All(все),  то будет построена гистограмма  для всех групп. Нажмите кнопку Levens test (ANOVA), появится таблица с результатами проверки гипотезы об  однородности дисперсий для зависимых переменных WIDTH и WEGHT.

Еще одним условием применимости дисперсионного  анализа является отсутствие корреляции между средними и стандартными  отклонениями. На вкладке Assumptions нажмите кнопку Plot means vs.stdLdeviattons. По диаграмме рассеяния нужно определить, отсутствует ли корреляция. В нашем случае это справедливо, т.е. результаты ДА достоверны.

Дисперсионный анализ с повторными измерениями

В Type of analysis выделите Repeat measures ANOVA. В Specification method выберите Quick Specs Dialog. Нажмите OK.

На вкладке Quick нажмите кнопку Variables. Выберите группирующие переменные COLOR и SPINE, зависимые WIDTH, CATWIDTH. Если нажать на кнопку ОК, то появятся результаты многомерного дисперсионного анализа без учета повторных измерений, т.е. переменные WIDTH, CATWIDTH будут рассмотрены как две зависимые переменные. Но мы их рассматриваем как двухуровневый фактор повторных измерений. Чтобы было все правильно понято, надо нажать кнопку Within effects (внутригрупповые эффекты). Откроется окно  Specify within-subjects factor (задайте фактор повторных измерений (только один)). Если нужен ДА с большим числом факторов, то пользуемся модулем GLM.


 

А также другие работы, которые могут Вас заинтересовать

35173. Разработка ПП АИС «Компьютерные игры» 934.5 KB
  Программный продукт АИС БД «Компьютерные игры» разрабатывается с целью систематизации и обобщения сведений о играх, компаний разработчиков, локализаторов. Программа предназначена для просмотров последних вышедших новых игр.
35174. Концепция применения CALS (ИПИ) - технологий в промышленности Нижегородской области 151.5 KB
  производственные информационные системы CALSтехнологии CALS Continuous Acquisition and Life cycle Support непрерывное развитие и поддержка жизненного цикла русский аналог ИПИ Информационная Поддержка жизненного цикла Изделий обеспечивающие информационную поддержку жизненного цикла изделий конструирование технологическое проектирование производство эксплуатацию утилизацию. В последнее время начали развиваться КИС и CALSтехнологии. Наибольшую отдачу дают информационные технологии и самое главное корпоративный...
35175. Разработка информационной системы организации, занимающейся продажей и установкой входных и межкомнатных дверей 924 KB
  Опыт применения ЭВМ для построения прикладных систем обработки данных показывает, что самым эффективным инструментом здесь являются не универсальные алгоритмические языки высокого уровня, а специализированные языки для создания систем управления данными.
35176. Необходимость внедрения информационной системы для небольшого частного предприятия «Computer Master» 3.01 MB
  В случае покупки товара из имеющихся в наличии при расчете кассир вводит номер чека. В результате проведения проблемного анализа выявлены следующие проблемы: Необоснованные затраты времени кассира на ввод номера чека и номера или номера товара. Затраты времени на устранения ошибок ввода номера товара в случае неправильного ввода. EUICashier Граничный класс отвечающий за отображение формы требования атрибутов покупки оборудования номер чека номер товара параметров и результатов поиска требований оплаты 3.
35177. Разработка информационной системы закупки комплектующих для производства 922 KB
  В данном разделе описывается сама организация и внешняя среда, с которой она взаимодействует. Основными знаниями, связывающими различные объекты предметной области в целое, являются бизнес-процессы, также представленные в данном разделе.
35178. АВТОМАТИЗИРОВАННЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ 6.02 MB
  Определение объекта системы. Отношения внутри диаграмм классов: обобщения ассоциации зависимости Структура АИС: Описание структуры информационной системы включающей в себя понятия: техническое обеспечение математическое обеспечение программное обеспечение информационное обеспечение организационное обеспечение правовое обеспечение. Глобальная сеть Internet как пример открытой информационной системы.
35179. Информация и информационные ресурсы 307.5 KB
  Информационные системы экономические информационные системы. По поддержке видов деятельности: система автоматизированного проектирования автоматизированные ИС автоматизированные системы управления технологическими процессами.Обеспечивающие подсистемы экономих информых систем ЭИС. Организацое обеспие внутреняя органия ИС обеспечая управлие всеми подсистемами ЭИС как единой системы.
35180. Сетевое администрирование на основе Microsoft Windows Server 2003 8.93 MB
  В рамках курса предполагается изучение базовых понятий сетевого администрирования и стека протоколов TCP IP рассмотрение эффективных решений задач управления пользователями и ресурсами сети освоение основных приемов и инструментов мониторинга компьютерной сети овладение базовыми средствами обеспечения безопасности сети. Цель задачи и объекты сетевого администрирования Решение данных задач осуществляется применительно к трем группам объектов: серверы компьютеры предоставляющие доступ к ресурсам сети и посредством которых системный...
35181. ОПЕРАЦИОННЫЕ СИСТЕМЫ И СРЕДЫ 2.18 MB
  Обычный урок В начале урока проверка Д З в виде контрольной работы или устного ответа и конспектов Вопросы для подготовки к экзамену по дисциплине Операционные системы Основные понятия и определения ОС. Ресурсы вычислительной системы их классификация. Управление оперативной памятью вычислительной системы.