1126

Корреляционный и регрессионный анализ

Лабораторная работа

Математика и математический анализ

Корреляционный анализ. Множественный коэффициент корреляции. Классификатор на основе ядерных оценок. Регрессионный анализ. Коэффициент ошибок (на обучающей выборке). Применение QDA.

Русский

2013-01-06

955 KB

16 чел.

Нижегородский Государственный Технический Университет

Им. Р.Е. Алексеева

Кафедра «Электроника и сети ЭВМ»

Лабораторная работа №4

«Корреляционный и регрессионный анализ»

 

 Выполнил: Гаврилин А.С.

 Студент группы: 06-СБК

 Проверил:  

Нижний Новгород

2011


1. Цель работы

Изучить принципы корреляционного и регрессионного методов.

2. Задание и результаты выполнения задания

При объеме выборке  сформируем матрицу, состоящую из 5 столбцов:

], где NV=2 (номер варианта)

Получим:

Для исходных данных рассчитаем выборочные характеристики: средние арифметические , средние квадратические отклонения .

Корреляционный анализ

Коэффициент корреляции величин и  определяется выражением

.

Коэффициент корреляции характеризует тесноту и вид линейной стохастической зависимости между двумя переменными. Если коэффициент корреляции положителен, то связь прямая. Если коэффициент корреляции отрицателен, то связь обратная. Для некоррелированных величин коэффициент корреляции равен нулю.

Линейную статистическую связь между-м и -м признаками характеризует парный коэффициент корреляции. Множество значений  образуют корреляционную матрицу.

Проанализировав корреляционную матрицу, получим, что признак с номером 1 практически не связан с результатом 4, а признаки 0 и 2 связаны между собой. В результате оставим только два признака – 0 и 2.

          

Линейную статистическую связь между-м и -м признаками (при исключении влияния остальных признаков) характеризует частный коэффициент корреляции

Линейную статистическую связь между-м признаком и линейной комбинацией остальных признаков характеризует множественный коэффициент корреляции

Регрессионный анализ

Регрессионный анализ совокупность методов исследования зависимости среднего значения одной случайной величины от другой или нескольких других величин.

Признак - результат  - 4

Признаки - факторы  - 1 и 2

Уравнение регрессии описывает корреляционную зависимость между  и .

Оценки коэффициентов уравнения (параметров линейной регрессии) определяются по методу наименьших квадратов в соответствии с выражениями

,

Вектор регрессоров (базисных функций)

Оценки параметров

Уравнение регрессии

График зависимости (y=f(x1,x2)) и обучающая выборка:

Расчет значений признака – результата («предсказания»)

Вектор регрессионных остатков («невязок»)

Среднее значение

Среднее линейное отклонение

Среднеквадратическое отклонение

Коэффициент детерминации

Построим график корреляционного поля и линию регрессии  (график «наблюдения-предсказания»):

Гистограмма (оценка плотности вероятности) регрессионных остатков (число интервалов 6)

Синтез классификатора

Пороговое значение для деления признака–результата на две группы.

Визуализация обучающей выборки

Применение LDA

Оценка апостериорной вероятности P(c=1 / x1, x2)

Порог

Решающие области

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Применение QDA

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Классификатор на основе ядерных оценок

Параметр сглаживания

Априорные вероятности

Порог

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Вывод:  Сравнивая полученные коэффициенты ошибок всех используемых методов (LDA и QDA – 0,06; непараметрический метод – 0,1) мы сделали вывод о том, что для заданной выборки лучшим является LDA и QDA методы.



 

А также другие работы, которые могут Вас заинтересовать

22296. КЛАССИФИКАЦИЯ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДИК 125 KB
  К формализованным методикам относятся тесты опросники методики проективной техники и психофизиологические методики. Методики высокого уровня формализации Как уже говорилось выше они включают в себя четыре главных класса методик: тесты которые в свою очередь делятся на несколько подклассов опросники методики проективной техники и психофизиологические методики. Однако по своей психологической сущности тесты и например опросники очень несходны между собой. Тесты Тесты в переводе с английского испытание проверка проба ...
22297. ТРЕБОВАНИЯ К ПОСТРОЕНИЮ И ПРОВЕРКЕ МЕТОДИК 135.5 KB
  Обычно авторы методики в руководстве приводят точные и подробные указания по процедуре ее проведения. Формулирование таких указаний составляет основную часть стандартизации новой методики т. Другим наиболее важным этапом в стандартизации методики является выбор критерия по которому следует проводить сравнение результатов диагностических испытаний поскольку диагностические методики не имеют заранее определенных стандартов успешности или неудачи в их выполнении. В общих чертах стандартизация диагностической методики ориентированной на...
22298. Организация санитарно-противоэпидемических мероприятий в чрезвычайных ситуациях 181 KB
  Ознакомить студентов с организационной структурой и задачами санитарно-эпидемиологической службы, основами организации и порядком проведения противоэпидемических мероприятий в чрезвычайных ситуациях мирного и военного времени
22299. ОРГАНИЗАЦИЯ ОКАЗАНИЯ КВАЛИФИЦИРОВАННОЙ И СПЕЦИАЛИЗИРОВАННОЙ МЕДИЦИНСКОЙ ПОМОЩИ НАСЕЛЕНИЮ В ВОЕННОЕ ВРЕМЯ 160.5 KB
  Изучить организацию лечебно-эвакуационного обеспечения населения в очагах массовых санитарных потерь при применении противником ОМП. Рассмотреть организацию оказания квалифицированной и специализированной медицинской помощи пострадавшим. Изучить организацию работы второго этапа медицинской эвакуации
22300. Медицинское снабжение формирований и учреждений, предназначенных для медико-санитарного обеспечения населения в ЧС 240 KB
  Изучить организацию медицинского снабжения формирований и учреждений СМК, ГОЗ в мирное время и в режиме работы в ЧС. Рассмотреть вопросы классификации медицинского имущества, его нормирования и защиты от воздействия поражающих факторов ЧС.
22301. Работа с элементами списка 1.26 MB
  Затем новый элемент списка заполняется информацией: NOV^ := DAT;. Для поиска места подключения нового элемента надо просмотреть все элементы списка от его начала до элемента имеющего NZ = KEY или до конца списка. Продвижение вдоль списка от его начала к его концу осуществляется с помощью двух указателей: CUR и PR.
22302. ОРГАНИЗАЦИЯ САНИТАРНО-ГИГИЕНИЧЕСКИХ И ПРОТИВОЭПИДЕМИЧЕСКИХ МЕРОПРИЯТИЙ СРЕДИ НАСЕЛЕНИЯ В ВОЕННОЕ ВРЕМЯ 238 KB
  Изучить организацию проведения санитарно-гигиенических и противоэпидемических мероприятий в очагах боевых действий и ЧС мирного времени, методику оценки санитарно-эпидемиологического состояния территории. Методику расчета возможных санитарных потерь. Изучить организацию проведения санитарной экспертизы продовольствия и воды.
22303. Медицинская служба Вооруженных Сил Российской Федерации в чрезвычайных ситуациях мирного времени 196 KB
  Ознакомить с задачами военной медицины в Единой государственной системе предупреждения и ликвидации последствий чрезвычайных ситуаций в мирное время. Изучить задачи, предназначение, организационную структуру и порядок использования медицинских формирований Министерства обороны РФ при ликвидации последствий чрезвычайных ситуаций мирного времени.