1126

Корреляционный и регрессионный анализ

Лабораторная работа

Математика и математический анализ

Корреляционный анализ. Множественный коэффициент корреляции. Классификатор на основе ядерных оценок. Регрессионный анализ. Коэффициент ошибок (на обучающей выборке). Применение QDA.

Русский

2013-01-06

955 KB

16 чел.

Нижегородский Государственный Технический Университет

Им. Р.Е. Алексеева

Кафедра «Электроника и сети ЭВМ»

Лабораторная работа №4

«Корреляционный и регрессионный анализ»

 

 Выполнил: Гаврилин А.С.

 Студент группы: 06-СБК

 Проверил:  

Нижний Новгород

2011


1. Цель работы

Изучить принципы корреляционного и регрессионного методов.

2. Задание и результаты выполнения задания

При объеме выборке  сформируем матрицу, состоящую из 5 столбцов:

], где NV=2 (номер варианта)

Получим:

Для исходных данных рассчитаем выборочные характеристики: средние арифметические , средние квадратические отклонения .

Корреляционный анализ

Коэффициент корреляции величин и  определяется выражением

.

Коэффициент корреляции характеризует тесноту и вид линейной стохастической зависимости между двумя переменными. Если коэффициент корреляции положителен, то связь прямая. Если коэффициент корреляции отрицателен, то связь обратная. Для некоррелированных величин коэффициент корреляции равен нулю.

Линейную статистическую связь между-м и -м признаками характеризует парный коэффициент корреляции. Множество значений  образуют корреляционную матрицу.

Проанализировав корреляционную матрицу, получим, что признак с номером 1 практически не связан с результатом 4, а признаки 0 и 2 связаны между собой. В результате оставим только два признака – 0 и 2.

          

Линейную статистическую связь между-м и -м признаками (при исключении влияния остальных признаков) характеризует частный коэффициент корреляции

Линейную статистическую связь между-м признаком и линейной комбинацией остальных признаков характеризует множественный коэффициент корреляции

Регрессионный анализ

Регрессионный анализ совокупность методов исследования зависимости среднего значения одной случайной величины от другой или нескольких других величин.

Признак - результат  - 4

Признаки - факторы  - 1 и 2

Уравнение регрессии описывает корреляционную зависимость между  и .

Оценки коэффициентов уравнения (параметров линейной регрессии) определяются по методу наименьших квадратов в соответствии с выражениями

,

Вектор регрессоров (базисных функций)

Оценки параметров

Уравнение регрессии

График зависимости (y=f(x1,x2)) и обучающая выборка:

Расчет значений признака – результата («предсказания»)

Вектор регрессионных остатков («невязок»)

Среднее значение

Среднее линейное отклонение

Среднеквадратическое отклонение

Коэффициент детерминации

Построим график корреляционного поля и линию регрессии  (график «наблюдения-предсказания»):

Гистограмма (оценка плотности вероятности) регрессионных остатков (число интервалов 6)

Синтез классификатора

Пороговое значение для деления признака–результата на две группы.

Визуализация обучающей выборки

Применение LDA

Оценка апостериорной вероятности P(c=1 / x1, x2)

Порог

Решающие области

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Применение QDA

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Классификатор на основе ядерных оценок

Параметр сглаживания

Априорные вероятности

Порог

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Вывод:  Сравнивая полученные коэффициенты ошибок всех используемых методов (LDA и QDA – 0,06; непараметрический метод – 0,1) мы сделали вывод о том, что для заданной выборки лучшим является LDA и QDA методы.



 

А также другие работы, которые могут Вас заинтересовать

8124. Поиск в пространстве состояний. Формальная постановка задачи. Обобщенный алгоритм поиска. Критерии оценки стратегий 116.01 KB
  Поиск в пространстве состояний.Формальная постановка задачи. Обобщенный алгоритм поиска. Критерии оценки стратегий. Многие задачи,в частности игры и головоломки,могут быть представлены как задачи поиска в пространств...
8125. Методы неинформированного поиска. Поиск в ширину, в глубину, однородной стоимости, ограниченный по глубине поиск 142.53 KB
  Методы не информированного поиска. Поиск в ширину,в глубину, однородной стоимости, ограниченный по глубине поиск. Основная проблема в области поиска - нахождение хорошей стратегии поиска для заданной задачи. Страт...
8126. Методы неинформированного поиска. Поиск с итеративным углублением, двунаправленный поиск. Поиск c удовлетворением ограничений. Cложность методов поиска 241.79 KB
  Методы не информированного поиска. Поиск с итеративным углублением, двунаправленный поиск. Поискc удовлетворением ограничений. Cложность методов поиска. Итеративно углубляющийся поиск. В ограниченном по глубине пои...
8127. Методы информированного поиска. Поиск сначала лучший. A*-поиск. 316.08 KB
  Методы информированного поиска. Поиск сначала лучший. A*-поиск. Методы не информированного (слепого) поиска в большинстве случаев неэффективны. Эффективность поиска может быть повышена за счет использования дополнительны...
8128. Альфа-бета отсечение 392 KB
  Альфа-бета отсечение (конспект) При минимаксном поиске количество состояний игры, которые должны быть исследованы в процессе поиска, экспоненциально зависит от количества ходов. Эту зависимость, к сожалению, невозможно устранить, но существует возмо...
8129. Архитектура доски объявлений (ДО) 238 KB
  Архитектура доски объявлений (ДО). (Конспект) Архитектура ДО. В первой половине 70-х годов по заказу Управления перспективных исследований США DARPA рядом американских университетов была выполнена пятилетняя исследовательская программа, направленная...
8130. Модели представления и обработки неопределенных знаний. Коэффициенты уверенности Шортлифа 71 KB
  Модели представления и обработки неопределенных знаний. Коэффициенты уверенности Шортлифа. (Конспект) Представление и обработка в ЭС неопределенных знаний Экспертным знаниям, как правило, присуща неопределенность. В инженерии знаний принято выделять...
8131. Нечеткие множества. Лингвистическая переменная. Нечеткая логика. Нечеткий вывод. Композиционное правило вывода 142.5 KB
  Нечеткие множества. Лингвистическая переменная. Нечеткая логика. Нечеткий вывод. Композиционное правило вывода. (Конспект) В основе понятия нечеткого множества (НИ) лежит представление о том, что обладающие общим свойством элементы некоторого множес...
8132. Байесовские сети 75.5 KB
  Байесовские сети (Конспект) Теорема Байеса: Пусть Ai - полная группа несовместных событий, тогда формула Байеса (формула перерасчета гипотез) и B некоторое событие положительной вероятности Доказательство следует из теоремы умножения и формулы...