1126

Корреляционный и регрессионный анализ

Лабораторная работа

Математика и математический анализ

Корреляционный анализ. Множественный коэффициент корреляции. Классификатор на основе ядерных оценок. Регрессионный анализ. Коэффициент ошибок (на обучающей выборке). Применение QDA.

Русский

2013-01-06

955 KB

16 чел.

Нижегородский Государственный Технический Университет

Им. Р.Е. Алексеева

Кафедра «Электроника и сети ЭВМ»

Лабораторная работа №4

«Корреляционный и регрессионный анализ»

 

 Выполнил: Гаврилин А.С.

 Студент группы: 06-СБК

 Проверил:  

Нижний Новгород

2011


1. Цель работы

Изучить принципы корреляционного и регрессионного методов.

2. Задание и результаты выполнения задания

При объеме выборке  сформируем матрицу, состоящую из 5 столбцов:

], где NV=2 (номер варианта)

Получим:

Для исходных данных рассчитаем выборочные характеристики: средние арифметические , средние квадратические отклонения .

Корреляционный анализ

Коэффициент корреляции величин и  определяется выражением

.

Коэффициент корреляции характеризует тесноту и вид линейной стохастической зависимости между двумя переменными. Если коэффициент корреляции положителен, то связь прямая. Если коэффициент корреляции отрицателен, то связь обратная. Для некоррелированных величин коэффициент корреляции равен нулю.

Линейную статистическую связь между-м и -м признаками характеризует парный коэффициент корреляции. Множество значений  образуют корреляционную матрицу.

Проанализировав корреляционную матрицу, получим, что признак с номером 1 практически не связан с результатом 4, а признаки 0 и 2 связаны между собой. В результате оставим только два признака – 0 и 2.

          

Линейную статистическую связь между-м и -м признаками (при исключении влияния остальных признаков) характеризует частный коэффициент корреляции

Линейную статистическую связь между-м признаком и линейной комбинацией остальных признаков характеризует множественный коэффициент корреляции

Регрессионный анализ

Регрессионный анализ совокупность методов исследования зависимости среднего значения одной случайной величины от другой или нескольких других величин.

Признак - результат  - 4

Признаки - факторы  - 1 и 2

Уравнение регрессии описывает корреляционную зависимость между  и .

Оценки коэффициентов уравнения (параметров линейной регрессии) определяются по методу наименьших квадратов в соответствии с выражениями

,

Вектор регрессоров (базисных функций)

Оценки параметров

Уравнение регрессии

График зависимости (y=f(x1,x2)) и обучающая выборка:

Расчет значений признака – результата («предсказания»)

Вектор регрессионных остатков («невязок»)

Среднее значение

Среднее линейное отклонение

Среднеквадратическое отклонение

Коэффициент детерминации

Построим график корреляционного поля и линию регрессии  (график «наблюдения-предсказания»):

Гистограмма (оценка плотности вероятности) регрессионных остатков (число интервалов 6)

Синтез классификатора

Пороговое значение для деления признака–результата на две группы.

Визуализация обучающей выборки

Применение LDA

Оценка апостериорной вероятности P(c=1 / x1, x2)

Порог

Решающие области

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Применение QDA

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Классификатор на основе ядерных оценок

Параметр сглаживания

Априорные вероятности

Порог

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Вывод:  Сравнивая полученные коэффициенты ошибок всех используемых методов (LDA и QDA – 0,06; непараметрический метод – 0,1) мы сделали вывод о том, что для заданной выборки лучшим является LDA и QDA методы.



 

А также другие работы, которые могут Вас заинтересовать

33931. Индивидуальные индексы 11.05 KB
  Индивидуальные индексы характеризуют изменения отдельных единиц элементов статистической совокупности.Для определения индекса надо произвести сопоставление не менее двух величин отражающих изменения индексируемого показателя признака. Например при изучении изменения физического объема продукции в качестве индексируемой величины выступают данные об объеме количестве продукции в натуральных измерениях; при изучении изменения цен индексируемой величиной является цена единицы товара и т.
33932. Агрегатные индексы 18.04 KB
  Агрегатные индексы Агрегатный индекс общий индекс полученный путем сопоставления итогов выражающих величину сложного явления в отчетном и базисном периодах при помощи соизмерителей. Веса среднего арифметического и среднего гармонического индексов должны определяться исходя из соблюдения условия этого тождества. При исчислении среднего арифметического индекса объема продукции должно выполняться следующее условие: iFf=q1p0q0p0 В векторной символике средний арифметический индекс объема будет иметь вид: Jq=ip0q0p0q0=HqP0Q0 где Нq вектор...
33933. Индексы Пааше, Ласпейреса, Фишера. Их практическое применение 36.76 KB
  Этот индекс был построен по среднеарифметической формуле без применения какойлибо системы взвешивания. В XIX веке при построении индексов цен в основном по агрегатной или соответствующей ей среднеарифметической формуле статистики начинают использовать систему взвешивания. Более широкое практическое применение находят две другие их формы: в формуле Ласпейреса средняя арифметическая форма в формуле Пааше средняя гармоническая которые отражены в табл. Она устанавливает изменение цен при предположении что количества товаров неизменны...
33934. Средние индексы 11.06 KB
  Средние экономические показатели статистические показатели определяемые как средние за несколько лет по ряду экономических объектов или по всей совокупности производителей и потребителей. Следует иметь в виду что средние объемы производства доходы и расходы населения средняя заработная плата определяются как средневзвешенные по всем производственным объектам лицам и семьям работникам потребителям.
33935. Понятие статистической связи, ее виды и формы 14.3 KB
  При функциональной связи определенному значению факторного признака соответствует определенное же значение результативного признака. При статистической связи каждому значению факторного признака Х соответствует множество значений результативного признака Y причем не известно заранее какое именно. Корреляционной является статистическая связь между признаками при которой изменение значений независимой переменной Х приводит к закономерному изменению математического ожидания случайной величины Y....
33936. Методы выявления корреляционной связи. Корреляционно-регрессионный анализ 12.84 KB
  Основные статистические методы выявления наличия корреляционной связи: Сопоставление параллельных рядов метод когда ряд значений факторного признака х построенный в порядке возрастания сопоставляют с рядом соответствующих значений результативного признака у и таким образом прослеживают их взаимосвязь. Графический метод позволяет выявить наличие связи между двумя признаками с помощью поля корреляции. Установив наличие связи между признаками переходят к корреляционнорегрессионному анализу.
33937. Парная регрессия на основе метода наименьших квадратов 19.28 KB
  Для определения параметров уравнения парной регрессии используем метод наименьших квадратов. При применении этого метода для нахождения функции которая бы наилучшим образом соответствовала эмпирическим данным считается что сумма квадратов отклонений эмпирических точек от теоретической линии регрессии должна быть величиной минимальной. Критерий метода наименьших квадратов: ...
33938. Собственно корреляционные параметрические методы изучения связи 15.5 KB
  соответствия эмпирическим данным рассчитывают теоретическое корреляционное отношение η теоретический коэффициент детерминации η индекс корреляции R а для линейной формы линейный коэффициент корреляции r и линейный коэффициент детерминации r. Линейный коэффициент корреляции К.Пирсона помимо силы связи показывает и ее направление; определяется по следующей формуле: 34 Линейный коэффициент корреляции принимает...
33939. Оценка значимости корреляционной связи 13.59 KB
  Факторная дисперсия определяется по формуле: 43 где k 1 число степеней свободы для Остаточную дисперсию используя правило сложения дисперсий можно определить по формуле: 44 где n k число степеней свобод для . Число степеней свободы для общей суммы квадратов отклонений будет равно: k 1 n k = n 1....