1126

Корреляционный и регрессионный анализ

Лабораторная работа

Математика и математический анализ

Корреляционный анализ. Множественный коэффициент корреляции. Классификатор на основе ядерных оценок. Регрессионный анализ. Коэффициент ошибок (на обучающей выборке). Применение QDA.

Русский

2013-01-06

955 KB

16 чел.

Нижегородский Государственный Технический Университет

Им. Р.Е. Алексеева

Кафедра «Электроника и сети ЭВМ»

Лабораторная работа №4

«Корреляционный и регрессионный анализ»

 

 Выполнил: Гаврилин А.С.

 Студент группы: 06-СБК

 Проверил:  

Нижний Новгород

2011


1. Цель работы

Изучить принципы корреляционного и регрессионного методов.

2. Задание и результаты выполнения задания

При объеме выборке  сформируем матрицу, состоящую из 5 столбцов:

], где NV=2 (номер варианта)

Получим:

Для исходных данных рассчитаем выборочные характеристики: средние арифметические , средние квадратические отклонения .

Корреляционный анализ

Коэффициент корреляции величин и  определяется выражением

.

Коэффициент корреляции характеризует тесноту и вид линейной стохастической зависимости между двумя переменными. Если коэффициент корреляции положителен, то связь прямая. Если коэффициент корреляции отрицателен, то связь обратная. Для некоррелированных величин коэффициент корреляции равен нулю.

Линейную статистическую связь между-м и -м признаками характеризует парный коэффициент корреляции. Множество значений  образуют корреляционную матрицу.

Проанализировав корреляционную матрицу, получим, что признак с номером 1 практически не связан с результатом 4, а признаки 0 и 2 связаны между собой. В результате оставим только два признака – 0 и 2.

          

Линейную статистическую связь между-м и -м признаками (при исключении влияния остальных признаков) характеризует частный коэффициент корреляции

Линейную статистическую связь между-м признаком и линейной комбинацией остальных признаков характеризует множественный коэффициент корреляции

Регрессионный анализ

Регрессионный анализ совокупность методов исследования зависимости среднего значения одной случайной величины от другой или нескольких других величин.

Признак - результат  - 4

Признаки - факторы  - 1 и 2

Уравнение регрессии описывает корреляционную зависимость между  и .

Оценки коэффициентов уравнения (параметров линейной регрессии) определяются по методу наименьших квадратов в соответствии с выражениями

,

Вектор регрессоров (базисных функций)

Оценки параметров

Уравнение регрессии

График зависимости (y=f(x1,x2)) и обучающая выборка:

Расчет значений признака – результата («предсказания»)

Вектор регрессионных остатков («невязок»)

Среднее значение

Среднее линейное отклонение

Среднеквадратическое отклонение

Коэффициент детерминации

Построим график корреляционного поля и линию регрессии  (график «наблюдения-предсказания»):

Гистограмма (оценка плотности вероятности) регрессионных остатков (число интервалов 6)

Синтез классификатора

Пороговое значение для деления признака–результата на две группы.

Визуализация обучающей выборки

Применение LDA

Оценка апостериорной вероятности P(c=1 / x1, x2)

Порог

Решающие области

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Применение QDA

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Классификатор на основе ядерных оценок

Параметр сглаживания

Априорные вероятности

Порог

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Вывод:  Сравнивая полученные коэффициенты ошибок всех используемых методов (LDA и QDA – 0,06; непараметрический метод – 0,1) мы сделали вывод о том, что для заданной выборки лучшим является LDA и QDA методы.



 

А также другие работы, которые могут Вас заинтересовать

65390. РЕГУЛЮВАННЯ ЕКОЛОГІЧНИХ НАСЛІДКІВ ДІЯЛЬНОСТІ ПРОМИСЛОВОГО ПІДПРИЄМСТВА 235 KB
  Регулювання екологічних аспектів діяльності підприємства Показники екологічності як результат управління екологічними аспектами діяльності підприємства Показники екологічності системи адміністра тивного управління підприємства...
65391. Розробка оптимальних за тепловими втратами систем керування позиційним електроприводом 8.88 MB
  Для позиційних електроприводів розроблені закони керування оптимальні за швидкодією або за тепловими втратами. Застосування систем регулювання положення СРП оптимальних за тепловими втратами дозволяє знизити непродуктивні витрати електроенергії...
65392. ВПЛИВ ДОВГОТРИВАЛОГО ЗАСТОСУВАННЯ РІЗНИХ СИСТЕМ УДОБРЕННЯ НА ГУМУСОВИЙ СТАН ТА АГРОХІМІЧНІ ПОКАЗНИКИ ДЕРНОВО-ПІДЗОЛИСТОГО ГРУНТУ ЗАХІДНОГО ПОЛІССЯ УКРАЇНИ 1.03 MB
  Мета роботи встановити закономірності змін гумусового стану і агрохімічних показників дерновопідзолистого поверхнево оглеєного супіщаного ґрунту за довготривалого застосування вапна гною і мінеральних добрив та оптимізувати систему удобрення...
65393. УДОСКОНАЛЕННЯ ТЕХНОЛОГІЇ ВИРОБНИЦТВА КОНСЕРВОВАНОГО ЗЕЛЕНОГО ГОРОШКУ 970.5 KB
  В процесі технологічної переробки свіжого зеленого горошку мають місце значні втрати розчинних речовин цукрів амінокислот вітамінів які складають біля 30 від їх вмісту у свіжому зерні. Проведені низкою авторів дослідження показали що на переробку...
65394. ВДОСКОНАЛЕННЯ ВИКОРИСТАННЯ ЗЕМЕЛЬ СІЛЬСЬКОГОСПОДАРСЬКОГО ПРИЗНАЧЕННЯ В АГРАРНОМУ СЕКТОРІ ЗАКАРПАТСЬКОЇ ОБЛАСТІ 192.5 KB
  Створення сприятливого інноваційного клімату і привабливості регіону Підвищення ефективності сільськогосподарського виробництва Збереження і охорона земель Сталий розвиток субєктів господарювання...
65395. ТЕОРЕТИЧНІ І МЕТОДИЧНІ ОСНОВИ ВИКОРИСТАННЯ ОБРАЗОТВОРЧОЇ ПРАВОСЛАВНОЇ СПАДЩИНИ В ДУХОВНОМУ РОЗВИТКУ МАЙБУТНЬОГО ВЧИТЕЛЯ 397 KB
  Якість реалізації всіх компонентів навчального процесу їх змістовність характер професійного педагогічного спілкування визначаються рівнем духовного розвитку вчителя тому духовність стає його провідною професійною характеристикою яка посідає визначальне місце в структурі якостей педагога.
65396. АНАЛІЗ РЕЖИМІВ РОБОТИ ПЕРЕТВОРЮВАЧІВ ЕЛЕКТРИЧНОЇ ЕНЕРГІЇ МЕТОДОМ ФУНКЦІЙ ВІЛЬНОГО РЕЖИМУ 1.1 MB
  Наукова новизна одержаних результатів полягає у наступному: проаналізовано причини високої трудомісткості існуючих аналітичних та чисельних методів розрахунку та запропоновано шляхи її зменшення за рахунок вдосконалення способу описання процесів на інтервалах між комутаціями...
65397. ВИЗНАЧЕННЯ РАЦІОНАЛЬНИХ ПАРАМЕТРІВ ЛЕЗОВОЇ ОБРОБКИ СУБМІКРОКРИСТАЛІЧНИХ МЕТАЛІВ ДЛЯ ЗБЕРЕЖЕННЯ ПОЧАТКОВИХ ВЛАСТИВОСТЕЙ ЗАГОТОВОК 1.35 MB
  Дослідження особливостей оброблюваності металів із субмікро та нанокристалічною структурою; закономірностей розподілу температурних полів в оброблюваній заготовці; впливу початкового розміру зерна температурного і часового факторів на остаточний розмір зерна структури та визначення...
65398. Діяльності політичних партій та громадських організацій України по утвердженню її державного суверенітету 138 KB
  Внаслідок політики перебудови відбулися кардинальні зміни, що призвели до появи політичних партій та політизованих громадських організацій. Це засвідчувало: в Україні відбувається процес громадянської структуризації суспільства, що є запорукою розбудови України...