1126

Корреляционный и регрессионный анализ

Лабораторная работа

Математика и математический анализ

Корреляционный анализ. Множественный коэффициент корреляции. Классификатор на основе ядерных оценок. Регрессионный анализ. Коэффициент ошибок (на обучающей выборке). Применение QDA.

Русский

2013-01-06

955 KB

16 чел.

Нижегородский Государственный Технический Университет

Им. Р.Е. Алексеева

Кафедра «Электроника и сети ЭВМ»

Лабораторная работа №4

«Корреляционный и регрессионный анализ»

 

 Выполнил: Гаврилин А.С.

 Студент группы: 06-СБК

 Проверил:  

Нижний Новгород

2011


1. Цель работы

Изучить принципы корреляционного и регрессионного методов.

2. Задание и результаты выполнения задания

При объеме выборке  сформируем матрицу, состоящую из 5 столбцов:

], где NV=2 (номер варианта)

Получим:

Для исходных данных рассчитаем выборочные характеристики: средние арифметические , средние квадратические отклонения .

Корреляционный анализ

Коэффициент корреляции величин и  определяется выражением

.

Коэффициент корреляции характеризует тесноту и вид линейной стохастической зависимости между двумя переменными. Если коэффициент корреляции положителен, то связь прямая. Если коэффициент корреляции отрицателен, то связь обратная. Для некоррелированных величин коэффициент корреляции равен нулю.

Линейную статистическую связь между-м и -м признаками характеризует парный коэффициент корреляции. Множество значений  образуют корреляционную матрицу.

Проанализировав корреляционную матрицу, получим, что признак с номером 1 практически не связан с результатом 4, а признаки 0 и 2 связаны между собой. В результате оставим только два признака – 0 и 2.

          

Линейную статистическую связь между-м и -м признаками (при исключении влияния остальных признаков) характеризует частный коэффициент корреляции

Линейную статистическую связь между-м признаком и линейной комбинацией остальных признаков характеризует множественный коэффициент корреляции

Регрессионный анализ

Регрессионный анализ совокупность методов исследования зависимости среднего значения одной случайной величины от другой или нескольких других величин.

Признак - результат  - 4

Признаки - факторы  - 1 и 2

Уравнение регрессии описывает корреляционную зависимость между  и .

Оценки коэффициентов уравнения (параметров линейной регрессии) определяются по методу наименьших квадратов в соответствии с выражениями

,

Вектор регрессоров (базисных функций)

Оценки параметров

Уравнение регрессии

График зависимости (y=f(x1,x2)) и обучающая выборка:

Расчет значений признака – результата («предсказания»)

Вектор регрессионных остатков («невязок»)

Среднее значение

Среднее линейное отклонение

Среднеквадратическое отклонение

Коэффициент детерминации

Построим график корреляционного поля и линию регрессии  (график «наблюдения-предсказания»):

Гистограмма (оценка плотности вероятности) регрессионных остатков (число интервалов 6)

Синтез классификатора

Пороговое значение для деления признака–результата на две группы.

Визуализация обучающей выборки

Применение LDA

Оценка апостериорной вероятности P(c=1 / x1, x2)

Порог

Решающие области

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Применение QDA

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Классификатор на основе ядерных оценок

Параметр сглаживания

Априорные вероятности

Порог

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Вывод:  Сравнивая полученные коэффициенты ошибок всех используемых методов (LDA и QDA – 0,06; непараметрический метод – 0,1) мы сделали вывод о том, что для заданной выборки лучшим является LDA и QDA методы.



 

А также другие работы, которые могут Вас заинтересовать

35038. Программное обеспечение Solid Edge 67 KB
  Solid Edge — среднеуровневая трехмерная твердотельная CAD-система, предназначенная для проектирования моделей деталей, создания сборок с сохранением ассоциативных связей и выпуска чертежной документации на базе созданных моделей. Интегрирована с системой высокого уровня Unigraphics и системой управления проектом iMAN
35039. Проектирование распределительной сети собственных нужд на основе компьютерной модели с использованием программы ElectriCA 91 KB
  Проектирование низковольтной распределительной сети собственных нужд ТЭС связано со значительными трудозатратами что объясняется с одной стороны большой размерностью задачи а с другой большим количеством разноплановых расчетов. По существующей технологии проектирования сети собственных нужд ТЭС весь комплекс проектных работ разбивается на следующие этапы: Анализ состава потребителей электрической энергии и их ориентировочное распределение по возможным источникам питания. Расчеты отклонений напряжения выполняются для наиболее критичных...
35040. Адміністративна відповідальність. Притягнення до адміністративної відповідальності 493.5 KB
  В посібнику розкриваються поняття, правові та фактичні підстави адміністративної відповідальності, види та загальні правила накладення адміністративних стягнень, розглядаються питання підвідомчості справ про адміністративні правопорушення, провадження у справах про них: порядок порушення та розгляду справи, оскарження постанови і перегляду справи, а також виконання постанов про накладення адміністративних стягнень
35041. Использование PlanTracer и RasterDesk при проектировании структурированных кабельных сетей 219.5 KB
  Идеален случай когда при строительстве или реконструкции организациягенпроектировщик создает в CDприложениях поэтажные планы с детальной прорисовкой элементов здания и всех видов коммуникаций вентиляции и кондиционирования. Вариант первый: сканирование позволяющее использовать полученное растровое изображение в качестве подложки рис. К тому же при низком качестве исходного материала синька часто используемые планы этот способ применять нельзя рис. Второй вариант перерисовка.
35042. Project Studiocs Электрика 3.0 254.5 KB
  15 Введение Разработка компании Consistent Softwre САПР Project Studiocs Электрика хорошо знакома специалистам. До августа 2004 года основное внимание разработчиков было направлено на развитие существующих тогда самостоятельных модулей пакета Project Studiocs Электрика: Project Studiocs Освещение создание проектов внутреннего электрического освещения и Project Studiocs Сила создание силовой части проектов электроснабжения зданий и сооружений. В декабре 2004 года компания Consistent Softwre объявила о выходе новой версии САПР Project...
35043. CAD/CAM системы среднего уровня на примере систем Cimatron, MasterCam, Solid Edge 585.5 KB
  Реферат по САПР на тему: CD CM системы среднего уровня на примере систем Cimtron MsterCm Solid Edge.5 MsterCm. На рынке программных продуктов широко используются два типа твердотельного геометрического ядра: Prsolid CIS К наиболее известным CD CM системам среднего уровня построенным на основе ядра CIS относятся: DEM Cimtron MsterCm utoCD 2000 Powermill CDdy Brvo К наиболее известным CD CM системам среднего уровня построенным на основе ядра Prsolid относятся: ...
35044. Программное обеспечение Consistent Software ElectriCS 3D 83 KB
  Реферат на тему: Программное обеспечение Consistent Softwre ElectriCS 3D Студент: Петров И.3 Назначение ElectriCS 3D.4 Предмет автоматизации ElectriCS 3D.4 Достоинства ElectriCS 3D.
35045. Изотопы в природе 156 KB
  Основная заслуга в открытии стабильных изотопов принадлежит английскому физику Ф. он установил что инертный газ неон атомный вес 202 является смесью двух изотопов с атомными весами 20 и 22. Ученый проводил исследования на протяжении полутора десятилетий и обнаружил 210 стабильных изотопов большинства элементов. Химические элементы как правило представляют собой смесь изотопов т.