1126

Корреляционный и регрессионный анализ

Лабораторная работа

Математика и математический анализ

Корреляционный анализ. Множественный коэффициент корреляции. Классификатор на основе ядерных оценок. Регрессионный анализ. Коэффициент ошибок (на обучающей выборке). Применение QDA.

Русский

2013-01-06

955 KB

16 чел.

Нижегородский Государственный Технический Университет

Им. Р.Е. Алексеева

Кафедра «Электроника и сети ЭВМ»

Лабораторная работа №4

«Корреляционный и регрессионный анализ»

 

 Выполнил: Гаврилин А.С.

 Студент группы: 06-СБК

 Проверил:  

Нижний Новгород

2011


1. Цель работы

Изучить принципы корреляционного и регрессионного методов.

2. Задание и результаты выполнения задания

При объеме выборке  сформируем матрицу, состоящую из 5 столбцов:

], где NV=2 (номер варианта)

Получим:

Для исходных данных рассчитаем выборочные характеристики: средние арифметические , средние квадратические отклонения .

Корреляционный анализ

Коэффициент корреляции величин и  определяется выражением

.

Коэффициент корреляции характеризует тесноту и вид линейной стохастической зависимости между двумя переменными. Если коэффициент корреляции положителен, то связь прямая. Если коэффициент корреляции отрицателен, то связь обратная. Для некоррелированных величин коэффициент корреляции равен нулю.

Линейную статистическую связь между-м и -м признаками характеризует парный коэффициент корреляции. Множество значений  образуют корреляционную матрицу.

Проанализировав корреляционную матрицу, получим, что признак с номером 1 практически не связан с результатом 4, а признаки 0 и 2 связаны между собой. В результате оставим только два признака – 0 и 2.

          

Линейную статистическую связь между-м и -м признаками (при исключении влияния остальных признаков) характеризует частный коэффициент корреляции

Линейную статистическую связь между-м признаком и линейной комбинацией остальных признаков характеризует множественный коэффициент корреляции

Регрессионный анализ

Регрессионный анализ совокупность методов исследования зависимости среднего значения одной случайной величины от другой или нескольких других величин.

Признак - результат  - 4

Признаки - факторы  - 1 и 2

Уравнение регрессии описывает корреляционную зависимость между  и .

Оценки коэффициентов уравнения (параметров линейной регрессии) определяются по методу наименьших квадратов в соответствии с выражениями

,

Вектор регрессоров (базисных функций)

Оценки параметров

Уравнение регрессии

График зависимости (y=f(x1,x2)) и обучающая выборка:

Расчет значений признака – результата («предсказания»)

Вектор регрессионных остатков («невязок»)

Среднее значение

Среднее линейное отклонение

Среднеквадратическое отклонение

Коэффициент детерминации

Построим график корреляционного поля и линию регрессии  (график «наблюдения-предсказания»):

Гистограмма (оценка плотности вероятности) регрессионных остатков (число интервалов 6)

Синтез классификатора

Пороговое значение для деления признака–результата на две группы.

Визуализация обучающей выборки

Применение LDA

Оценка апостериорной вероятности P(c=1 / x1, x2)

Порог

Решающие области

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Применение QDA

Классификация обучающей выборки

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Классификатор на основе ядерных оценок

Параметр сглаживания

Априорные вероятности

Порог

Решения

Количество ошибок

Коэффициент ошибок (на обучающей выборке)

График P(c=1 / x1, x2) и обучающая выборка

Граница между решающими областями

Вывод:  Сравнивая полученные коэффициенты ошибок всех используемых методов (LDA и QDA – 0,06; непараметрический метод – 0,1) мы сделали вывод о том, что для заданной выборки лучшим является LDA и QDA методы.



 

А также другие работы, которые могут Вас заинтересовать

30716. Развитие социально-политического кризиса в Европе в начале 1920-х гг 22 KB
  : сильный рост промышленного правительства в США Франции в результате 1 мировой войны они обогатились. Основой промышленного подъема был технический прогресс новые технологии новые отрасли автомобили Увеличение концентрации и централизации капитала усиления мощи корпораций смена промышленности и банков – рост финансового капитала. Рост благотворительности для поддержания социальной стабильности.
30717. ФРГ: переход к новой «восточной политике». Договор с СССР от 12 августа 1970 г 27 KB
  Брандт – с 1969 канцлер ФРГ лидер социалдемократов. Подтверждалось что Западный Берлин не является частью территории ФРГ и устанавливался тройной механизм взаимоотношений между компетентными органами ГДР Западного Берлина и ФРГ по вопросам регулирования транзитных перемещений граждан транспортного телефонного и телеграфного сообщения и пр. Но Западный Берлин имел международные соглашения заключенные ФРГ поэтому ФРГ получила право представлять интересы жителей Западного Берлина в международных организациях по вопросам не...
30718. Причины, особенности и основные последствия мирового экономического кризиса 1929 – 1933 гг 23 KB
  Мировой экономический кризис 19291933 годов носивший название Великой депрессии наиболее сильно затронул такие страны как Великобритания США Франция Канада и Германия. Важным фактором обусловившим всемирный характер великой депрессии стал процесс перемещения экономического центра из Западной Европы в США. Последствиями Великой депрессии стали: ухудшение уровня жизни фермеров и мелких торговцев; уменьшение уровня производства; рост числа безработных; возрастание сторонников фашистских организаций.
30719. Исторический опыт Народных фронтов (Франция, Испания, Чили) 23.5 KB
  Народный фронт представляет собой политический союз который как правило объединяет левые и центральные силы для осуществления противодействия правым силам представителей власти. Основной целью возникновения народных фронтов стала борьба за защиту экономических интересов рабочего класса и противопоставление войне и фашизму. Самый первый народный фронт был образован во Франции в 1935 году который объединил в себе все левосторонние партии.
30720. Общее и особенное в политике британских консерваторов и лейбористов в 1920-е гг 23 KB
  Консервативная партия Великобритании – одна из двух ведущих политических партий страны образовавшаяся в 1867 году на базе партии тори. К 1930му году в Великобритании стала ясной гибель радикального социализма тогда на первый план выдвинулся либерализм который настаивал на прямом вмешательстве государства в экономику и передаче государству целого ряда социальных функций. Внутреннюю политику консерваторов Великобритании 1920 1930х годов можно охарактеризовать как стремление сохранить существующую ранее универсальность и...
30721. Основные этапы первой мировой войны. Факторы поражения германо-австрийского блока 27.5 KB
  В июле 1914 г Германия и Австровенгрия начинают первую мировую войну. Германия хотела сначала вывести из строя Францию чтобы прекратить борьбу на два фронта: Западном и Восточном. 1 этап – вторжение в Бельгию где Германия потерпела поражение: в Восточной Пруссии – Германия воевала с русскими армиями; в Галиции и Польше – где победы достались русским. Германия и АвстроВенгрия были экономически истощены под влиянием революций в России среди военных германии и Австрии усилилась антивоенная агитация народ устал от...
30722. «Новый курс» Результата и его историческое значение 24.5 KB
  Его основная цель состояла в оздоровлении экономики и восстановления доверия граждан к государству. Политика Рузвельта получила название Новый курс который он восстановил государственное регулирование экономики и социальных отношений. Законом об оздоровлении национальной экономики вся промышленность была разделена на 17 групп по отраслям и регулировалась нормативными актами кодексами чести определявшими объем выпуска товаров уровня заработной платы распределение рынков сбыта продолжительность рабочего времени и др....
30723. Эволюция и крах бюрократических режимов в стране ЦЮВЕ 26.5 KB
  было сформировано коалиционное правительство в ГДР. Чехословакия и ГДР несколько условно могут быть отнесены к государствам с довольно высоким уровнем развития Польша Венгрия Хорватия и Словения – страны среднего развития а Болгария Румыния четыре другие республики бывшей Югославии Сербия Черногория Македония Босния и Герцеговина Албания – низкого. По решению парламентов ГДР и ФРГ с 1 июля 1990 г. ГДР прекратила свое существование вместо нее появились пять новых федеральных земель ФРГ.
30724. Изоляционизм США термин использовавшийся с середины 19 в. 25 KB
  Изоляционизм США термин использовавшийся с середины 19 в. для обозначения направления во внешней политике США в основе которого лежит идея невмешательства в европейские дела и вообще в вооруженные конфликты вне американского континента. складывались под влиянием ряда факторов: географическая обособленность Американского континента создание в США ёмкого внутреннего рынка способствовавшего тому что значительная часть буржуазии мало интересовалась заокеанской экспансией расширение за счет др.