10976

Проверка качества уравнения регрессии

Лекция

Математика и математический анализ

Проверка качества уравнения регрессии Оценим насколько хорошо модель линейной регрессии описывает данную систему наблюдений. В качестве этой оценки воспользуемся коэффициентом детерминации. Составим следующие суммы квадратов отклонений: фактических значений от...

Русский

2013-04-03

80.42 KB

44 чел.

Проверка качества уравнения регрессии

Оценим, насколько хорошо модель линейной регрессии описывает данную систему наблюдений. В качестве этой оценки воспользуемся коэффициентом детерминации.

Составим следующие суммы квадратов отклонений:

фактических значений от их среднего арифметического;

выравненных значений от их среднего арифметического фактических значений;

фактических от выравненных значений.

Можно показать, что справедливо равенство:

.      (13.1)

Действительно,

А последнее слагаемое представим:

(.

Учитывая (11.8) получим, что первая сумма равна нулю, а вторую сумму представим:

.

Коэффициент детерминации – это отношение объясненной  части вариации ко всей вариации в целом:

   (13.2)

Т.о. чем "ближе" этот коэффициент к 1, тем лучше модель описывает эмпирические данные, разумеется, если при этом модель методически правильна.

Проверка значимости (качества) уравнения регрессии производится на основе дисперсионного анализа.

Дисперсионный анализ – самостоятельный инструмент (метод) математической статистики будет подробно рассмотрен в дальнейшем. Пока же кратко рассмотрим схему дисперсионного анализа, представленную в виде таблицы.

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия

Регрессия

Остаточная

Общая

Уравнение регрессии значимо на уровне , если фактически наблюдаемое значение статистики удовлетворяет соотношению

Здесь  критическое значение критерия Фишера – Снедекора при  и  степенях свободы; число оцениваемых параметров уравнения регрессии; число наблюдений.

В случае линейной парной регрессии  и уравнение регрессии значимо на уровне , если

Оценка остатков

Остатками называются разности наблюдаемых величин и подогнанных или прогнозируемых с помощью модели.

При анализе остатков следует учитывать ряд существенных факторов:

  1.  Если модель подобрана правильно, то остатки будут вести себя достаточно хаотично, в известном смысле они будут напоминать белый шум.
  2.  В остатках не будет систематической составляющей, резких выбросов, в чередовании их знаков не будет никаких закономерностей, остатки будут независимы друг от друга.

Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые одинаково распределенные случайные величины. Независимость остатков проверяется с помощью критерия Дарбина – Уотсона. Исследование остатков полезно начинать с изучения их графика. Он может показать наличие какой-либо зависимости, не учтенной в модели.

Поведение остатков  должно имитировать поведение ошибок . Иначе говоря, поскольку предполагается, что ошибки  — независимые в совокупности случайные величины, имеющие стандартное нормальное распределение , то ожидаем, что поведение последовательности остатков должно имитировать поведение последовательности независимых в совокупности случайных величин c распределением .

Исходя из этих предположений, проанализируем представленный реальный график (рис.1).

Рис. 1. Сравнение стандартизованных остатков с N (0,1)

Гистограмма остатков "почти" симметрична относительно нуля, т.е. количество отрицательных значений равно количеству положительных. Как и в нормальном распределении, количество малых остатков (разностей между наблюденными результатами и данными модели) велико, а большие остатки малы.

Рассмотрим еще одно графическое представление остатков (см. рис.2). Из графика остатков на нормальной вероятностной бумаге видно, что они достаточно хорошо ложатся на прямую, которая соответствует стандартному нормальному распределению.

Исходя из построенных графических результатов, можно сделать вывод о том, что предположение о нормальности распределения ошибок – достаточно корректно.

Рис. 2. График остатков на нормальной вероятностной бумаге

Критерий Дарбина – Уотсона (Durbin - Watson)

Оценивая качество уравнения регрессии, мы предполагаем, что реальная взаимосвязь переменных линейна. Отклонения от регрессионной прямой являются случайными, независимыми друг от друга величинами с нулевым математическим ожиданием и постоянной дисперсией. Если эти предположения не выполняются, то оценки коэффициентов регрессии не обладают свойствами несмещенности, эффективности и состоятельности. В этом случае анализ значимости полученных оценок будет неточным.

Статистика Дарбина—Уотсона используется для проверки гипотезы о том, что остатки построенной регрессионной модели некоррелированны (корреляции равны нулю), против альтернативы: остатки связаны авторегрессионной зависимостью (первого порядка) вида:

На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина—Уотсона, рассчитываемую по формуле

Действительно,

Здесь сделано допущение, что при больших значениях  выполняется соотношение

Тогда

Нетрудно заметить, что если , то  и . Если  то  и . Во всех других случаях .

Критические точки статистики Дарбина—Уотсона табулированы для различных . При проверке гипотезы об отсутствии автокорреляции остатков используется числовой отрезок, на котором отложены  нижняя граница статистики и верхняя граница:

Рис. 3. Статистика Дарбина—Уотсона

Проверка гипотезы проводится по схеме:

  1.  Если , то гипотеза  отклоняется, принимается  значительная положительная автокорреляция остатков;
  2.  Если , , то гипотеза  отклоняется, принимается  значительная отрицательная автокорреляция остатков;
  3.  Если , то гипотеза  об отсутствии автокорреляции остатков принимается;
  4.  Если , или , то гипотеза об отсутствии автокорреляции не может быть ни принята, ни отклонена.

Не обращаясь к таблице критических точек Дарбина—Уотсона можно воспользоваться "грубым" правилом и считать, что автокорреляция остатков отсутствует, если . Для более надежных выводов необходимо воспользоваться статистическими таблицами.


 

А также другие работы, которые могут Вас заинтересовать

1501. Анализ различий ролевых ожиданий у юношей и девушек готовящихся к вступлению в брак 109.97 KB
  Научное содержание понятия готовности молодых людей к вступлению в брак. Наличие у молодых людей, готовящихся к вступлению в брак, эмпатийного комплекса и альтруистических качеств личности. Эмпирическое исследование ролевых ожиданий молодых девушек вступающих в брак. Сравнительный анализ ролевых ожиданий между различными структурами семейной жизни у молодых людей, готовящихся к вступлению в брак.
1502. Что такое вера. Критерии истинности веры 116.61 KB
  Критерии истинности. Необходимость веры для спасения. Критерий хорошести. Ищущим Истинного Бога Бог готовит воздаяние. Вера должна быть связана с доступностью Бога. Вера должна исходить только от Бога. Искажение истины. Нет таких людей, которые не могут узнать Бога. Духовная причина неверия в Истинного Бога. Что нужно делать, чтобы спастись? Какого главного дела требует от нас Бог? Свойства веры и знания.
1503. Скрытие и фальсификация научной информации угроза современной цивилизации 114.5 KB
  Засекречивание - неизбежное зло для науки, однако оно носит временный характер и компенсируется вложением в науку дополнительных средств. При создании СТО Эйнштейн руководствовался работами голландского физика Г.Лоренца и французского математика А.Пуанкаре. Если бы современные физики познакомились с классическими теориями эфира, их такой вывод не удивил.
1504. Визначити класичним методом реакцію кола 97.58 KB
  Визначити класичним методом реакцію кола на підключення джерела живлення. Побудувати графік функції, провести аналіз, визначити тривалість перехідного процесу.
1505. Проектирование оптимальной организационной структуры в условиях глобальной конкуренции 97 KB
  Глобальные факторы конкуренции. Организационный дизайн для оптимизации преимуществ компании во внутренней конкуренции на внутреннем национальном рынке. Преимущества и недостатки СУРГ. Преимущества и недостатки ДСС. Организационный дизайн для оптимизации участия компании в международной конкуренции.
1506. Анализ ЗАО Городское освещение 102 KB
  Технология производства с общей схемой технологического процесса. Характеристика окружающей среды проектируемого объекта. Организация эксплуатация электрооборудования объекта. Планирование ТО и Р оборудования. Виды диагностирования электрооборудования.
1507. Особенности микропроцессорной техники 115.57 KB
  Основные направления в развитии микропроцессорной техники. Системы счисления. Цифровые электронные устройства. Технологии изготовления цифровых интегральных микросхем. Регистры микропроцессора. Аккумулятор, РОН, счетчик команд. Микропроцессорные средства и системы. Понятие дополнительного кода числа.
1508. Специальные налоговые режимы 103.5 KB
  Упрощенная система налогообложения (гл. 26.2 НК РФ). Система налогообложения в виде единого налога на вмененный доход для отдельных видов деятельности. Единый сельскохозяйственный налог для сельскохозяйственных товаропроизводителей. Соглашение о разделе продукции.
1509. Валютный рынок России 107.5 KB
  Формирование российского валютного рынка. Валютное регулирование. Регулирование валютного курса рубля и динамика его изменения. Перспективы развития российского рынка и стабилизации курса рубля.