10976

Проверка качества уравнения регрессии

Лекция

Математика и математический анализ

Проверка качества уравнения регрессии Оценим насколько хорошо модель линейной регрессии описывает данную систему наблюдений. В качестве этой оценки воспользуемся коэффициентом детерминации. Составим следующие суммы квадратов отклонений: фактических значений от...

Русский

2013-04-03

80.42 KB

44 чел.

Проверка качества уравнения регрессии

Оценим, насколько хорошо модель линейной регрессии описывает данную систему наблюдений. В качестве этой оценки воспользуемся коэффициентом детерминации.

Составим следующие суммы квадратов отклонений:

фактических значений от их среднего арифметического;

выравненных значений от их среднего арифметического фактических значений;

фактических от выравненных значений.

Можно показать, что справедливо равенство:

.      (13.1)

Действительно,

А последнее слагаемое представим:

(.

Учитывая (11.8) получим, что первая сумма равна нулю, а вторую сумму представим:

.

Коэффициент детерминации – это отношение объясненной  части вариации ко всей вариации в целом:

   (13.2)

Т.о. чем "ближе" этот коэффициент к 1, тем лучше модель описывает эмпирические данные, разумеется, если при этом модель методически правильна.

Проверка значимости (качества) уравнения регрессии производится на основе дисперсионного анализа.

Дисперсионный анализ – самостоятельный инструмент (метод) математической статистики будет подробно рассмотрен в дальнейшем. Пока же кратко рассмотрим схему дисперсионного анализа, представленную в виде таблицы.

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия

Регрессия

Остаточная

Общая

Уравнение регрессии значимо на уровне , если фактически наблюдаемое значение статистики удовлетворяет соотношению

Здесь  критическое значение критерия Фишера – Снедекора при  и  степенях свободы; число оцениваемых параметров уравнения регрессии; число наблюдений.

В случае линейной парной регрессии  и уравнение регрессии значимо на уровне , если

Оценка остатков

Остатками называются разности наблюдаемых величин и подогнанных или прогнозируемых с помощью модели.

При анализе остатков следует учитывать ряд существенных факторов:

  1.  Если модель подобрана правильно, то остатки будут вести себя достаточно хаотично, в известном смысле они будут напоминать белый шум.
  2.  В остатках не будет систематической составляющей, резких выбросов, в чередовании их знаков не будет никаких закономерностей, остатки будут независимы друг от друга.

Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые одинаково распределенные случайные величины. Независимость остатков проверяется с помощью критерия Дарбина – Уотсона. Исследование остатков полезно начинать с изучения их графика. Он может показать наличие какой-либо зависимости, не учтенной в модели.

Поведение остатков  должно имитировать поведение ошибок . Иначе говоря, поскольку предполагается, что ошибки  — независимые в совокупности случайные величины, имеющие стандартное нормальное распределение , то ожидаем, что поведение последовательности остатков должно имитировать поведение последовательности независимых в совокупности случайных величин c распределением .

Исходя из этих предположений, проанализируем представленный реальный график (рис.1).

Рис. 1. Сравнение стандартизованных остатков с N (0,1)

Гистограмма остатков "почти" симметрична относительно нуля, т.е. количество отрицательных значений равно количеству положительных. Как и в нормальном распределении, количество малых остатков (разностей между наблюденными результатами и данными модели) велико, а большие остатки малы.

Рассмотрим еще одно графическое представление остатков (см. рис.2). Из графика остатков на нормальной вероятностной бумаге видно, что они достаточно хорошо ложатся на прямую, которая соответствует стандартному нормальному распределению.

Исходя из построенных графических результатов, можно сделать вывод о том, что предположение о нормальности распределения ошибок – достаточно корректно.

Рис. 2. График остатков на нормальной вероятностной бумаге

Критерий Дарбина – Уотсона (Durbin - Watson)

Оценивая качество уравнения регрессии, мы предполагаем, что реальная взаимосвязь переменных линейна. Отклонения от регрессионной прямой являются случайными, независимыми друг от друга величинами с нулевым математическим ожиданием и постоянной дисперсией. Если эти предположения не выполняются, то оценки коэффициентов регрессии не обладают свойствами несмещенности, эффективности и состоятельности. В этом случае анализ значимости полученных оценок будет неточным.

Статистика Дарбина—Уотсона используется для проверки гипотезы о том, что остатки построенной регрессионной модели некоррелированны (корреляции равны нулю), против альтернативы: остатки связаны авторегрессионной зависимостью (первого порядка) вида:

На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина—Уотсона, рассчитываемую по формуле

Действительно,

Здесь сделано допущение, что при больших значениях  выполняется соотношение

Тогда

Нетрудно заметить, что если , то  и . Если  то  и . Во всех других случаях .

Критические точки статистики Дарбина—Уотсона табулированы для различных . При проверке гипотезы об отсутствии автокорреляции остатков используется числовой отрезок, на котором отложены  нижняя граница статистики и верхняя граница:

Рис. 3. Статистика Дарбина—Уотсона

Проверка гипотезы проводится по схеме:

  1.  Если , то гипотеза  отклоняется, принимается  значительная положительная автокорреляция остатков;
  2.  Если , , то гипотеза  отклоняется, принимается  значительная отрицательная автокорреляция остатков;
  3.  Если , то гипотеза  об отсутствии автокорреляции остатков принимается;
  4.  Если , или , то гипотеза об отсутствии автокорреляции не может быть ни принята, ни отклонена.

Не обращаясь к таблице критических точек Дарбина—Уотсона можно воспользоваться "грубым" правилом и считать, что автокорреляция остатков отсутствует, если . Для более надежных выводов необходимо воспользоваться статистическими таблицами.


 

А также другие работы, которые могут Вас заинтересовать

72954. Банкрутство і фінансова санація підприємств 389 KB
  До внутрішніх факторів банкрутства відносять: дефіцит власного оборотного капіталу; низький рівень техніки технології та організації виробництва; зниження ефективності використання виробничих ресурсів виробництва; створення наднормативних залишків; незадовільна платіжна дисципліна; недостатні обсяги...
72955. Визначення вартості грошей у часі та її використання 307.58 KB
  Управління прибутком підприємства розподіляється на дві важливі підсистеми: 1 управління формуванням прибутку; 2 управління розподілом прибутку. Виконання фінансовим менеджером підприємства основних завдань управління формуванням прибутку підприємства спрямоване на врахування таких особливостей...
72956. Теоретичні та організаційні основи фінансового менеджменту 134.5 KB
  З позицій бізнесу підприємництва поняття менеджменту розглядається щонайменше з трьох позицій: як система економічного управління фінансовий менеджмент –- процес управління формуванням розподілом і використанням фінансових ресурсів суб’єкта господарювання та оптимізації обороту його грошових коштів...
72957. Система забезпечення фінансового менеджменту 411 KB
  Для вирішення конкретних задач фінансового менеджменту застосовується ряд спеціальних систем і методів фінансового аналізу який представляє собою процес дослідження фінансового стану і основних результатів фінансової діяльності підприємства з метою виявлення резервів підвищення...
72958. Управління грошовими потоками на підприємстві 140.77 KB
  Ознайомити студентів із сутністю політики управління грошовими потоками правилами обґрунтування цілей та встановлення поточних завдань управління грошовими потоками визначити методичний інструментарій оптимізації грошових потоків а також розкрити переваги і недоліки використання західних моделей...
72959. Парадигмы кадрового менеджмента и организационная культура 62.7 KB
  Развитие сложных технологий индивидуализация деятельности потребовали изменения принципиального взгляда на человеческий потенциал организации и на смену концепции человеческих отношений пришла концепция контрактации ответственности.
72960. Концепция личности как основа структуры теста и подхода к изучению индивидуально-психологических особенностей человека 26.36 KB
  Обычно психодиагностический тест строится на основе авторских представлений о структуре личности. Сбор и систематизация информации об испытуемом в ходе психодагностического обследования происходит на основе субъективной модели личности представленной в сознании диагноста.
72961. Фразеологическая стилистика 33.04 KB
  Важно подчеркнуть что компоненты фразеологизма или не употребляются самостоятельно просак тормашки или изменяют во фразеологизме свое обычное значение например кровь с молоком означает здоровый с хорошим цветом лица с румянцем. В то же время в некоторых фразеологизмах возможно изменение порядка слов...
72962. Пополнение лексики новыми словами 36.76 KB
  Пополнение лексики новыми словами Каждая эпоха обогащает язык новыми словами. Слова получающие широкое распространение вливаются в состав активной лексики. вошли в русский язык слова вуз ликбез зарплата космонавт луноход жвачка федералы и т.