10976

Проверка качества уравнения регрессии

Лекция

Математика и математический анализ

Проверка качества уравнения регрессии Оценим насколько хорошо модель линейной регрессии описывает данную систему наблюдений. В качестве этой оценки воспользуемся коэффициентом детерминации. Составим следующие суммы квадратов отклонений: фактических значений от...

Русский

2013-04-03

80.42 KB

45 чел.

Проверка качества уравнения регрессии

Оценим, насколько хорошо модель линейной регрессии описывает данную систему наблюдений. В качестве этой оценки воспользуемся коэффициентом детерминации.

Составим следующие суммы квадратов отклонений:

фактических значений от их среднего арифметического;

выравненных значений от их среднего арифметического фактических значений;

фактических от выравненных значений.

Можно показать, что справедливо равенство:

.      (13.1)

Действительно,

А последнее слагаемое представим:

(.

Учитывая (11.8) получим, что первая сумма равна нулю, а вторую сумму представим:

.

Коэффициент детерминации – это отношение объясненной  части вариации ко всей вариации в целом:

   (13.2)

Т.о. чем "ближе" этот коэффициент к 1, тем лучше модель описывает эмпирические данные, разумеется, если при этом модель методически правильна.

Проверка значимости (качества) уравнения регрессии производится на основе дисперсионного анализа.

Дисперсионный анализ – самостоятельный инструмент (метод) математической статистики будет подробно рассмотрен в дальнейшем. Пока же кратко рассмотрим схему дисперсионного анализа, представленную в виде таблицы.

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия

Регрессия

Остаточная

Общая

Уравнение регрессии значимо на уровне , если фактически наблюдаемое значение статистики удовлетворяет соотношению

Здесь  критическое значение критерия Фишера – Снедекора при  и  степенях свободы; число оцениваемых параметров уравнения регрессии; число наблюдений.

В случае линейной парной регрессии  и уравнение регрессии значимо на уровне , если

Оценка остатков

Остатками называются разности наблюдаемых величин и подогнанных или прогнозируемых с помощью модели.

При анализе остатков следует учитывать ряд существенных факторов:

  1.  Если модель подобрана правильно, то остатки будут вести себя достаточно хаотично, в известном смысле они будут напоминать белый шум.
  2.  В остатках не будет систематической составляющей, резких выбросов, в чередовании их знаков не будет никаких закономерностей, остатки будут независимы друг от друга.

Согласно общим предположениям регрессионного анализа, остатки должны вести себя как независимые одинаково распределенные случайные величины. Независимость остатков проверяется с помощью критерия Дарбина – Уотсона. Исследование остатков полезно начинать с изучения их графика. Он может показать наличие какой-либо зависимости, не учтенной в модели.

Поведение остатков  должно имитировать поведение ошибок . Иначе говоря, поскольку предполагается, что ошибки  — независимые в совокупности случайные величины, имеющие стандартное нормальное распределение , то ожидаем, что поведение последовательности остатков должно имитировать поведение последовательности независимых в совокупности случайных величин c распределением .

Исходя из этих предположений, проанализируем представленный реальный график (рис.1).

Рис. 1. Сравнение стандартизованных остатков с N (0,1)

Гистограмма остатков "почти" симметрична относительно нуля, т.е. количество отрицательных значений равно количеству положительных. Как и в нормальном распределении, количество малых остатков (разностей между наблюденными результатами и данными модели) велико, а большие остатки малы.

Рассмотрим еще одно графическое представление остатков (см. рис.2). Из графика остатков на нормальной вероятностной бумаге видно, что они достаточно хорошо ложатся на прямую, которая соответствует стандартному нормальному распределению.

Исходя из построенных графических результатов, можно сделать вывод о том, что предположение о нормальности распределения ошибок – достаточно корректно.

Рис. 2. График остатков на нормальной вероятностной бумаге

Критерий Дарбина – Уотсона (Durbin - Watson)

Оценивая качество уравнения регрессии, мы предполагаем, что реальная взаимосвязь переменных линейна. Отклонения от регрессионной прямой являются случайными, независимыми друг от друга величинами с нулевым математическим ожиданием и постоянной дисперсией. Если эти предположения не выполняются, то оценки коэффициентов регрессии не обладают свойствами несмещенности, эффективности и состоятельности. В этом случае анализ значимости полученных оценок будет неточным.

Статистика Дарбина—Уотсона используется для проверки гипотезы о том, что остатки построенной регрессионной модели некоррелированны (корреляции равны нулю), против альтернативы: остатки связаны авторегрессионной зависимостью (первого порядка) вида:

На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина—Уотсона, рассчитываемую по формуле

Действительно,

Здесь сделано допущение, что при больших значениях  выполняется соотношение

Тогда

Нетрудно заметить, что если , то  и . Если  то  и . Во всех других случаях .

Критические точки статистики Дарбина—Уотсона табулированы для различных . При проверке гипотезы об отсутствии автокорреляции остатков используется числовой отрезок, на котором отложены  нижняя граница статистики и верхняя граница:

Рис. 3. Статистика Дарбина—Уотсона

Проверка гипотезы проводится по схеме:

  1.  Если , то гипотеза  отклоняется, принимается  значительная положительная автокорреляция остатков;
  2.  Если , , то гипотеза  отклоняется, принимается  значительная отрицательная автокорреляция остатков;
  3.  Если , то гипотеза  об отсутствии автокорреляции остатков принимается;
  4.  Если , или , то гипотеза об отсутствии автокорреляции не может быть ни принята, ни отклонена.

Не обращаясь к таблице критических точек Дарбина—Уотсона можно воспользоваться "грубым" правилом и считать, что автокорреляция остатков отсутствует, если . Для более надежных выводов необходимо воспользоваться статистическими таблицами.


 

А также другие работы, которые могут Вас заинтересовать

33600. Методы и модели принятия управленческого решения 44 KB
  Физическая модель выглядит как моделируемая целостность и должна обладать аналогичными характеристиками копируемого объекта. Отличительная характеристика физической модели состоит в том что в некотором смысле она выглядит как моделируемая целостность. Математическая модель принятия управленческих решений В математической модели называемой также символической используются символы для описания свойств или характеристик объекта или события.
33601. Территория и границы Российской Федерации как фактор развития российского государства 88.5 KB
  Центральный федеральный округ Белгородская область Брянская область Владимирская область Воронежская область Ивановская область Калужская область Костромская область Курская область Липецкая область Московская область Орловская область Рязанская область Смоленская область Тамбовская область Тверская область Тульская область Ярославская область Город федерального значения Москва Южный федеральный округ Северозападный федеральный округ Дальневосточный федеральный округ Сибирский федеральный округ Уральский федеральный округ...
33602. Влияние природных условий и природных ресурсов на территориальную организацию общества 50.5 KB
  Зависимость размещения отраслей производства народного хозяйства от природных особенностей территории. Классификация природных ресурсов и распределение их по территории страны. Под природными условиями понимается совокупность важнейших естественных характеристик территории отражающих основные особенности компонентов природной среды или местных природных феноменов. Климатические особенности территории проявляются прежде всего в соотношении тепла и влаги.
33603. Особенности территориальной организации населения России 40.5 KB
  Численность и естественное движение населения. Миграция населения. Региональные различия расселения населения.
33604. Закономерности территориальной организации производства 39.5 KB
  Показатели экономической эффективности размещения производства. Специфика размещения производства в России. Комплексное развитие производства.
33605. Особенности территориальной и отраслевой структуры хозяйства страны 159.5 KB
  ШШ Производственная сфера экономики включает: отрасли создающие материальные блага промышленность сельское хозяйство строительство; отрасли доставляющие материальные блага потребителю транспорт и связь; отрасли действующие в сфере обращения торговля общественное питание материально техническое снабжение сбыт заготовки. К непроизводственной сфере относят: отрасли услуг жилищнокоммунальное хозяйство бытовое обслуживание; образование и научное отрасли социального обслуживания здравоохранение культура...
33606. Урбанизация и особенности расселения населения 61 KB
  В настоящее время более половины населения мира живет в сельской местности. В России учитывается не только число жителей но и показатель занятости населения промышленность сфера обслуживания. Процесс роста городского населения увеличения числа городов и их укрупнения возникновения сетей и систем городов а также повышения роли городов в современном мире называется урбанизацией.
33607. Инновационный процесс 103.5 KB
  Таким образом в условиях рыночной экономики такой неотъемлемый критерий инновации как практическая воплощенность новой идеи оказывается тесно связанным с критерием ее коммерческой реализуемости посредством появления на рынке новой инновационной продукции или услуг. Деятельность организации по осуществлению инновационных процессов называется инновационной деятельностью. Основные составляющие инновационной деятельности: Научноисследовательские и опытноконструкторские работы НИОКР Технологические работы подготовка производства и...
33608. Типы инноваций 44.5 KB
  В зависимости от критерия классификации выделяются следующие типы инноваций: по степени новизны: базисные радикальные и улучшающие приростные; по характеру практической деятельности: производственные и управленческие; по технологическим параметрам: продуктовые и процессные. На реализацию базисных инноваций стимулирующее влияние оказывает создание союзов и объединений организаций поскольку взаимодействие нескольких организаций позволяет направить им усилия на различные компоненты или подсистемы базисных инноваций. Реализация...