47037

Определение адекватности построенной модели регрессии

Доклад

Математика и математический анализ

Анализ остаточной компоненты остаточного ряда позволяет оценить качество полученнного уравнения регрессии. Модель считается адекватной исследуемому процессу если: 1 математическое ожидание значений остаточного ряда близко или равно нулю; 2 значения остаточного ряда случайны; 3 независимы; 4 подчинены нормальному закону распределения. Равенство нулю математического ожидания ряда остатков означает выполнение следующего соотношения: Однако в случае применения метода наименьших квадратов такая проверка является излишней поскольку...

Русский

2013-11-27

47.5 KB

14 чел.

9. Определение адекватности построенной модели регрессии

Действия, выполняемые в данном случае, представляют собой процесс (этап) верификации модели регрессии, т.е. процесс, в ходе которого подвергается анализу качество полученной модели.

Допустим, имеется уравнение регрессии в линейном или нелинейном виде. Значения определяемые уравнением - i , тогда фактические значения можно представить как:

yi = i + ei ,

 

где ei - случайная (остаточная) компонента.

Анализ остаточной компоненты (остаточного ряда) позволяет оценить качество полученнного уравнения регрессии. Качество характеризуется выполнением определенных статистических свойств и точностью, т.е. степенью близости к фактическим данным. Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна. Смысл используемых терминов характеризуют рисунки 6.6 и 6.7.

Рисунок 1 – Пример модели регрессии
(модель адекватна, но не точна)

Рисунок 2 – Пример модели регрессии
(модель точна, но не адекватна)

Оценить адекватность модели позволяет анализ случайной компоненты ei. Модель считается адекватной исследуемому процессу, если:

1) математическое ожидание значений остаточного ряда близко или равно нулю;

2) значения остаточного ряда случайны;

3) независимы;

4) подчинены нормальному закону распределения.

Таким образом, анализ адекватности модели разбивается на несколько этапов.

1. Равенство нулю математического ожидания ряда остатков означает выполнение следующего соотношения:

 

Однако в случае применения метода наименьших квадратов такая проверка является излишней, поскольку использование МНК предполагает выполнение равенства , откуда безусловным образом следует равенство нулю математического ожидания значений остаточного ряда.

2. Проверка случайности последовательности ei проводится с помощью критерия пиков (поворотных точек). Каждое значение ряда (ei) сравнивается с двумя, рядом стоящими. Точка считается поворотной, если она либо больше и предыдущего и последующего значения, либо меньше и предыдущего и последующего значения.

В случайном ряду должно выполняться строгое неравенство:

,

где p - число поворотных точек;

[ ] - целая часть результата вычислений.

3. При проверке независимости значений ei определяется отсутствие в остаточном ряду автокорреляции, под которой понимается корреляция между элементами одного и того же числового ряда. В нашем случае автокорреляция - это корреляция ряда e1, e2, e3 ... с рядом eL+1, eL+2, eL+3 ... Число L характеризует запаздывание (лаг). Корреляция между соседними членами ряда (т.е. когда L = 1) называется автокорреляцией первого порядка. Далее для остаточного ряда будем рассматривать зависимость между соседними элементами ei.

Значительная автокорреляция говорит о том, что спецификация регрессии выполнена неправильно (неправильно определен тип зависимости).

Наличие автокорреляции может быть выявлено при помощи d-критерия Дарбина-Уотсона. Значение критерия вычисляется по формуле:

.

Эта величина сравнивается с двумя табличными уровнями: нижним - d1 и верхним - d2.

Если полученное значение d больше двух, то перед сопоставлением его нужно преобразовать:

d' = 4 - d.

 

Если d (или d') находится в интервале от нуля до d1 , то значения остаточного ряда сильно автокоррелированы.

Если значение d-критерия попадает в интервал от d2 до 2, то автокорреляция отсутствует.

Если d1 < d< d2 - однозначного вывода об отсутствии или наличии автокорреляции сделать нельзя и необходимо использовать другой критерий, например, коэффициент автокорреляции первого порядка:

.

 

Если |r(1)| окажется меньше табличного (при n<15 rтабл = 0,36), то гипотеза о наличии автокорреляции отвергается.

4. Соответствие остаточного ряда нормальному распределению проще всего проверить при помощи RS-критерия:

,

где emax - максимальное значение ряда остатков;

emin - минимальное значение ряда остатков;

- среднеквадратическое отклонение значений остаточного ряда.

Если рассчитанное значение попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении принимается.

Для характеристики точности модели наиболее часто вычисляют среднюю относительную ошибку:

.

 

В отношении величины средней относительной ошибки, как правило, делают следующие выводы. Величина менее 5% свидетельствует о хорошем уровне точности, ошибка до 15% считается приемлемой.


 

А также другие работы, которые могут Вас заинтересовать

24834. Влади́мир Его́рович Мако́вский 186.5 KB
  Его отец Егор Иванович Маковский человек умный образованный и богато одаренный на свои скромные средства он служил бухгалтером Экспедиции Кремлевских строений составил значительное собрание редких высокохудожественных гравюр и картин. Маковский затронул и показал жизнь почти всех социальных групп и сословий России.
24835. Земство обедает 1.14 MB
  Художник показывает неравноправное положение членов земской управы простым сюжетным ходом земство обедает соответственно своему социальному положению.
24836. «Иван Грозный и его сын Иван», 1883- 1885, 371 KB
  Обезумевший от гнева старик ударил тяжелым жезлом своего сына в висок. Другою рукою прижимает он сына к себе и целует его испачкав свое лицо в кровь. Кстати лицо сына Репин писал с писателя Гаршина лицо которого по мнению живописца выражало безропотную обреченность и великую жертвенность. Мы видим безумные глаза Грозного волосы вставшие от ужаса дыбом судорожно обнимающие тело сына руки.
24837. Илья Ефимович Репин 166 KB
  К 1863 году Репин мечтавший об Академии художеств отправился в Петербург. После недолгого пребывания в школе рисования Репин был принят в январе 1864 года в Академию художеств вольнослушателем. Окончание Академии художеств с золотой медалью дало право Репину как пенсионеру Академии уехать за границу совершенствовать своё живописное мастерство.
24838. Городские сети (или сети мегаполисов) - Metropolitan Area Networks (MAN) 14.17 KB
  Эти сети появились сравнительно недавно. В то время как локальные сети наилучшим образом подходят для разделения ресурсов на коротких расстояниях и широковещательных передач а глобальные сети обеспечивают работу на больших расстояниях но с ограниченной скоростью и небогатым набором услуг сети мегаполисов занимают некоторое промежуточное положение. Эти сети первоначально были разработаны для передачи данных но сейчас они поддерживают и такие услуги как видеоконференции и интегральную передачу голоса и текста.
24840. Основные отличия локальных сетей от глобальных 17.98 KB
  Так как в последнее время эти отличия становятся все менее заметными то будем считать что в данном разделе мы рассматриваем сети конца 80х годов когда эти отличия проявлялись весьма отчетливо а современные тенденции сближения технологий локальных и глобальных сетей будут рассмотрены в следующем разделе. Класс локальных вычислительных сетей по определению отличается от класса глобальных сетей небольшим расстоянием между узлами сети. Это в принципе делает возможным использование в локальных сетях качественных линий связи: коаксиального...
24841. Сети отделов 27.32 KB
  Главной целью сети отдела является разделение локальных ресурсов таких как приложения данные лазерные принтеры и модемы. Обычно сети отделов имеют один или два файловых сервера и не более тридцати пользователей рис. Сети отделов обычно не разделяются на подсети.
24842. Сети кампусов 58.51 KB
  Сети этого типа объединяют множество сетей различных отделов одного предприятия в пределах отдельного здания или в пределах одной территории покрывающей площадь в несколько квадратных километров. Службы такой сети включают взаимодействие между сетями отделов доступ к общим базам данных предприятия доступ к общим факссерверам высокоскоростным модемам и высокоскоростным принтерам. Пример сети кампуса Именно на уровне сети кампуса возникают проблемы интеграции неоднородного аппаратного и программного обеспечения.