47037

Определение адекватности построенной модели регрессии

Доклад

Математика и математический анализ

Анализ остаточной компоненты остаточного ряда позволяет оценить качество полученнного уравнения регрессии. Модель считается адекватной исследуемому процессу если: 1 математическое ожидание значений остаточного ряда близко или равно нулю; 2 значения остаточного ряда случайны; 3 независимы; 4 подчинены нормальному закону распределения. Равенство нулю математического ожидания ряда остатков означает выполнение следующего соотношения: Однако в случае применения метода наименьших квадратов такая проверка является излишней поскольку...

Русский

2013-11-27

47.5 KB

14 чел.

9. Определение адекватности построенной модели регрессии

Действия, выполняемые в данном случае, представляют собой процесс (этап) верификации модели регрессии, т.е. процесс, в ходе которого подвергается анализу качество полученной модели.

Допустим, имеется уравнение регрессии в линейном или нелинейном виде. Значения определяемые уравнением - i , тогда фактические значения можно представить как:

yi = i + ei ,

 

где ei - случайная (остаточная) компонента.

Анализ остаточной компоненты (остаточного ряда) позволяет оценить качество полученнного уравнения регрессии. Качество характеризуется выполнением определенных статистических свойств и точностью, т.е. степенью близости к фактическим данным. Модель считается хорошей со статистической точки зрения, если она адекватна и достаточно точна. Смысл используемых терминов характеризуют рисунки 6.6 и 6.7.

Рисунок 1 – Пример модели регрессии
(модель адекватна, но не точна)

Рисунок 2 – Пример модели регрессии
(модель точна, но не адекватна)

Оценить адекватность модели позволяет анализ случайной компоненты ei. Модель считается адекватной исследуемому процессу, если:

1) математическое ожидание значений остаточного ряда близко или равно нулю;

2) значения остаточного ряда случайны;

3) независимы;

4) подчинены нормальному закону распределения.

Таким образом, анализ адекватности модели разбивается на несколько этапов.

1. Равенство нулю математического ожидания ряда остатков означает выполнение следующего соотношения:

 

Однако в случае применения метода наименьших квадратов такая проверка является излишней, поскольку использование МНК предполагает выполнение равенства , откуда безусловным образом следует равенство нулю математического ожидания значений остаточного ряда.

2. Проверка случайности последовательности ei проводится с помощью критерия пиков (поворотных точек). Каждое значение ряда (ei) сравнивается с двумя, рядом стоящими. Точка считается поворотной, если она либо больше и предыдущего и последующего значения, либо меньше и предыдущего и последующего значения.

В случайном ряду должно выполняться строгое неравенство:

,

где p - число поворотных точек;

[ ] - целая часть результата вычислений.

3. При проверке независимости значений ei определяется отсутствие в остаточном ряду автокорреляции, под которой понимается корреляция между элементами одного и того же числового ряда. В нашем случае автокорреляция - это корреляция ряда e1, e2, e3 ... с рядом eL+1, eL+2, eL+3 ... Число L характеризует запаздывание (лаг). Корреляция между соседними членами ряда (т.е. когда L = 1) называется автокорреляцией первого порядка. Далее для остаточного ряда будем рассматривать зависимость между соседними элементами ei.

Значительная автокорреляция говорит о том, что спецификация регрессии выполнена неправильно (неправильно определен тип зависимости).

Наличие автокорреляции может быть выявлено при помощи d-критерия Дарбина-Уотсона. Значение критерия вычисляется по формуле:

.

Эта величина сравнивается с двумя табличными уровнями: нижним - d1 и верхним - d2.

Если полученное значение d больше двух, то перед сопоставлением его нужно преобразовать:

d' = 4 - d.

 

Если d (или d') находится в интервале от нуля до d1 , то значения остаточного ряда сильно автокоррелированы.

Если значение d-критерия попадает в интервал от d2 до 2, то автокорреляция отсутствует.

Если d1 < d< d2 - однозначного вывода об отсутствии или наличии автокорреляции сделать нельзя и необходимо использовать другой критерий, например, коэффициент автокорреляции первого порядка:

.

 

Если |r(1)| окажется меньше табличного (при n<15 rтабл = 0,36), то гипотеза о наличии автокорреляции отвергается.

4. Соответствие остаточного ряда нормальному распределению проще всего проверить при помощи RS-критерия:

,

где emax - максимальное значение ряда остатков;

emin - минимальное значение ряда остатков;

- среднеквадратическое отклонение значений остаточного ряда.

Если рассчитанное значение попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении принимается.

Для характеристики точности модели наиболее часто вычисляют среднюю относительную ошибку:

.

 

В отношении величины средней относительной ошибки, как правило, делают следующие выводы. Величина менее 5% свидетельствует о хорошем уровне точности, ошибка до 15% считается приемлемой.


 

А также другие работы, которые могут Вас заинтересовать

23419. Дослідження роботи логічних елементів «НІ», «І», «І-НІ», «АБО», «АБО-НІ» 474 KB
  В цій схемі два двопозиційні перемикачі А і В подають на входи логічної схеми І рівні 0 контакт перемикача в нижньому положенні або 1 контакт перемикача у верхньому положенні. Подайте на входи схеми всі можливі комбінації рівнів сигналів А і В і для кожної комбінації зафіксуйте рівень вихідного сигналу Y. Заповніть таблицю істинності логічної схеми І 7408. Подайте на входи схеми всі можливі комбінації рівнів вхідних сигналів і спостерігаючи рівні сигналів на входах і виході за допомогою логічних пробників заповніть таблицю істинності...
23420. Дослідження роботи тригерів 74.5 KB
  Зберіть схему рис. Увімкніть схему. Послідовно подайте на схему наступні сигнали: S=0 R=1; S=0 R=0; S=1 R=0; S=0 R=0. Зберіть схему рис.
23421. Дослідження роботи лічильників 107.5 KB
  Дослідження лічильника що підсумовує. Подаючи на вхід схеми тактові імпульси за допомогою ключа С і спостерігаючи стан виходів лічильника за допомогою індикаторів складіть часові діаграми роботи лічильника що підсумовує. б Визначте коефіцієнт перерахунку лічильника. Зверніть увагу на числа сформовані станами інверсних виходів лічильника.
23422. Дослідження роботи регістрів 172 KB
  Завантаження інформації в регістр провадиться синхронно з позитивним перепадом тактового імпульсу якщо на входах М N є напруги низького рівня логічного 0. Якщо на одному із цих входів напруга високого рівня після приходу позитивного тактового перепаду в регістрі повинні залишитися попередні дані. Якщо на входи G2 G1 подано напругу активного низького рівня дані що утримуються в регістрі відображаються на виходах 1Q.4Q присутність хоча б однієї напруги високого рівня на входах дозволу G2 і G1 викликає Z стан розмикання для вихідних...
23423. Виртуальная компания – реальность XXI века 120.12 KB
  Для участников виртуальной организации присущи не только определенные роли но и статусы. Статус гарантирует предоставление возможности по доступу к контенту различный уровень анонимности конформность поведения определенных участников виртуальной компании групповую идентичность. Принципы формирования виртуальных компаний[1] Управление виртуальной компанией базируется на представлениях инициаторов проекта работодателей разработчиков. Архитектура сети выбирается с учетом максимальной эффективности деятельности виртуальной компании в...
23424. ПОИСК В ИНТЕРНЕТЕ. ЭЛЕКТРОННАЯ ПОЧТА 1.08 MB
  По мере роста общего количества пользователей Интернета а среди них числа владеющих английским языком эти ограничения всё в большей степени снимаются что закономерно ведёт к уменьшению спроса на услуги журналистов. electronic mail технология и предоставляемые ею услуги по пересылке и получению электронных сообщений называемых письма или электронные письма по распределённой в том числеглобальной компьютерной сети. Акадо российский телекоммуникационный холдинг оказывающий услуги доступа в...
23425. Сообщения SIP 27.68 KB
  Реферат Протокол SIP разрабатывался с расчетом на возможность использования любых транспортов но тем не менее наиболее предпочтительным является использование UDPпакетов это позволяет повысить производительность по сравнению с использованием протокола TCP но требует использования дополнительных механизмов проверки доставки сигнальных сообщений. Так как телефония с использованием протокола SIP позволяет использовать большое количество разнообразных сервисов помимо передачи голоса возможна...
23426. Уровни сетевой архитектуры 72.79 KB
  Компьютерные сети по своей структуре очень сложны. Для начала проведем грань между работой программных и аппаратных средств сети. В сети может работать разнообразное по технологии оборудование от него зависят возможности сети: производительность надежность и т. и разнообразное программное обеспечение: сетевые операционные системы приложения от него зависят те же возможности сети прозрачность безопасность.
23427. Города на территории Беларуси в IX – середине XIII в.: происхождение названий и хозяйственная жизнь горожан 13.54 KB
  Причинами превращения городищ в города были: отделение ремесла от земледелия проживание ремесленников в местах близких к источникам сырья развитие обмена продуктами земледелия на вещи сделанные ремесленниками. Города возникали на перекрестках дорог и рек. Города IX – XIII вв. Внутренняя часть города укрепленная валами рвами стенами называлась детинцем.