42166

ВЫБОР РЕГРЕССИОННОЙ МОДЕЛИ

Лабораторная работа

Физика

Ранее предполагалось что мы имеем дело с правильной спецификацией модели то есть считалось что зависимая переменная y регрессоры X и оцениваемые параметры β связаны соотношением y = Xβ ε и выполняются условия ГауссаМаркова. Рассматривается два основных случая: В оцениваемой модели отсутствует часть независимых переменных имеющихся в истинной модели исключение существенных переменных: истинная модель: y = Xβ Zγ ε длинная регрессия; оцениваемая модель: y = Xβ ε короткая регрессия. В оцениваемой модели присутствуют...

Русский

2013-10-27

242.5 KB

44 чел.

Лабораторная работа №6

ВЫБОР РЕГРЕССИОННОЙ МОДЕЛИ

Сам выбор регрессоров и вида модели называется спецификацией модели. Ранее предполагалось, что мы имеем дело с правильной спецификацией модели, то есть считалось, что зависимая переменная y, регрессоры X и оцениваемые параметры β связаны соотношением

y = + ε

и выполняются условия Гаусса-Маркова.

При этом часто утверждается, что данное соотношение описывает «процесс, порождающий данные» или что он является «истинной моделью». Как правило, на практике истинная модель неизвестна, исследователь оценивает модель, которая лишь приближенно соответствует процессу, порождающему данные. Поэтому возникает естественный вопрос о соотношении между МНК-оценками параметров в истинной и выбранной моделях.

Рассматривается два основных случая:

  1.  В оцениваемой модели отсутствует часть независимых переменных, имеющихся в истинной модели (исключение существенных переменных):

истинная модель:  y = + + ε (длинная регрессия);

оцениваемая модель:  y = + ε  (короткая регрессия).

Здесь Xn×k – матрица; Zn×l – матрица; yn×1 – вектор наблюдений зависимой переменной; βk×1, γl×1 – векторы коэффициентов.

В этом случае оценка, полученная в короткой регрессии, в общем случае смещенная, но обладает меньшей вариацией.

  1.  В оцениваемой модели присутствуют независимые переменные, которых нет в истинной модели (включение несущественных переменных):

истинная модель:   y = + ε  (короткая регрессия);

оцениваемая модель:  y = + + ε (длинная регрессия).

В этом случае оценка  несмещенная, но дисперсия оценки увеличивается от включения в модель несущественных переменных.

Основным критерием выбора вида модели является ее экономический смысл, а не подгонка данных под модель.

1. Корректировка вида модели

«Улучшить» вид построенной множественной линейной регрессии можно используя следующие тесты.

Тест Вальда

Проводится для проверки гипотез равенства коэффициентов какому-либо значению или соотношения коэффициентов между собой. Например, β2=0 или β3=2·β4.

Тест на функциональную форму

Тестом на ошибку линейной спецификации модели является RESET-тест. Идея этого теста заключается в том, что если модель  верна, то добавление нелинейных функций  не должно помогать объяснять yt. В частности, можно добавлять степени:

               (1)

Тестируется гипотеза Н0: α2 = … = αm с помощью F-статистки. Обычно тест применяется при небольших значениях m = 2,3,4. Однако он может отвергать нулевую гипотезу не потому, что в истинной модели есть нелинейные члены, а в силу того, что в уравнении пропущена переменная, влияние которой частично учтено нелинейными членами в (1).

Часто включение в модель квадрата переменной x обусловлено тем, что влияние x на y в какой-то момент достигает максимума или минимума и форма взаимосвязи меняется. Например, рост заработной платы в зависимости от возраста замедляется ближе к пенсионному возрасту, а с какого-то момента (возраста) начинает снижаться. Поэтому вводится дополнительная переменная x2 (возраст в квадрате).

 

2. Выбор конкурирующих моделей

Если в процессе моделирования было получено две значимых модели, качественно описывающих исследуемый процесс, то проводятся различные тесты на выбор лучшей модели.

F-тест

Пусть имеется две модели:

модель А: ,

модель В: .

Обе модели содержат как одинаковые, так и различные правые части:

.

Согласно этому рассматриваются две регрессии:

,

.

Далее проверяются две гипотезы:

H0: δA = 0 – если не отвергается, то и не отвергается модель В.

H0: δB = 0 – если не отвергается, то и не отвергается модель А.

Если обе гипотезы либо принимаются, либо отвергаются, то ситуация остается неопределенной.

J-тест

Рассматривается частный случай моделей А и В:

.  (2)

При δ = 0 эта модель совпадает с моделью А, а при δ = 1 – с моделью В. Однако это уравнение невозможно оценить, поскольку параметры β, γ, δ не могут быть идентифицированы одновременно. Поэтому сначала оценивается параметр γ, а затем оценка  подставляется в уравнение (2):

.  (3)

Здесь  – прогнозные значения, полученные по модели В, а . Из уравнения (3) можно получить оценку . Если нулевая гипотеза Н0: δ=0 не отвергается, то склоняемся к выбору модели А. Аналогичную процедуру можно проделать, взяв за нулевую гипотезу модель В. В двух из четырех возможных исходов теста, когда обе модели отвергаются или обе модели не отвергаются, ситуация остается неопределенной.

РЕ-тест

Применяется, когда в левой части сравниваемых уравнений – различные формы зависимой переменной, например, линейная и полулогарифмическая:

,

.

Коэффициент детерминации R2 здесь не может применяться для сравнения и выбора лучшей модели.

Содержательный смысл PE-теста заключается в следующем: улучшится ли модель при включении в нее прогноза конкурирующей модели.

Реализация РЕ-теста состоит в следующем: оцениваются обе модели МНК и получаются соответствующие прогнозные значения  и . Далее оцениваются следующие модели:

,

.

Затем тестируются гипотезы:

H0: δLIN = 0 – если не отвергается, то и не отвергается линейная модель.

H0: δLOG = 0 – если не отвергается, то и не отвергается полулогарифмическая модель. Как и ранее, возможны четыре исхода теста.

РЕ-тест может применяться в значительно более общей ситуации.

Выбор регрессионной модели в EViews 5.1.

1. Тест Вальда

Для проведения теста Вальда в EViews необходимо в окне “Equation” выбрать View / Coefficient Tests / WaldCoefficient Restrictions и в появившемся окне “Wald Test” ввести проверяемую гипотезу (рис. 6.1) и нажать ОК.

Рис. 6.1. Тест Вальда

На рис. 6 параметр С(4) соответствует 4-му по порядку коэффициенту в окне “Equation”, а параметр С(5) соответственно – 5-му коэффициенту. Проверятся гипотеза о равном влиянии переменных при коэффициентах С(4) и С(5) на результирующую переменную.

В результате теста в окне “Equation”появится следующая информация (рис. 6.2).

Рис. 6.2. Результаты теста Вальда

Если полученное значение Probability < 0.05 (см. рис. 6.2), то гипотеза отвергается. В данном примере влияние переменных при коэффициентах С(4) и С(5) на результирующую переменную неравное.

2. Тест на функциональную форму (RESET-тест):

В окне “Equation” для выбранной модели выбирается View / Stability Tests / Ramsey RESET Test…, в появившемся окне “RESET Specification” в поле “Number of fitted” вводится значение m–1 (степень нелинейного члена минус 1), например, 2. В результате в окне “Equation” появятся результаты теста (рис. 6.3).

Рис. 6.3. Результаты проведения RESET-теста для m-1=2

Если значение Рrob. F < 0.05 (рис. 6.3), то это указывает на ошибочную спецификацию модели и в уравнение необходимо добавить нелинейные члены (например, X12) или другие переменные.

Для изменения спецификации модели используется кнопка Estimate в окне “Equation”.

3. РЕ-тест

Пусть имеется две значимых модели

где ly, lx1, lx2 – логарифмы соответственно рядов y, x1 и x2.

Для проведения РЕ-теста выполняются следующие шаги.

  1.  Строятся прогнозные значения для y и ly.

Для линейной модели (y) в окне “Equation” нажмите кнопку Forecast и в появившемся окне в поле “Forecast name” введите имя прогноза, например, yf. Нажмите ОК. В результате в рабочем файле появится прогнозный ряд yf, а в окне “Equation” – графики y и yf с оценками прогнозного качества модели.

Для логарифмической модели (ly) процедура построения прогнозных значений  (lyf) проводится аналогично.

  1.  Оцениваются модели

То есть в строке ввода формул последовательно вводятся

ls y c x1 x2 log(yf)-lyf,

ls ly c lx1 lx2 yf-exp(lyf).

  1.  Оценивается значимость коэффициентов при добавленных регрессорах в обеих моделях (рис. 6.4).

 

Рис. 6.4. Результаты PE-теста

Если оба коэффициента значимы (рис. 6.4) или оба незначимы, то ситуация неопределенная и выбирать модель необходимо другими методами.

Если в одной модели коэффициент при добавленном регрессоре значим, а в другой – незначим, то лучшей считается модель с незначимым коэффициентом.

Задания:

Исследуется зависимость зарплаты в Нидерландах от образования, пола и возраста. Исходные данные содержат информацию о 75 мужчинах и 75 женщинах, работавших на полную ставку (не менее 4 дней в неделю в 1997 г.). Данные получены на основании опроса. В исследование включены следующие переменные:

W – зарплата гульденов/час до вычета налогов,

AGE – возраст, лет,

ЕDUi, i=1..5 – уровень образования:

ЕDU1=1 – начальная школа или менее,

ЕDU2=1 – низшее ремесленное,

ЕDU3=1 – среднее,

ЕDU4=1 – высшее ремесленное,

ЕDU5=1 – университет.

Исходные данные находятся в файле lab 6.WF1.

  1.  Проведите анализ данных и подготовьте выборку к проведению эконометрического моделирования.
  2.  Постройте линейную и экспонециальную модели зависимости зарплаты от возраста, пола и уровня образования. Оцените их качество.
  3.  Используя тест Вальда, проверьте гипотезы о равном влиянии на зарплату некоторых уровней образования. При необходимости объедините переменные.
  4.  Используя RESET-тест, проверьте на функциональную форму модели. При необходимости добавьте нелинейные члены.
  5.  Проведите РЕ-тест для выбора наилучшей модели.
  6.  Проверьте ошибки регрессии наилучшей модели на гетероскедастичность и при необходимости скорректируйте их.
  7.  Интерпретируйте полученные результаты оценки регрессии.
  8.  Сохраните рабочий файл под именем «фамилия студента»_6.WF1.


СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ

  1.  Айвазян С.А. Прикладная статистика. Основы эконометрики. – М.: ЮНИТИ, 2005.
  2.  Афанасьев В.Н., Юзбашев М.М., Гуляева Т.И. Эконометрика.- М.: Финансы и статистика, 2006.
  3.  Бигильдеева Т.Б., Постников Е.А. Эконометрика. – Челябинск: Челяб. гос. ун-т, 2007 г. – 109 с.
  4.  Елисеева И.И. Практикум по эконометрике. – М.: Финансы и статистика, 2005.
  5.  Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов. - М.: ЮНИТИ-ДАНА, 2002.
  6.  Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. – 6-е изд., перераб. и доп. – М.: Дело, 2004.
  7.  Мхитарян М.С., Архипова М.Ю. Эконометрика. – М.: Московский государственный университет экономики, статистики и информатики, 2004.
  8.  Эконометрика: Учебник (под ред. И.И.Елисеевой). - М.: Финансы и статистика, 2005.


 

А также другие работы, которые могут Вас заинтересовать

682. Правонарушения. Понятия и виды правонарушения. Состав правонарушения. 97.5 KB
  Понятие правонарушения, его социологические и юридические признаки. Трудовые правонарушения по поводу выполнения трудового законодательства. В своей работе я последовательно рассмотрю понятие содержания правонарушения, начав с социологического определения и признаков, и подчеркну юридическое понятие и его составляющие. Также я детально изучу виды правонарушения, дав подробную. характеристику преступлению и проступку.
683. Исследование сетей Frame Relay 104.5 KB
  В ходе лабораторной ознакомились с сетями Frame Relay. Определили структуру сети Frame Relay согласно модели OSI Изучили связь структуры модели с назначением сети Frame Relay и областью ее применения, формат пакета канального уровня, методы достижения в сетях Frame Relay более высокой скорости, методы обеспечения безошибочной передачи в сетях Frame Relay, применение Frame Relay.
684. Информационные поисковые языки 101 KB
  Свойства информационных поисковых языков. Классификационные информационно–поисковые языки. Сопоставительный анализ информационно–поисковых языков. Обеспечения взаимодействия между различными (информационными, библиотечными и другими) системами.
685. Источники и субъекты налогового права. 104 KB
  Понятие и классификация субъектов налогового права. Правовой статус налогоплательщиков и плательщиков сборов, налоговых представителей. Банки как субъекты налогового права. Общая характеристика источников налогового права.
686. Разработка технологического процесса изготовления детали 100 KB
  Расчет режимов обработки и основного (машинного) времени. Выбор технологического оборудования и технологической оснастки. Определение припусков и операционных размеров. Разработка маршрутно-технологического процесса. Выбор вида заготовки и способа ее получения.
687. Нормализация условий труда при выполнении работы по приготовлению питательных сред для культуры бактерий Gluconacetobacter xylinus и последующий ее посев 74.5 KB
  Источники и причины проявления факторов опасного и вредного воздействия. Приготовление жидкой питательной среды на основе дрожжевого экстракта и глюкозы. Средства труда и технология выполняемой работы. Факторы опасного и вредного действия. Оценка класса и степени вредности условий труда.
688. Полупроводниковый диод 235 KB
  В данной расчетно-графической работе описываются параметры и характеристики диода Д18. В работе представлены характеристики диода, его паспортные параметры, рисунок конструкции, семейство ВАХ. Также имеются расчеты и графики зависимостей некоторых параметров.
689. Финансовый менеджмент, его основы и содержание 117 KB
  Сущность и функции финансов предприятий. Зарождение и эволюция финансового менеджмента. Финансовый механизм предприятия. Сущность, цель и задачи финансового менеджмента. Функциональное содержание финансового менеджмента.
690. Экспрессия гена. Трансляция 114.5 KB
  Регуляция экспрессии генов на уровне транскрипции у прокариот. Основные положения процесса экспрессии генов. Инициация у эукариот. Некоторые общие особенности процесса трансляции. Аппарат экспрессии генов и его логика.