42166

ВЫБОР РЕГРЕССИОННОЙ МОДЕЛИ

Лабораторная работа

Физика

Ранее предполагалось что мы имеем дело с правильной спецификацией модели то есть считалось что зависимая переменная y регрессоры X и оцениваемые параметры β связаны соотношением y = Xβ ε и выполняются условия ГауссаМаркова. Рассматривается два основных случая: В оцениваемой модели отсутствует часть независимых переменных имеющихся в истинной модели исключение существенных переменных: истинная модель: y = Xβ Zγ ε длинная регрессия; оцениваемая модель: y = Xβ ε короткая регрессия. В оцениваемой модели присутствуют...

Русский

2013-10-27

242.5 KB

42 чел.

Лабораторная работа №6

ВЫБОР РЕГРЕССИОННОЙ МОДЕЛИ

Сам выбор регрессоров и вида модели называется спецификацией модели. Ранее предполагалось, что мы имеем дело с правильной спецификацией модели, то есть считалось, что зависимая переменная y, регрессоры X и оцениваемые параметры β связаны соотношением

y = + ε

и выполняются условия Гаусса-Маркова.

При этом часто утверждается, что данное соотношение описывает «процесс, порождающий данные» или что он является «истинной моделью». Как правило, на практике истинная модель неизвестна, исследователь оценивает модель, которая лишь приближенно соответствует процессу, порождающему данные. Поэтому возникает естественный вопрос о соотношении между МНК-оценками параметров в истинной и выбранной моделях.

Рассматривается два основных случая:

  1.  В оцениваемой модели отсутствует часть независимых переменных, имеющихся в истинной модели (исключение существенных переменных):

истинная модель:  y = + + ε (длинная регрессия);

оцениваемая модель:  y = + ε  (короткая регрессия).

Здесь Xn×k – матрица; Zn×l – матрица; yn×1 – вектор наблюдений зависимой переменной; βk×1, γl×1 – векторы коэффициентов.

В этом случае оценка, полученная в короткой регрессии, в общем случае смещенная, но обладает меньшей вариацией.

  1.  В оцениваемой модели присутствуют независимые переменные, которых нет в истинной модели (включение несущественных переменных):

истинная модель:   y = + ε  (короткая регрессия);

оцениваемая модель:  y = + + ε (длинная регрессия).

В этом случае оценка  несмещенная, но дисперсия оценки увеличивается от включения в модель несущественных переменных.

Основным критерием выбора вида модели является ее экономический смысл, а не подгонка данных под модель.

1. Корректировка вида модели

«Улучшить» вид построенной множественной линейной регрессии можно используя следующие тесты.

Тест Вальда

Проводится для проверки гипотез равенства коэффициентов какому-либо значению или соотношения коэффициентов между собой. Например, β2=0 или β3=2·β4.

Тест на функциональную форму

Тестом на ошибку линейной спецификации модели является RESET-тест. Идея этого теста заключается в том, что если модель  верна, то добавление нелинейных функций  не должно помогать объяснять yt. В частности, можно добавлять степени:

               (1)

Тестируется гипотеза Н0: α2 = … = αm с помощью F-статистки. Обычно тест применяется при небольших значениях m = 2,3,4. Однако он может отвергать нулевую гипотезу не потому, что в истинной модели есть нелинейные члены, а в силу того, что в уравнении пропущена переменная, влияние которой частично учтено нелинейными членами в (1).

Часто включение в модель квадрата переменной x обусловлено тем, что влияние x на y в какой-то момент достигает максимума или минимума и форма взаимосвязи меняется. Например, рост заработной платы в зависимости от возраста замедляется ближе к пенсионному возрасту, а с какого-то момента (возраста) начинает снижаться. Поэтому вводится дополнительная переменная x2 (возраст в квадрате).

 

2. Выбор конкурирующих моделей

Если в процессе моделирования было получено две значимых модели, качественно описывающих исследуемый процесс, то проводятся различные тесты на выбор лучшей модели.

F-тест

Пусть имеется две модели:

модель А: ,

модель В: .

Обе модели содержат как одинаковые, так и различные правые части:

.

Согласно этому рассматриваются две регрессии:

,

.

Далее проверяются две гипотезы:

H0: δA = 0 – если не отвергается, то и не отвергается модель В.

H0: δB = 0 – если не отвергается, то и не отвергается модель А.

Если обе гипотезы либо принимаются, либо отвергаются, то ситуация остается неопределенной.

J-тест

Рассматривается частный случай моделей А и В:

.  (2)

При δ = 0 эта модель совпадает с моделью А, а при δ = 1 – с моделью В. Однако это уравнение невозможно оценить, поскольку параметры β, γ, δ не могут быть идентифицированы одновременно. Поэтому сначала оценивается параметр γ, а затем оценка  подставляется в уравнение (2):

.  (3)

Здесь  – прогнозные значения, полученные по модели В, а . Из уравнения (3) можно получить оценку . Если нулевая гипотеза Н0: δ=0 не отвергается, то склоняемся к выбору модели А. Аналогичную процедуру можно проделать, взяв за нулевую гипотезу модель В. В двух из четырех возможных исходов теста, когда обе модели отвергаются или обе модели не отвергаются, ситуация остается неопределенной.

РЕ-тест

Применяется, когда в левой части сравниваемых уравнений – различные формы зависимой переменной, например, линейная и полулогарифмическая:

,

.

Коэффициент детерминации R2 здесь не может применяться для сравнения и выбора лучшей модели.

Содержательный смысл PE-теста заключается в следующем: улучшится ли модель при включении в нее прогноза конкурирующей модели.

Реализация РЕ-теста состоит в следующем: оцениваются обе модели МНК и получаются соответствующие прогнозные значения  и . Далее оцениваются следующие модели:

,

.

Затем тестируются гипотезы:

H0: δLIN = 0 – если не отвергается, то и не отвергается линейная модель.

H0: δLOG = 0 – если не отвергается, то и не отвергается полулогарифмическая модель. Как и ранее, возможны четыре исхода теста.

РЕ-тест может применяться в значительно более общей ситуации.

Выбор регрессионной модели в EViews 5.1.

1. Тест Вальда

Для проведения теста Вальда в EViews необходимо в окне “Equation” выбрать View / Coefficient Tests / WaldCoefficient Restrictions и в появившемся окне “Wald Test” ввести проверяемую гипотезу (рис. 6.1) и нажать ОК.

Рис. 6.1. Тест Вальда

На рис. 6 параметр С(4) соответствует 4-му по порядку коэффициенту в окне “Equation”, а параметр С(5) соответственно – 5-му коэффициенту. Проверятся гипотеза о равном влиянии переменных при коэффициентах С(4) и С(5) на результирующую переменную.

В результате теста в окне “Equation”появится следующая информация (рис. 6.2).

Рис. 6.2. Результаты теста Вальда

Если полученное значение Probability < 0.05 (см. рис. 6.2), то гипотеза отвергается. В данном примере влияние переменных при коэффициентах С(4) и С(5) на результирующую переменную неравное.

2. Тест на функциональную форму (RESET-тест):

В окне “Equation” для выбранной модели выбирается View / Stability Tests / Ramsey RESET Test…, в появившемся окне “RESET Specification” в поле “Number of fitted” вводится значение m–1 (степень нелинейного члена минус 1), например, 2. В результате в окне “Equation” появятся результаты теста (рис. 6.3).

Рис. 6.3. Результаты проведения RESET-теста для m-1=2

Если значение Рrob. F < 0.05 (рис. 6.3), то это указывает на ошибочную спецификацию модели и в уравнение необходимо добавить нелинейные члены (например, X12) или другие переменные.

Для изменения спецификации модели используется кнопка Estimate в окне “Equation”.

3. РЕ-тест

Пусть имеется две значимых модели

где ly, lx1, lx2 – логарифмы соответственно рядов y, x1 и x2.

Для проведения РЕ-теста выполняются следующие шаги.

  1.  Строятся прогнозные значения для y и ly.

Для линейной модели (y) в окне “Equation” нажмите кнопку Forecast и в появившемся окне в поле “Forecast name” введите имя прогноза, например, yf. Нажмите ОК. В результате в рабочем файле появится прогнозный ряд yf, а в окне “Equation” – графики y и yf с оценками прогнозного качества модели.

Для логарифмической модели (ly) процедура построения прогнозных значений  (lyf) проводится аналогично.

  1.  Оцениваются модели

То есть в строке ввода формул последовательно вводятся

ls y c x1 x2 log(yf)-lyf,

ls ly c lx1 lx2 yf-exp(lyf).

  1.  Оценивается значимость коэффициентов при добавленных регрессорах в обеих моделях (рис. 6.4).

 

Рис. 6.4. Результаты PE-теста

Если оба коэффициента значимы (рис. 6.4) или оба незначимы, то ситуация неопределенная и выбирать модель необходимо другими методами.

Если в одной модели коэффициент при добавленном регрессоре значим, а в другой – незначим, то лучшей считается модель с незначимым коэффициентом.

Задания:

Исследуется зависимость зарплаты в Нидерландах от образования, пола и возраста. Исходные данные содержат информацию о 75 мужчинах и 75 женщинах, работавших на полную ставку (не менее 4 дней в неделю в 1997 г.). Данные получены на основании опроса. В исследование включены следующие переменные:

W – зарплата гульденов/час до вычета налогов,

AGE – возраст, лет,

ЕDUi, i=1..5 – уровень образования:

ЕDU1=1 – начальная школа или менее,

ЕDU2=1 – низшее ремесленное,

ЕDU3=1 – среднее,

ЕDU4=1 – высшее ремесленное,

ЕDU5=1 – университет.

Исходные данные находятся в файле lab 6.WF1.

  1.  Проведите анализ данных и подготовьте выборку к проведению эконометрического моделирования.
  2.  Постройте линейную и экспонециальную модели зависимости зарплаты от возраста, пола и уровня образования. Оцените их качество.
  3.  Используя тест Вальда, проверьте гипотезы о равном влиянии на зарплату некоторых уровней образования. При необходимости объедините переменные.
  4.  Используя RESET-тест, проверьте на функциональную форму модели. При необходимости добавьте нелинейные члены.
  5.  Проведите РЕ-тест для выбора наилучшей модели.
  6.  Проверьте ошибки регрессии наилучшей модели на гетероскедастичность и при необходимости скорректируйте их.
  7.  Интерпретируйте полученные результаты оценки регрессии.
  8.  Сохраните рабочий файл под именем «фамилия студента»_6.WF1.


СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ

  1.  Айвазян С.А. Прикладная статистика. Основы эконометрики. – М.: ЮНИТИ, 2005.
  2.  Афанасьев В.Н., Юзбашев М.М., Гуляева Т.И. Эконометрика.- М.: Финансы и статистика, 2006.
  3.  Бигильдеева Т.Б., Постников Е.А. Эконометрика. – Челябинск: Челяб. гос. ун-т, 2007 г. – 109 с.
  4.  Елисеева И.И. Практикум по эконометрике. – М.: Финансы и статистика, 2005.
  5.  Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов. - М.: ЮНИТИ-ДАНА, 2002.
  6.  Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учеб. – 6-е изд., перераб. и доп. – М.: Дело, 2004.
  7.  Мхитарян М.С., Архипова М.Ю. Эконометрика. – М.: Московский государственный университет экономики, статистики и информатики, 2004.
  8.  Эконометрика: Учебник (под ред. И.И.Елисеевой). - М.: Финансы и статистика, 2005.


 

А также другие работы, которые могут Вас заинтересовать

76366. МПД-контроль 300.19 KB
  Технологическая схема МПД контроля. Дефектоскопические средства: приборы средства контроля материалы. Размагничивание изделий после контроля. Паспортизация результатов МПДконтроля.
76367. Акустические методы НК 277.5 KB
  Природа и свойства ультразвуковых колебаний. Распространение упругих колебаний в сплошной среде представляет собой волнообразный процесс. Диапазоны упругих колебаний в материальных средах Физическая природа упругих колебаний одинакова во всем диапазоне частот. Свойства упругих колебаний...
76368. Базисная теория таможенного тарифа 82.5 KB
  Базисная теория таможенного тарифа Несмотря на то что свободная торговля приводит к возрастанию экономического благосостояния всех стран как экспортеров так и импортеров на практике международная торговля практически нигде и никогда не развивалась действительно свободно без вмешательства государства. Инструменты используемые государством для регулирования международной торговли можно разделить на тарифные основанные на использовании таможенного тарифа и нетарифные квоты лицензии субсидии демпинг и т. При введении тарифа...
76369. Нетарифные методы торговой политики 90 KB
  Если правительство хочет ограничить объем импорта и устанавливает квоту размером Q то общее предложение зерна на внутреннем рынке с учетом импорта может быть представлено в виде кривой Sd Q. Таким образом в результате введения импортной квоты возникают чистые потери для страны в целом равные области b с то есть результаты воздействия квоты и тарифа на уровень благосостояние идентичны конечно это справедливо если объем лицензированного импорта меньше чем спрос на импорт на внутреннем рынке. Почему же в этом случае государство часто...
76370. Международная экономическая интеграция. Формы (уровни) международной экономической интеграции 260.5 KB
  Борьба за упрочение своего экономического положения побуждает страны к образованию различных интеграционных объединений. Партнеры по объединению получают определенные преференции по сравнению с другими странами но платят за это ответными обязательствами по отношению к партнерам. Международная экономическая интеграция это процесс хозяйственнополитического объединения стран на основе глубоких устойчивых взаимосвязей и разделения труда между национальными хозяйствами. На микроуровне этот процесс идет через взаимодействие отдельных фирм...
76371. Международное движение капитала. Сущность и формы движения капитала 121 KB
  Международное движение капитала Сущность и формы движения капитала Вывоз капитала зарубежное инвестирование представляет собой процесс изъятия части капитала из национального оборота в данной стране и перемещение его в товарной или денежной форме в производственный процесс и обращение другой страны. Важнейшими причинами вывоза капитала являются: 1. Более низкие экологические стандарты в принимающей стране чем в странедоноре капитала. В зависимости от собственника вывоз капитала делится на 3 вида: 1 частный вывоз капитала крупные...
76372. Международная миграция трудовых ресурсов. Проблемы оптимального размещения трудовых ресурсов в мировой экономике 106.5 KB
  Проблемы оптимального размещения трудовых ресурсов в мировой экономике Миграция рабочей силы переселение трудоспособного населения из одних государств в другие сроком более чем на год вызванное причинами экономического и иного характера. Различают внутреннюю миграцию рабочей силы происходящую между регионами одного государства и внешнюю миграцию затрагивающую несколько стран. силы – утечка мускулов перемещение высококвалифицированной раб. силы – утечка умов Первая форма получила свое развитие еще при рабовладельческом строе...
76373. Международные валютно-финансовые и кредитные отношения 87 KB
  Цена единицы национальной валюты выраженная в единицах иностранной валюты называется валютный обменный курс exchnge rte. Валютный курс играет важную роль в развитии международной торговли и движении капитала. Таким образом с помощью валютных курсов производители и потребители приводят цены на товары в сопоставимый вид и формируют на этой основе международные потоки товаров. Фиксирование курса национальной денежной единицы по отношению к иностранным денежным единицам принято называть валютной котировкой currency quottion.
76374. Платежный баланс. Понятие и структура платежного баланса 75.5 KB
  В этом случае итальянская фирма осуществила продажу а Сбербанк – покупку российских активов банковского депозита на сумму в 1000 долл и эта сделка будет отражена в российских счетах движения капитала. Такая операция создает две компенсирующие бухгалтерские записи в платежном балансе РФ: Кредит Дебет Покупка принтера текущий счет российский импорт 1000 долл Продажа банковского депозита осуществляемая Сбербанком счет движения капитала экспорт российских активов 1000 долл 2. Поэтому когда вы расплачиваетесь за свой обед за...