42143

ПАРНАЯ РЕГРЕССИЯ

Лабораторная работа

Информатика, кибернетика и программирование

модель вида yi = 0 1 xi i где yi – значение зависимой переменной для наблюдения i xi – значение независимой переменной для наблюдения i 0 и 1 – коэффициенты регрессии εi – значение случайной ошибки для наблюдения i n – число наблюдений. Оценки коэффициентов парной линейной регрессии и определяются методом наименьших квадратов МНК. Оценки коэффициентов уравнения регрессии полученные МНК могут обладать следующими свойствами: несмещенность состоятельность эффективность. Содержание МНК свойств оценок полученных...

Русский

2013-10-27

338.5 KB

33 чел.

Лабораторная работа №3

ПАРНАЯ РЕГРЕССИЯ

Эконометрическое исследование проводится на основе выборочных данных, которые отбираются из части всей совокупности по определенным правилам выборки и обеспечивают получение данных, характеризующих всю совокупность в целом.

Наиболее простым и распространенным предположением о взаимосвязи некоторого экономического показателя от фактора влияющего на него является линейная зависимость.

Парная линейная регрессия представляет собой линейную зависимость между двумя переменными – y и x, т.е. модель вида

yi = 0 + 1 xi + i, ,

где  yi – значение зависимой переменной для наблюдения i,

xi – значение независимой переменной для наблюдения i,

0 и 1  – коэффициенты регрессии,

εi – значение случайной ошибки для наблюдения i,

n – число наблюдений.

Оценки коэффициентов парной линейной регрессии  и  определяются методом наименьших квадратов (МНК).

Оценки коэффициентов уравнения регрессии, полученные МНК, могут обладать следующими свойствами: несмещенность, состоятельность эффективность.

МНК требует выполнения условий Гаусса–Маркова, которые гарантируют состоятельность, несмещенность и эффективность найденных оценок.

Содержание МНК, свойств оценок полученных МНК и условий Гаусса-Маркова рассмотрено в лекциях!!!

Оценка качества парной линейной регрессии проводится определением следующих критериев.

1. Стандартные ошибки оценок – средние квадратические отклонения коэффициентов регрессии от их истинных значений.

,

Чем меньше стандартная ошибка, тем точнее оценка коэффициента.

2. Доверительные интервалы коэффициентов - показывают, что истинное значение параметра с вероятностью 1- находится в данных пределах

,

где tкр – табличное (критическое) значение t-критерия Стьюдента для уровня значимости γ и числа степеней свободы n-2 (n – число наблюдений). 

При числе степеней свободы более 200

tкр = 1,645 для γ = 10%;

tкр = 1,96 для γ = 5%;

tкр = 2,576 для γ = 1%.

Чем меньше доверительный интервал относительно коэффициента, тем точнее полученная оценка.

3. Значимость коэффициентов регрессии 

Коэффициент значим, если есть достаточно высокая вероятность того, что его истинное значение отлично от нуля.

Проверяется по t-критерию Стьюдента: . Если , то коэффициент статистически значим с 1- γ уровнем доверия, иначе – незначим.

4. Коэффициент детерминации R2 показывает степень соответствия найденного уравнения фактическим данным (качество подгонки уравнения)

,

где  – теоретические значения зависимой переменой yi,  – выборочная средняя зависимой переменой yi.

R2 изменяется в пределах [0;1] и чем ближе его значение к единице, тем лучше модель согласуется с выборочными данными.

Например, если R2 =0,75, то говорят, что на 75% изменение y описывается полученным уравнением и влиянием переменной x, а 25% изменения y – следствие влияния неучтенных в уравнении регрессии факторов.

Коэффициент детерминации не используется, если в уравнении отсутствует константа 0 или его значения выходят за пределы [0;1].

5. Стандартная ошибка регрессии Se является оценкой величины квадрата ошибки, приходящейся на одну степень свободы модели

Чем меньше стандартная ошибка, тем лучше качество модели.

6. Значимость уравнения регрессии 

Уравнение значимо, если есть достаточно высокая вероятность того, что существует хотя бы один коэффициент, отличный от нуля.

Проверяется по F-критерию Фишера

.

Если F>Fкр, то уравнение статистически значимо, иначе – незначимо.

7. Средняя абсолютная процентная ошибка (ошибка аппроксимации) – показывает в процентах среднее отклонение расчетных значений зависимой переменной  от фактических значений yi 

Если A ≤ 10%, то качество подгонки уравнения считается хорошим. Чем меньше значение A, тем лучше.

Экономическая интерпретация парной линейной регрессии

Параметр  показывает, насколько изменится среднее значение Y при увеличении X на единицу.

Параметр  формально является значением Y при  X = 0. Он может не иметь экономического содержания.

Использование при моделировании логарифмов переменных

Часто при эконометрическом моделировании логарифмируют как зависимую, так и независимую переменные. Это делается для того, чтобы перейти при интерпретации коэффициентов к процентам, что с экономической точки зрения является более верным.

Основные виды логарифмических моделей:

  1.  .

Экономический смысл параметра β1: при увеличении x на единицу переменная y в среднем увеличится примерно на 100·β1%.

  1.  .

Экономический смысл параметра β1: для увеличения y на единицу необходимо увеличить x примерно на .

  1.  .

Экономический смысл параметра β1: если значение переменной x увеличить на 1%, то y увеличится на β1%.

Построение уравнения парной регрессии в EViews 5.1

Для построения уравнения парной регрессии необходимо иметь два ряда выборочных данных характеризующих значения зависимой и независимой переменных.

1. Оценка параметров модели методом наименьших квадратов

В EViews оценка линейной модели парной регрессии осуществляется двумя способами.

1) Создание объекта Equation. Для этого выбирается меню Objects / New Object…, в появившемся окне выбирается тип объекта Equation, затем OK. В появившемся окне “Equation Estimation” вкладке Specification вводится через пробелы зависимая переменная, константа (с), независимая переменная (рис. 2.1). Например, price c totsq. Здесь price – зависимая переменная, c – константа, totsq – независимая переменная.

Рис. 2.1. Окно “Equation Estimation” для оценки парной линейной регрессии

2) ввод команды ls в строке ввода формул следующим образом:

ls зависимая переменная, константа (с), независимая переменная;

например, ls price c totsq.

В результате оценки появится окно Equation (рис. 2.2).

В данном окне (рис. 2.2) поле Coefficient – полученные оценки коэффициентов. То есть для данного примера уравнение регрессии будет выглядеть следующим образом: PRICE=42.535+34.29·TOTSQ.

Рис. 2.2. Результаты оценки модели парной линейной регрессии

Для просмотра оцененного уравнения регрессии в окне “Equation” необходимо выбрать меню View / Representations. В результате появится следующее окно (рис. 2.3).

Рис. 2.3. Просмотр уравнения парной линейной регрессии

На рис. 2.3 в самой нижней строке представлено оцененное уравнение регрессии.

Для возврата к результатам оценки уравнения регрессии в окне “Equation” необходимо выбрать меню View / Estimation Output.

Для сохранения результатов оценки нажмите в окне “Equation” кнопку «Name» и введите имя сохраняемого уравнения.

2. Оценка качества парной регрессии по окну Equation (рис. 2.2):

1. Стандартные ошибки оценок – поле Std. Error;

2. Доверительные интервалы коэффициентов – определяются с использованием полей Coefficient и Std. Error, а также табличных значений t-критерия Стьюдента tкр (см. выше п. 2 теоретической части);

3. Значимость коэффициентов регрессии – поле

t-Statistic (значения t-статистик для коэффициентов) сравнивается с tкр либо поле

Prob. (вероятность того, что гипотеза о незначимости коэффициента верна) сравнивается с уровнем значимости γ: если Prob.<0.01 – коэффициент значим с надежностью 99%, если Prob.<0.05 – коэффициент значим с надежностью 95%;

4. Коэффициент детерминации R2 – поле R-squared;

5. Стандартная ошибка регрессии Se – поле S.E. of regression;

6. Значимость уравнения регрессии – поле

F-statistic (значение F-критерия Фишера для уравнения регрессии) сравнивается с табличным (критическим) значением F-критерия Фишера, либо поле

Prob(F-statistic) (вероятность того, что гипотеза о незначимости уравнения верна) сравнивается с уровнем значимости γ: если Prob.<0.01 – уравнение значимо с надежностью 99%, если Prob.<0.05 – уравнение значимо с надежностью 95%.

7. Средняя абсолютная процентная ошибка

Для определения средней абсолютной процентной ошибки в окне “Equation ” нажмите кнопку , в появившемся окне в поле Forecast name: введите имя ряда теоретических значений зависимой переменной или оставьте по умолчанию (рис. 2.4). Нажмите ОК.

Рис. 2.4. Построение ряда теоретических значений зависимой переменной

В результате в окне рабочего файла появится ряд теоретических значений зависимой переменной (pricef), а в окне “Equation ” отобразятся графики фактических и теоретических значений зависимой переменной (рис. 2.5). В таблице справа значение поля Mean Abs. Percent Error и есть значение средней абсолютной процентной ошибки (рис. 2.5).

Рис. 2.5. Определение средней абсолютной процентной ошибки

На рис. 2.5 значение средней абсолютной процентной ошибки равно А=1,62%, что является достаточно малым значением и указывает о хорошем качестве подгонки уравнения.

Чтобы проверить качество построенного уравнения регрессии можно также провести анализ фактических, теоретических значений зависимой переменной и остатков регрессии. Для этого в окне Equation (рис. 2.2) необходимо выбрать меню View / Actual,Fitted,Residual и выбрать один из пунктов:

  •  Actual, Fitted, Residual Table – таблица: факт, прогноз, остатки  плюс график остатков;
  •  Actual, Fitted, Residual Graphграфик: факт, прогноз, остатки (рис. 2.6)

Рис. 2.6. График фактических (Actual), прогнозных данных (Fitted) и остатков регрессии (Residual)

  •  Residual Graph – график остатков (рис. 2.7);

Рис. 2.7. График остатков регрессии

  •  Standardized Residual Graph – график стандартизированных остатков.

Качество уравнения считается хорошим, если графики фактических и прогнозных данных (рис. 2.6) близки, а график остатков показывает маленькие значения относительно значений зависимой переменной.

Оценка логарифмических моделей

  1.  Оценка модели :

ls log(y) c x

  1.  Оценка модели :

ls y c log(x)

  1.  Оценка модели :

ls log(y) c log(x)

Задания:

Исследуется зависимость между заработной платой, опытом человека и уровнем его образования. Предполагается линейная зависимость результирующего и влияющих признаков. Необходимо определить, какой из двух влияющих признаков является более существенным для объяснения уровня заработной платы, если можно использовать только уравнение парной регрессии.

Исходные данные по вариантам находятся в файле lab 3.xls

  1.  Проведите анализ данных и подготовьте выборку к проведению эконометрического моделирования.
  2.  Выберите один из объясняющих факторов и выполните следующие задания для одного уравнения регрессии.
  3.  По исходным данным найдите оценки коэффициентов регрессии β0 и β1, используя МНК.
  4.  Постройте в тетради доверительные интервалы для β0 и β1 с уровнем значимости 1%; 5% и 10%.
  5.  Оцените качество построенной модели.
  6.  Дайте экономическую интерпретацию коэффициентов.
  7.  Постройте линейное уравнение регрессии для второй влияющей величины. Оцените качество уравнения.
  8.  Сравните полученные модели и выберите лучшую по качеству объяснения зависимого признака.
  9.  Сохраните рабочий файл в вашем разделе под именем «фамилия студента»_3.WF1.

Дополнительное задание

  1.  Для выбранных величин постройте логарифмические модели зависимости. Оцените качество этих моделей. Сравните качество, по отношению к обычной линейной модели. Дайте экономическую интерпретацию.

  1.  

 

А также другие работы, которые могут Вас заинтересовать

61100. РЕЧЕННЯ ДВОСКЛАДНІ Й ОДНОСКЛАДНІ, ПРОСТІ І СКЛАДНІ 1.82 MB
  Правопис: розділові знаки в кінці речення повторення. Використовуючи подане висловлювання і власні знання розгорнути зміст останнього речення. Усно схарактеризувати речення в тексті за наявністю головних і другорядних членів.
61101. Політичний, соціальний устрій та господарське життя Київської Русі 17.65 MB
  Мета: формувати в учнів знання про політичний та соціальний устрій, господарське життя Київської, Русі; удосконалювати навички роботи з історичними джерелами та на їх основі аналізувати історичні факти...
61102. Культурне життя Київської Русі доби розквіту 66.5 KB
  Мета: ознайомити учнів з основними досягненнями культури періоду Київської Русі; дати уявлення про досягнення в літературі, літописанні, іконописі, архітектурі; вчити учнів працювати з текстом підручників, ілюстраціями, розвивати в учнів уяву...
61103. ПОРЯДОК СЛІВ У РЕЧЕННІ. ЛОГІЧНИЙ НАГОЛОС 27.66 KB
  Мета: дати восьмикласникам поняття про прямий і зворотний порядок слів у реченні, навчати дотримуватися логічного наголосу при інтонуванні речень; розвивати організаційно-контрольні вміння виконувати спеціальні спостереження над мовним матеріалом; формувати загально-пізнавальні вміння правильно інтонувати різні за метою висловлювання речення...
61104. Утворення Єгипетської держави 59 KB
  Мета: на конкретному історичному матеріалі показати процес утворення Давньоєгипетської держави; розкрити суть понять: ном номарх держава фараон. Основні поняття: Єгипет Африка Ніл дельта Середземне море...
61105. КОНТРОЛЬНЕ АУДІЮВАННЯ ХУДОЖНЬОГО ТЕКСТУ 52 KB
  Мета: оцінити рівень орфографічної та пунктуаційної грамотності восьмикласників: правильно писати слова на вивчені орфографічні правила та слова визначені для запам’ятовування; ставити розділові знаки відповідно до опрацьованих правил пунктуації...
61106. Тематичне оцінювання з теми “Виникнення та розквіт Київської Русі” 66 KB
  Мета. Закріпити та поглибити знання учнів з історії виникнення та розквіту Київської Русі. Узагальнити основні поняття та події. Оцінити знання учнів з теми. Розвивати вміння ідентифікувати історичні явища за їх типовими ознаками.
61107. Господарське і повсякденне життя. Суспільство 52 KB
  Мета: ознайомити учнів із природними умови та розташуванням Давнього Єгипту, основними заняттями давніх єгиптян; простежити взаємозвязок між природними умовами і господарським розвитком Давнього Єгипту.
61108. ПІДМЕТ, СПОСОБИ ЙОГО ВИРАЖЕННЯ 867.65 KB
  Поглибити знання учнів про підмет як головний член речення; сформувати вміння виділяти підмети в двоскладному реченні, визначати способи їх вираження; удосконалити вміння конструювати речення з різними за способом вираження підметами; за допомогою мовленнєвокомунікативного дидактичного матеріалу поглибити світогляд восьмикласників щодо загальнолюдських цінностей.