42143

ПАРНАЯ РЕГРЕССИЯ

Лабораторная работа

Информатика, кибернетика и программирование

модель вида yi = 0 1 xi i где yi – значение зависимой переменной для наблюдения i xi – значение независимой переменной для наблюдения i 0 и 1 – коэффициенты регрессии εi – значение случайной ошибки для наблюдения i n – число наблюдений. Оценки коэффициентов парной линейной регрессии и определяются методом наименьших квадратов МНК. Оценки коэффициентов уравнения регрессии полученные МНК могут обладать следующими свойствами: несмещенность состоятельность эффективность. Содержание МНК свойств оценок полученных...

Русский

2013-10-27

338.5 KB

33 чел.

Лабораторная работа №3

ПАРНАЯ РЕГРЕССИЯ

Эконометрическое исследование проводится на основе выборочных данных, которые отбираются из части всей совокупности по определенным правилам выборки и обеспечивают получение данных, характеризующих всю совокупность в целом.

Наиболее простым и распространенным предположением о взаимосвязи некоторого экономического показателя от фактора влияющего на него является линейная зависимость.

Парная линейная регрессия представляет собой линейную зависимость между двумя переменными – y и x, т.е. модель вида

yi = 0 + 1 xi + i, ,

где  yi – значение зависимой переменной для наблюдения i,

xi – значение независимой переменной для наблюдения i,

0 и 1  – коэффициенты регрессии,

εi – значение случайной ошибки для наблюдения i,

n – число наблюдений.

Оценки коэффициентов парной линейной регрессии  и  определяются методом наименьших квадратов (МНК).

Оценки коэффициентов уравнения регрессии, полученные МНК, могут обладать следующими свойствами: несмещенность, состоятельность эффективность.

МНК требует выполнения условий Гаусса–Маркова, которые гарантируют состоятельность, несмещенность и эффективность найденных оценок.

Содержание МНК, свойств оценок полученных МНК и условий Гаусса-Маркова рассмотрено в лекциях!!!

Оценка качества парной линейной регрессии проводится определением следующих критериев.

1. Стандартные ошибки оценок – средние квадратические отклонения коэффициентов регрессии от их истинных значений.

,

Чем меньше стандартная ошибка, тем точнее оценка коэффициента.

2. Доверительные интервалы коэффициентов - показывают, что истинное значение параметра с вероятностью 1- находится в данных пределах

,

где tкр – табличное (критическое) значение t-критерия Стьюдента для уровня значимости γ и числа степеней свободы n-2 (n – число наблюдений). 

При числе степеней свободы более 200

tкр = 1,645 для γ = 10%;

tкр = 1,96 для γ = 5%;

tкр = 2,576 для γ = 1%.

Чем меньше доверительный интервал относительно коэффициента, тем точнее полученная оценка.

3. Значимость коэффициентов регрессии 

Коэффициент значим, если есть достаточно высокая вероятность того, что его истинное значение отлично от нуля.

Проверяется по t-критерию Стьюдента: . Если , то коэффициент статистически значим с 1- γ уровнем доверия, иначе – незначим.

4. Коэффициент детерминации R2 показывает степень соответствия найденного уравнения фактическим данным (качество подгонки уравнения)

,

где  – теоретические значения зависимой переменой yi,  – выборочная средняя зависимой переменой yi.

R2 изменяется в пределах [0;1] и чем ближе его значение к единице, тем лучше модель согласуется с выборочными данными.

Например, если R2 =0,75, то говорят, что на 75% изменение y описывается полученным уравнением и влиянием переменной x, а 25% изменения y – следствие влияния неучтенных в уравнении регрессии факторов.

Коэффициент детерминации не используется, если в уравнении отсутствует константа 0 или его значения выходят за пределы [0;1].

5. Стандартная ошибка регрессии Se является оценкой величины квадрата ошибки, приходящейся на одну степень свободы модели

Чем меньше стандартная ошибка, тем лучше качество модели.

6. Значимость уравнения регрессии 

Уравнение значимо, если есть достаточно высокая вероятность того, что существует хотя бы один коэффициент, отличный от нуля.

Проверяется по F-критерию Фишера

.

Если F>Fкр, то уравнение статистически значимо, иначе – незначимо.

7. Средняя абсолютная процентная ошибка (ошибка аппроксимации) – показывает в процентах среднее отклонение расчетных значений зависимой переменной  от фактических значений yi 

Если A ≤ 10%, то качество подгонки уравнения считается хорошим. Чем меньше значение A, тем лучше.

Экономическая интерпретация парной линейной регрессии

Параметр  показывает, насколько изменится среднее значение Y при увеличении X на единицу.

Параметр  формально является значением Y при  X = 0. Он может не иметь экономического содержания.

Использование при моделировании логарифмов переменных

Часто при эконометрическом моделировании логарифмируют как зависимую, так и независимую переменные. Это делается для того, чтобы перейти при интерпретации коэффициентов к процентам, что с экономической точки зрения является более верным.

Основные виды логарифмических моделей:

  1.  .

Экономический смысл параметра β1: при увеличении x на единицу переменная y в среднем увеличится примерно на 100·β1%.

  1.  .

Экономический смысл параметра β1: для увеличения y на единицу необходимо увеличить x примерно на .

  1.  .

Экономический смысл параметра β1: если значение переменной x увеличить на 1%, то y увеличится на β1%.

Построение уравнения парной регрессии в EViews 5.1

Для построения уравнения парной регрессии необходимо иметь два ряда выборочных данных характеризующих значения зависимой и независимой переменных.

1. Оценка параметров модели методом наименьших квадратов

В EViews оценка линейной модели парной регрессии осуществляется двумя способами.

1) Создание объекта Equation. Для этого выбирается меню Objects / New Object…, в появившемся окне выбирается тип объекта Equation, затем OK. В появившемся окне “Equation Estimation” вкладке Specification вводится через пробелы зависимая переменная, константа (с), независимая переменная (рис. 2.1). Например, price c totsq. Здесь price – зависимая переменная, c – константа, totsq – независимая переменная.

Рис. 2.1. Окно “Equation Estimation” для оценки парной линейной регрессии

2) ввод команды ls в строке ввода формул следующим образом:

ls зависимая переменная, константа (с), независимая переменная;

например, ls price c totsq.

В результате оценки появится окно Equation (рис. 2.2).

В данном окне (рис. 2.2) поле Coefficient – полученные оценки коэффициентов. То есть для данного примера уравнение регрессии будет выглядеть следующим образом: PRICE=42.535+34.29·TOTSQ.

Рис. 2.2. Результаты оценки модели парной линейной регрессии

Для просмотра оцененного уравнения регрессии в окне “Equation” необходимо выбрать меню View / Representations. В результате появится следующее окно (рис. 2.3).

Рис. 2.3. Просмотр уравнения парной линейной регрессии

На рис. 2.3 в самой нижней строке представлено оцененное уравнение регрессии.

Для возврата к результатам оценки уравнения регрессии в окне “Equation” необходимо выбрать меню View / Estimation Output.

Для сохранения результатов оценки нажмите в окне “Equation” кнопку «Name» и введите имя сохраняемого уравнения.

2. Оценка качества парной регрессии по окну Equation (рис. 2.2):

1. Стандартные ошибки оценок – поле Std. Error;

2. Доверительные интервалы коэффициентов – определяются с использованием полей Coefficient и Std. Error, а также табличных значений t-критерия Стьюдента tкр (см. выше п. 2 теоретической части);

3. Значимость коэффициентов регрессии – поле

t-Statistic (значения t-статистик для коэффициентов) сравнивается с tкр либо поле

Prob. (вероятность того, что гипотеза о незначимости коэффициента верна) сравнивается с уровнем значимости γ: если Prob.<0.01 – коэффициент значим с надежностью 99%, если Prob.<0.05 – коэффициент значим с надежностью 95%;

4. Коэффициент детерминации R2 – поле R-squared;

5. Стандартная ошибка регрессии Se – поле S.E. of regression;

6. Значимость уравнения регрессии – поле

F-statistic (значение F-критерия Фишера для уравнения регрессии) сравнивается с табличным (критическим) значением F-критерия Фишера, либо поле

Prob(F-statistic) (вероятность того, что гипотеза о незначимости уравнения верна) сравнивается с уровнем значимости γ: если Prob.<0.01 – уравнение значимо с надежностью 99%, если Prob.<0.05 – уравнение значимо с надежностью 95%.

7. Средняя абсолютная процентная ошибка

Для определения средней абсолютной процентной ошибки в окне “Equation ” нажмите кнопку , в появившемся окне в поле Forecast name: введите имя ряда теоретических значений зависимой переменной или оставьте по умолчанию (рис. 2.4). Нажмите ОК.

Рис. 2.4. Построение ряда теоретических значений зависимой переменной

В результате в окне рабочего файла появится ряд теоретических значений зависимой переменной (pricef), а в окне “Equation ” отобразятся графики фактических и теоретических значений зависимой переменной (рис. 2.5). В таблице справа значение поля Mean Abs. Percent Error и есть значение средней абсолютной процентной ошибки (рис. 2.5).

Рис. 2.5. Определение средней абсолютной процентной ошибки

На рис. 2.5 значение средней абсолютной процентной ошибки равно А=1,62%, что является достаточно малым значением и указывает о хорошем качестве подгонки уравнения.

Чтобы проверить качество построенного уравнения регрессии можно также провести анализ фактических, теоретических значений зависимой переменной и остатков регрессии. Для этого в окне Equation (рис. 2.2) необходимо выбрать меню View / Actual,Fitted,Residual и выбрать один из пунктов:

  •  Actual, Fitted, Residual Table – таблица: факт, прогноз, остатки  плюс график остатков;
  •  Actual, Fitted, Residual Graphграфик: факт, прогноз, остатки (рис. 2.6)

Рис. 2.6. График фактических (Actual), прогнозных данных (Fitted) и остатков регрессии (Residual)

  •  Residual Graph – график остатков (рис. 2.7);

Рис. 2.7. График остатков регрессии

  •  Standardized Residual Graph – график стандартизированных остатков.

Качество уравнения считается хорошим, если графики фактических и прогнозных данных (рис. 2.6) близки, а график остатков показывает маленькие значения относительно значений зависимой переменной.

Оценка логарифмических моделей

  1.  Оценка модели :

ls log(y) c x

  1.  Оценка модели :

ls y c log(x)

  1.  Оценка модели :

ls log(y) c log(x)

Задания:

Исследуется зависимость между заработной платой, опытом человека и уровнем его образования. Предполагается линейная зависимость результирующего и влияющих признаков. Необходимо определить, какой из двух влияющих признаков является более существенным для объяснения уровня заработной платы, если можно использовать только уравнение парной регрессии.

Исходные данные по вариантам находятся в файле lab 3.xls

  1.  Проведите анализ данных и подготовьте выборку к проведению эконометрического моделирования.
  2.  Выберите один из объясняющих факторов и выполните следующие задания для одного уравнения регрессии.
  3.  По исходным данным найдите оценки коэффициентов регрессии β0 и β1, используя МНК.
  4.  Постройте в тетради доверительные интервалы для β0 и β1 с уровнем значимости 1%; 5% и 10%.
  5.  Оцените качество построенной модели.
  6.  Дайте экономическую интерпретацию коэффициентов.
  7.  Постройте линейное уравнение регрессии для второй влияющей величины. Оцените качество уравнения.
  8.  Сравните полученные модели и выберите лучшую по качеству объяснения зависимого признака.
  9.  Сохраните рабочий файл в вашем разделе под именем «фамилия студента»_3.WF1.

Дополнительное задание

  1.  Для выбранных величин постройте логарифмические модели зависимости. Оцените качество этих моделей. Сравните качество, по отношению к обычной линейной модели. Дайте экономическую интерпретацию.

  1.  

 

А также другие работы, которые могут Вас заинтересовать

20458. Основні задачі та проблеми проектування програмних продуктів 13.41 KB
  Пр428 Основні задачі та проблеми проектування програмних продуктів. Проектування – це процес розробки проекту тобто комплекту документації призначену для створення проекту його удосконалення та ліквідації а також для перевірки або відтворення проміжних і кінцевих рішень. Проектування – тривалий процес і включає етапи від підготовки технічного завдання до випробування. Процес створення програмного забезпечення ПЗ також включає в себе методи проектування.
20459. Каскадна (послідовна) модель 22.61 KB
  Вона передбачає послідовне виконання всіх етапів проекту в строго фіксованому порядку. Вимоги визначені на стадії формування вимог строго документуються у вигляді технічного завдання і фіксуються на весь час розробки проекту. Етапи проекту відповідно до каскадної моделлю: Формування вимог; Проектування; Реалізація; Тестування; Впровадження; Експлуатація та супровід. Недоліки: В Водоспадної моделі перехід від однієї фази проекту до іншого передбачає повну коректність результату виходу попередньої фази.
20460. Доповнення та різниця множин 18.86 KB
  Якщо A ⊂ U то елементи множини U які не належать А називаються доповненням множини А до множини U і позначають як CUA або UCA. Якщо A ⊂ U B ⊂ U то доповнення множини B до А називають різницею множин А та B саме в такому порядку і позначають А B або АB тобто A B = {x:x ∈ A ∧ x ∉ B}. Деякі властивості операції доповнення: A ∪ A′ = U A ∩ A′ = ∅ A′′ = A A − B = A ∩ B′ Об'єднання множин Об'єднанням множин А та B називається множина яка складається з усіх тих елементів які належать хоча б одній з множин A B: A ∪ B = {x: x ∈ A ∨ A...
20461. Життєвий цикл програмного забезпечення 58.5 KB
  Проектування: визначення структури системи та її проектуваннярозбиття програмної системи на окремі компоненти та проектування з визначенням ключових елементів структури даних. Тестування і верифікація: тестування вихідного текста;участь користувачів і колективів у всіх перевірках системи. Експлуатація і супроводження:використання готової програмної системи; оцінка її ефективності;усунення знайдених в процесі експлуатації помилок; внесення необхідних змін для підтримки актуальності програмної системи;д перевірка коректності внесених змін .
20462. Расчет характеристик вычислительных систем на основе стохастических сетей 239.66 KB
  В данной работе определяются характеристики вычислительной системы, модель замкнутой стохастической сети которой... Исходными данными для расчета являются следующие величины:
20463. Бу́лева фу́нкція (функція алгебри логіки, логічна функція) 22.02 KB
  Булева функція задається у вигляді таблиці або графіка зі стандартним лексикографічним розташуванням наборів аргументів. Нульарними булевими функціями є сталі 0 і 1. Функції 0 і 1 називаються тотожними нулем і одиницею функція x тотожною запереченням.
20464. CASE модель 14.28 KB
  Також під CASE розуміють сукупність методів і засобів проектування інформаційних систем з інтегрованими автоматизованими інструментами які можуть бути використані в процесі розробки ПЗ. У функції CASE входять засоби аналізу проектування й програмування. За допомогою CASE автоматизують процеси проектування інтерфейсів документування й генерування структурованого коду бажаною мовою програмування.
20465. Етапи проектування програмних продуктів 24.5 KB
  Немає універсальної технології розробки програм але більшість запропонованих технологій мають спільні риси адже об’єкт праці – програмний продукт відрізняється продуктовою однаковістю одним рівнем розвитку обчислювальної техніки та самої галузі програмування. Розробка програми на основі наперед підготовлених компонентів технологія збірного програмування є засобом переведення програмування на індустріальну основу зменшення складності програмування реальних задач продовження терміну використання окремих передових рішень що реалізовані в...
20466. Компонентне програмування 16.45 KB
  Таким чином компонентне програмування обходить проблему крихкості базового класу.Компонентноорієнтоване програмування включає в себе набір обмежень що накладаються на механізм об'єктноорієнтованого програмування далі ООП.Ситуація коли виникає нова парадигма програмування як обмеження колишньої вже була коли виникло структурне програмування для використання структур управління які виключають невпорядковані переходи управління за допомогою оператора GOTO що утрудняють аналіз алгоритму програми.