70312

Методика построения моделей парной линейной регрессии и оценки их качества

Контрольная

Математика и математический анализ

Содержание: Выбор и построение модели Проверка соответствия модели выборочным данным Прогнозирование проверка соответствия модели новым данным Резюме Была построена модель линейной связи между переменными DPI и PCE. Анализируя диаграмму рассеяния исследуемых данных приходим...

Русский

2014-10-18

252 KB

4 чел.

Отчёт

по индивидуальному заданию №1

студентки 3 курса группы «А»

Проторчиной Анны

Цель работы: Освоение методики построения моделей парной линейной регрессии и оценки их качества.

Содержание:

Выбор и построение модели

Проверка соответствия модели выборочным данным

Прогнозирование, проверка соответствия модели новым данным

Резюме

Была построена модель линейной связи между переменными DPI и PCE. По результатам регрессионного анализа в пакете STATISTICA было выявлено, что данная модель имеет высокую статистическую значимость, что указывает на ее эффективность.

С другой стороны при прогнозировании оказалось, что данная модель не соответствует новым данным за 2000 год. Анализируя диаграмму рассеяния исследуемых данных, приходим к выводу, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.

Таким образом, для дальнейшего исследования связи между данными показателями необходимо подобрать более адекватную модель взаимосвязи.

Задачи исследования:

Построить линейную модель зависимости расходов на товары длительного пользования от располагаемого дохода (DPI) и численно оценить коэффициенты модели.

Выбор и построение модели

Пусть  - данная нам выборка из двумерной генеральной совокупности, отражающая соотношение между располагаемым личным доходом (переменная x) и соответствующими расходами (переменная y) с 1946 по 1999 годы. Предварительное представление о зависимости между случайными величинами X и Y можно получить исходя из диаграммы рассеяния. 

Анализируя вытянутость облака точек на графике, приходим к выводу, что между случайными величинами X и Y существует достаточно тесная линейная статистическая зависимость, которую можно аппроксимировать уравнением линейной регрессии Y на x: , где y — результирующий показатель, x — существенный фактор, a, b — параметры регрессии.

Несмотря на это, разброс точек вокруг линии регрессии позволяет сделать предположение о гетероскедастичности исследуемых данных (разброс точек наблюдений вдоль линии регрессии является неравномерным на всем диапазоне изменения независимой переменной). Наличие гетероскедастичности в данных является одним из ограничений применимости метода линейной регрессии.

Тем не менее, попробуем применить данный метод и уже после сделаем окончательные выводы.


Для вычисления
МНК-коэффициентов регрессии воспользуемся методами модуля “Multiple Linear Regression” пакета STATISTICA.

В результате получим значения =-9,20514; =0,05574.

Таким образом, мы построили модель изменения расходов на товары длительного пользования в зависимости от DPI:

PCE = -9,20514+0,055574*DPI

С помощью пакета STATISTICA выборочные данные были представлены в виде точечной диаграммы, и был проведён линейный тренд.

Используя данную диаграмму, можно сделать предварительный вывод о том, что выбранная модель линейной парной регрессии соответствует выборочным данным.

Проверим насколько уравнение регрессии соответствует реальным данным.


Проверка соответствия модели выборочным данным

Коэффициент детерминации. Вычисленный коэффициент детерминации равен 0,99521932, что свидетельствует о высокой значимости модели.

F-тест   F = 10825 уровень значимости – 0.000000.

T-тест   t(52)=-4,9227; уровень значимости – 0.000000

t(52)= 104,0438; уровень значимости – 0.000000.

Вывод: при 5% и 1%-ом уровнях значимости регрессия признается статистически значимой.

Прогнозирование, проверка соответствия модели новым данным.

Вычислим предсказанные значения и доверительные интервалы для них.

  

Реальное значение за 2000 год: PCE = 374,5 , что не принадлежит предсказанным интервалам 5% и 1% уровней значимости.

Учитывая вышеизложенный анализ диаграммы рассеяния, можно утверждать, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.


 

А также другие работы, которые могут Вас заинтересовать

22932. Теорема про ранг матриці 21 KB
  Для будь якої матриці її горизонтальний та вертикальний ранги рівні та співпадають з рангом матриці за мінорами . Це означає що порядок базисного мінора матриці дорівнює k . За теоремою про базисний мінор k рядків матриці A на яких будується базисний мінор лінійно незалежні а решта рядків лінійно виражаються через них.
22933. Методи обчислення визначників n порядку 761.5 KB
  Поняття визначника nго порядку. Числа aіj називаються елементами визначника . Добуток 5536 є одним з добутків визначника  оскільки серед його співмножників є по одному і лише по одному елементу з кожного рядка і кожного стовпчика визначника. Аналітичний запис визначника.
22935. ВКАЗІВНИКИ 53.5 KB
  1 довжина рядка int strlen char s { int i; for i=0; s= 0; s i; return i; } int strlen char s[] { int i; for i=0; s[i]= 0; i ; return i; } int strlen char s { int i; for i=0; s; s i; s трактується як булевий вираз s=0 означає лжу s=0 означає істину return i; }...
22937. СТРУКТУРИ 74 KB
  struct імя_типу { cписок_полів} список_змінних ; struct date { int day; int month; int year; char mon_name[4]; } d d1; змінніструктури dd1 типу date typedef struct { double real; double imag; } complex;...
22938. Синтаксичний аналіз виразів 31 KB
  Мова в певному алфавіті основному символів це слова записані за певними синтаксичними правилами. Синтаксичні правила подаються формулами БекусаНаура БНФ вигляду : ::= де позначає синтаксичне поняття а послідовність символів розширеного алфавіту. Вираз [] означає що послідовність символів входить або не входить в конструкцію. Синтаксичний аналізатор це програма що для заданої послідовності символів основного алфавіту розпізнає чи побудована вона у відповідності з синтаксичними правилами для даного поняття.
22939. ВВЕДЕННЯ / ВИВЕДЕННЯ 48 KB
  Перед тим як розпочати роботу з потоком його необхідно відкрити за допомогою функції FILE fopenchar filename char mode. Функція формує потік з даним файлом і повертає результат у вигляді покажчика на обєкт типу FILE який містить всю інформацію необхідну для роботи з потоком адресу та розмір буфера індексзсув поточної позиції в буфері режим оборобки інформації і т. FILE fp; fp=fopenfile1.txt a; відкриття файлу file1.
22940. Адресация в IP-сетях 120 KB
  В терминологии TCP/IP под локальным адресом понимается такой тип адреса, который используется средствами базовой технологии для доставки данных в пределах подсети, являющейся элементом составной интерсети. В разных подсетях допустимы разные сетевые технологии, разные стеки протоколов