70312

Методика построения моделей парной линейной регрессии и оценки их качества

Контрольная

Математика и математический анализ

Содержание: Выбор и построение модели Проверка соответствия модели выборочным данным Прогнозирование проверка соответствия модели новым данным Резюме Была построена модель линейной связи между переменными DPI и PCE. Анализируя диаграмму рассеяния исследуемых данных приходим...

Русский

2014-10-18

252 KB

4 чел.

Отчёт

по индивидуальному заданию №1

студентки 3 курса группы «А»

Проторчиной Анны

Цель работы: Освоение методики построения моделей парной линейной регрессии и оценки их качества.

Содержание:

Выбор и построение модели

Проверка соответствия модели выборочным данным

Прогнозирование, проверка соответствия модели новым данным

Резюме

Была построена модель линейной связи между переменными DPI и PCE. По результатам регрессионного анализа в пакете STATISTICA было выявлено, что данная модель имеет высокую статистическую значимость, что указывает на ее эффективность.

С другой стороны при прогнозировании оказалось, что данная модель не соответствует новым данным за 2000 год. Анализируя диаграмму рассеяния исследуемых данных, приходим к выводу, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.

Таким образом, для дальнейшего исследования связи между данными показателями необходимо подобрать более адекватную модель взаимосвязи.

Задачи исследования:

Построить линейную модель зависимости расходов на товары длительного пользования от располагаемого дохода (DPI) и численно оценить коэффициенты модели.

Выбор и построение модели

Пусть  - данная нам выборка из двумерной генеральной совокупности, отражающая соотношение между располагаемым личным доходом (переменная x) и соответствующими расходами (переменная y) с 1946 по 1999 годы. Предварительное представление о зависимости между случайными величинами X и Y можно получить исходя из диаграммы рассеяния. 

Анализируя вытянутость облака точек на графике, приходим к выводу, что между случайными величинами X и Y существует достаточно тесная линейная статистическая зависимость, которую можно аппроксимировать уравнением линейной регрессии Y на x: , где y — результирующий показатель, x — существенный фактор, a, b — параметры регрессии.

Несмотря на это, разброс точек вокруг линии регрессии позволяет сделать предположение о гетероскедастичности исследуемых данных (разброс точек наблюдений вдоль линии регрессии является неравномерным на всем диапазоне изменения независимой переменной). Наличие гетероскедастичности в данных является одним из ограничений применимости метода линейной регрессии.

Тем не менее, попробуем применить данный метод и уже после сделаем окончательные выводы.


Для вычисления
МНК-коэффициентов регрессии воспользуемся методами модуля “Multiple Linear Regression” пакета STATISTICA.

В результате получим значения =-9,20514; =0,05574.

Таким образом, мы построили модель изменения расходов на товары длительного пользования в зависимости от DPI:

PCE = -9,20514+0,055574*DPI

С помощью пакета STATISTICA выборочные данные были представлены в виде точечной диаграммы, и был проведён линейный тренд.

Используя данную диаграмму, можно сделать предварительный вывод о том, что выбранная модель линейной парной регрессии соответствует выборочным данным.

Проверим насколько уравнение регрессии соответствует реальным данным.


Проверка соответствия модели выборочным данным

Коэффициент детерминации. Вычисленный коэффициент детерминации равен 0,99521932, что свидетельствует о высокой значимости модели.

F-тест   F = 10825 уровень значимости – 0.000000.

T-тест   t(52)=-4,9227; уровень значимости – 0.000000

t(52)= 104,0438; уровень значимости – 0.000000.

Вывод: при 5% и 1%-ом уровнях значимости регрессия признается статистически значимой.

Прогнозирование, проверка соответствия модели новым данным.

Вычислим предсказанные значения и доверительные интервалы для них.

  

Реальное значение за 2000 год: PCE = 374,5 , что не принадлежит предсказанным интервалам 5% и 1% уровней значимости.

Учитывая вышеизложенный анализ диаграммы рассеяния, можно утверждать, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.


 

А также другие работы, которые могут Вас заинтересовать

11578. Создание модели данных с помощью Allfusion ERwin Data Modeler 93.57 KB
  Лабораторная работа 4 по дисциплине: Проектирование и архитектура программного проектирования На тему: Создание модели данных с помощью Allfusion ERwin Data Modeler Цель работы: Знакомство с CASEсистемой Allfusion ERWin Data Modeler изучение основных принципов построения логической
11579. Создание логической модели данных с помощью Allfusion ERwin Data Modeler 106.68 KB
  Лабораторная работа 5 по дисциплине: Проектирование и архитектура программного проектирования На тему: Создание логической модели данных с помощью Allfusion ERwin Data Modeler Цель работы: Развитие логической модели. Ход работы: Как было указано выше связи определяют
11580. Создание физической модели данных с помощью Allfusion ERwin Data Modeler 122.49 KB
  Лабораторная работа 6 по дисциплине: Проектирование и архитектура программного проектирования На тему: Создание физической модели данных с помощью Allfusion ERwin Data Modeler Цель работы: Создание физической модели. Ход работы: Различают два уровня физической модели: ...
11581. Проект участка на базе станков с ЧПУ по изготовлению деталей колёсного тягача 2.08 MB
  Тема: Проект участка на базе станков с ЧПУ по изготовлению деталей колёсного тягача. Содержание. Аннотация. Введение. Характеристика объектов производства. Технологический раздел. Определение типа производства. Анализ технологичности дета
11582. Информационная безопасность в телекоммуникационных системах 420 KB
  Лабораторный практикум по дисциплине Информационная безопасность в телекоммуникационных системах / Уфимск. гос. авиац. техн. унт; Сост.:Ж.А. Сухинец А.И. Гулин. –Уфа2011. –20 с. Приводится описание двух лабораторных работ для исследования студентами основных методов к...
11583. Устройства на операционных усилителях 472 KB
  Лабораторная работа № 5 Устройства на операционных усилителях Цель работы Изучить назначение принцип действия свойства и возможные схемотехнические решения устройств на операционных усилителях. 2. Задание 1. Ознако...
11584. Знакомство с Маткадом 83.95 KB
  Лабораторная работа № 1. Тема: Знакомство с Маткадом. Цель: Ознакомить студентов с интерфейсом пакета Маткад особенностями работы в пакете научить производить простейшие вычисления. Ход работы. Задача 1. Войдите в Маткад. 1.Поиграйте красным крестиком на экране...
11585. ЛАБОРАТОРНАЯ РАБОТА №1. ЗНАКОМСТВО С МАТКАДОМ 231.29 KB
  ЛАБОРАТОРНАЯ РАБОТА №1. ЗНАКОМСТВО С МАТКАДОМ Найдите на рабочем столе ярлык Маткад щелкните мышью и войдите в пакет. Обратите внимание на то что вся работа в Маткаде должна проводиться на латинском английском алфавите. Рис.1 Окна после запуска После за
11586. ВЕКТОРЫ И МАТРИЦЫ 39.75 KB
  Лабораторная работа Векторы и матрицы Общие сведения Задачи линейной алгебры решаемые в MathCAD можно условно разделить на два класса. Первый это простейшие матричные операции которые сводятся к определенным арифметическим действиям над элементами матрицы. Они реал...