70312

Методика построения моделей парной линейной регрессии и оценки их качества

Контрольная

Математика и математический анализ

Содержание: Выбор и построение модели Проверка соответствия модели выборочным данным Прогнозирование проверка соответствия модели новым данным Резюме Была построена модель линейной связи между переменными DPI и PCE. Анализируя диаграмму рассеяния исследуемых данных приходим...

Русский

2014-10-18

252 KB

4 чел.

Отчёт

по индивидуальному заданию №1

студентки 3 курса группы «А»

Проторчиной Анны

Цель работы: Освоение методики построения моделей парной линейной регрессии и оценки их качества.

Содержание:

Выбор и построение модели

Проверка соответствия модели выборочным данным

Прогнозирование, проверка соответствия модели новым данным

Резюме

Была построена модель линейной связи между переменными DPI и PCE. По результатам регрессионного анализа в пакете STATISTICA было выявлено, что данная модель имеет высокую статистическую значимость, что указывает на ее эффективность.

С другой стороны при прогнозировании оказалось, что данная модель не соответствует новым данным за 2000 год. Анализируя диаграмму рассеяния исследуемых данных, приходим к выводу, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.

Таким образом, для дальнейшего исследования связи между данными показателями необходимо подобрать более адекватную модель взаимосвязи.

Задачи исследования:

Построить линейную модель зависимости расходов на товары длительного пользования от располагаемого дохода (DPI) и численно оценить коэффициенты модели.

Выбор и построение модели

Пусть  - данная нам выборка из двумерной генеральной совокупности, отражающая соотношение между располагаемым личным доходом (переменная x) и соответствующими расходами (переменная y) с 1946 по 1999 годы. Предварительное представление о зависимости между случайными величинами X и Y можно получить исходя из диаграммы рассеяния. 

Анализируя вытянутость облака точек на графике, приходим к выводу, что между случайными величинами X и Y существует достаточно тесная линейная статистическая зависимость, которую можно аппроксимировать уравнением линейной регрессии Y на x: , где y — результирующий показатель, x — существенный фактор, a, b — параметры регрессии.

Несмотря на это, разброс точек вокруг линии регрессии позволяет сделать предположение о гетероскедастичности исследуемых данных (разброс точек наблюдений вдоль линии регрессии является неравномерным на всем диапазоне изменения независимой переменной). Наличие гетероскедастичности в данных является одним из ограничений применимости метода линейной регрессии.

Тем не менее, попробуем применить данный метод и уже после сделаем окончательные выводы.


Для вычисления
МНК-коэффициентов регрессии воспользуемся методами модуля “Multiple Linear Regression” пакета STATISTICA.

В результате получим значения =-9,20514; =0,05574.

Таким образом, мы построили модель изменения расходов на товары длительного пользования в зависимости от DPI:

PCE = -9,20514+0,055574*DPI

С помощью пакета STATISTICA выборочные данные были представлены в виде точечной диаграммы, и был проведён линейный тренд.

Используя данную диаграмму, можно сделать предварительный вывод о том, что выбранная модель линейной парной регрессии соответствует выборочным данным.

Проверим насколько уравнение регрессии соответствует реальным данным.


Проверка соответствия модели выборочным данным

Коэффициент детерминации. Вычисленный коэффициент детерминации равен 0,99521932, что свидетельствует о высокой значимости модели.

F-тест   F = 10825 уровень значимости – 0.000000.

T-тест   t(52)=-4,9227; уровень значимости – 0.000000

t(52)= 104,0438; уровень значимости – 0.000000.

Вывод: при 5% и 1%-ом уровнях значимости регрессия признается статистически значимой.

Прогнозирование, проверка соответствия модели новым данным.

Вычислим предсказанные значения и доверительные интервалы для них.

  

Реальное значение за 2000 год: PCE = 374,5 , что не принадлежит предсказанным интервалам 5% и 1% уровней значимости.

Учитывая вышеизложенный анализ диаграммы рассеяния, можно утверждать, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.


 

А также другие работы, которые могут Вас заинтересовать

41870. Эффекты в CorelDRAW. Эффект "Перетекание" 1006.33 KB
  Рассмотрим работу инструмента на примере перетекания двух объектов: Рис. 1 На рис. На правой части этого же рисунка показан результат применения инструмента Интерактивное перетекание при следующих параметрах его работы: Число шагов в перетекании = 4; Вид перетекания = прямое; Ускорение = 0 рис.2 Рис.
41871. ПОВЕРКА ТЕХНИЧЕСКОГО АМПЕРМЕТРА И ВОЛЬТМЕТРА МАГНИТОЭЛЕКТРИЧЕСКОЙ СИСТЕМЫ 61.41 KB
  В практике поверки измерительных приборов нашли применение два способа: сопоставление показаний поверяемого и образцового приборов; сравнение показаний поверяемого прибора с мерой данной величины. Верхний предел измерений образцового прибора должен быть таким же как и поверяемого или не превышать предел измеряемого прибора более чем на 25. Допустимая погрешность образцового прибора должна быть 3.5 раз ниже погрешности поверяемого прибора.
41872. Зерновая характеристика угольной пыли и её представление 57.67 KB
  Зерновая характеристика угольной пыли и её представление. Тонкость помола или дисперсность угольной пыли определяют рассевом её пробы на рассевочной машине оснащённой набором сит с размерами отверстий от 50 до 1000 мкм. Коэффициент полидисперсностиnхарактеризует структуру пыли с точки зрения равномерности помола топлива. Чем выше n тем менее отличаются своим размером частицы пыли друг от друга.
41873. MS Access 2007: Создание запросов 351.77 KB
  Для вывода на экран БЛАНКА ЗАПРОСА необходимо: вкладка Создание группа команд Другие Конструктор запросов; в появившемся диалоговом окне Добавление таблицы выделите удерживая нажатой левую кнопку мыши все таблицы; щелкните по кнопкам Добавить и Закрыть; на экран будет выведено окно Конструктора запросов. В нижней панели пустой бланк запроса. Назначение строк бланка запроса: Поле Указываются имена полей участвующих в запросе Имя таблицы Автоматически выводятся имена таблиц соответствующих выбранным полям Групповая операция...
41874. Ознакомиться с основными положениями теории погрешности, измерить высоту, диаметр и объем цилиндра. Правильно обработать результаты измерений 54.31 KB
  В результате проделанной работы ознакомились с основными положениями теории погрешности, рассчитали относительную погрешность измерений.
41876. Исследования трения в резьбовых соединениях 64.49 KB
  Экспериментально определить значения коэффициентов трения в резьбе и на торце гайки; проверить теоретическую зависимость между осевым усилием на болте Fα и моментом завинчивания Тзав. № показаний К2 ед Fα по 17 Н K2ед Тзав по 18 Нмм 1 2 3 4 5 График зависимости Тзав= f Fα Определение коэффициентов трения. Сила затяжки FаН Тзав Нмм f1 по 8 f по 4 025...
41877. ТОТАЛИТАРИЗМ КАК ПОЛИТОЛОГИЧЕСКИЙ КОНЦЕПТ: ТРАНСФОРМАЦИЯ ПОНЯТИЯ 346 KB
  В результате своеобразной дефрагментации понятия тоталитаризм в последние десятилетия научное познание этого явления оказалось в серой зоне неопределенности: старые теории объективно отмирают но новые концепции не успевают их замещать
41878. Создание сложных комплексных объектов в 3D MAX 1.88 MB
  Выберите в Меню создание формы линии на панели инструментов Object Type сплайны. Для этого задайтесь замкнутыми сплайнлиниями выберите Strt New Shpes сплайны и Линия Нарисуйте несколько замкнутых линий. Вернитесь в раздел геометрия выберите раздел Compound Objects на закладку ландшафт Terrin В пункте Pick Opernd выберите Pick Opernd и Reference. Выберите 2 объемные фигуры сферу и цилиндр или другие.