70312

Методика построения моделей парной линейной регрессии и оценки их качества

Контрольная

Математика и математический анализ

Содержание: Выбор и построение модели Проверка соответствия модели выборочным данным Прогнозирование проверка соответствия модели новым данным Резюме Была построена модель линейной связи между переменными DPI и PCE. Анализируя диаграмму рассеяния исследуемых данных приходим...

Русский

2014-10-18

252 KB

4 чел.

Отчёт

по индивидуальному заданию №1

студентки 3 курса группы «А»

Проторчиной Анны

Цель работы: Освоение методики построения моделей парной линейной регрессии и оценки их качества.

Содержание:

Выбор и построение модели

Проверка соответствия модели выборочным данным

Прогнозирование, проверка соответствия модели новым данным

Резюме

Была построена модель линейной связи между переменными DPI и PCE. По результатам регрессионного анализа в пакете STATISTICA было выявлено, что данная модель имеет высокую статистическую значимость, что указывает на ее эффективность.

С другой стороны при прогнозировании оказалось, что данная модель не соответствует новым данным за 2000 год. Анализируя диаграмму рассеяния исследуемых данных, приходим к выводу, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.

Таким образом, для дальнейшего исследования связи между данными показателями необходимо подобрать более адекватную модель взаимосвязи.

Задачи исследования:

Построить линейную модель зависимости расходов на товары длительного пользования от располагаемого дохода (DPI) и численно оценить коэффициенты модели.

Выбор и построение модели

Пусть  - данная нам выборка из двумерной генеральной совокупности, отражающая соотношение между располагаемым личным доходом (переменная x) и соответствующими расходами (переменная y) с 1946 по 1999 годы. Предварительное представление о зависимости между случайными величинами X и Y можно получить исходя из диаграммы рассеяния. 

Анализируя вытянутость облака точек на графике, приходим к выводу, что между случайными величинами X и Y существует достаточно тесная линейная статистическая зависимость, которую можно аппроксимировать уравнением линейной регрессии Y на x: , где y — результирующий показатель, x — существенный фактор, a, b — параметры регрессии.

Несмотря на это, разброс точек вокруг линии регрессии позволяет сделать предположение о гетероскедастичности исследуемых данных (разброс точек наблюдений вдоль линии регрессии является неравномерным на всем диапазоне изменения независимой переменной). Наличие гетероскедастичности в данных является одним из ограничений применимости метода линейной регрессии.

Тем не менее, попробуем применить данный метод и уже после сделаем окончательные выводы.


Для вычисления
МНК-коэффициентов регрессии воспользуемся методами модуля “Multiple Linear Regression” пакета STATISTICA.

В результате получим значения =-9,20514; =0,05574.

Таким образом, мы построили модель изменения расходов на товары длительного пользования в зависимости от DPI:

PCE = -9,20514+0,055574*DPI

С помощью пакета STATISTICA выборочные данные были представлены в виде точечной диаграммы, и был проведён линейный тренд.

Используя данную диаграмму, можно сделать предварительный вывод о том, что выбранная модель линейной парной регрессии соответствует выборочным данным.

Проверим насколько уравнение регрессии соответствует реальным данным.


Проверка соответствия модели выборочным данным

Коэффициент детерминации. Вычисленный коэффициент детерминации равен 0,99521932, что свидетельствует о высокой значимости модели.

F-тест   F = 10825 уровень значимости – 0.000000.

T-тест   t(52)=-4,9227; уровень значимости – 0.000000

t(52)= 104,0438; уровень значимости – 0.000000.

Вывод: при 5% и 1%-ом уровнях значимости регрессия признается статистически значимой.

Прогнозирование, проверка соответствия модели новым данным.

Вычислим предсказанные значения и доверительные интервалы для них.

  

Реальное значение за 2000 год: PCE = 374,5 , что не принадлежит предсказанным интервалам 5% и 1% уровней значимости.

Учитывая вышеизложенный анализ диаграммы рассеяния, можно утверждать, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.


 

А также другие работы, которые могут Вас заинтересовать

4017. Контрольная работа. Линейная алгебра 131.5 KB
  Задача 1. Дана система трех линейных уравнений. Найти решение ее двумя способами: методом Крамера и методом Гаусса. Задача 2. Даны координаты вершин пирамиды А1А2А3А4. Найти: 1. длину ребра А1А2 2. угол между ребрами А1А2 и А1А4 3. площадь грани А1А...
4018. Автоматическая компенсация температурной зависимости дрейфа нуля и чувствительности в датчиках давления на КНС-структурах 503 KB
  Введение Гетероэпитаксиальные слои кремния на сапфире (КНС) впервые были получены в середине 60-х годов XX в. и сразу привлекли к себе внимание как специалистов по полупроводниковому материаловедению, так и разработчиков твердотельных микросхем. В п...
4019. Повышение экономической эффективности налогообложения 108 KB
  Повышение экономической эффективности налогообложения предполагает минимизацию избыточного налогового бремени. Однако на практике основная часть налоговых поступлений приходится, как правило, на обложение доходов, прибыли и добавленной стои...
4020. Нетрадиционно возобновляемые источники энергии 123 KB
  Введение В настоящее время во всем мире наблюдается повышенный интерес к использованию в различных отраслях экономики нетрадиционных возобновляемых источников энергии (НВИЭ). Ведется бурная дискуссия о выборе путей развития энергетики. Это связано, ...
4021. Виды и принципы действия электросвязи. Мультимедийные технологии 308 KB
  Краткая информация о видах электросвязи Электросвязь - передача информации посредством электрических сигналов, распространяющихся по проводам (проводная связь), или (и) радиосигналов (радиосвязь). К электросвязи относят, кроме того, передачу информа...
4022. Чрезвычайные ситуации социального характера и защита от них 1.63 MB
  Чрезвычайные ситуации социального характера и защита от них Предисловие Преподавание дисциплины «Безопасность жизнедеятельности» началось в российских вузах в 1990-х годах. И это далеко не случайно. В условиях социальной нестабильности, перманентных...
4023. Чрезвычайные ситуации социального характера 2.21 MB
  ЧС социального характера – это обстановка на определенной территории, сложившаяся в результате возникновения опасных противоречий и конфликтов в сфере социальных отношений, которые могут повлечь или повлекли за собой человеческие жертвы...
4024. Цех по производству стропильных балок покрытия производительностью 5200 м3/год 1.69 MB
  Цех по производству стропильных балок покрытия производительностью 5200 м 3 год Введение Развитие производства и применение сборного железобетона базируется на дальнейшей специализации предприятий по выпуску по выпуску однотипной продукции...
4025. Факторы, влияющие на процесс принятия решений 127 KB
  Введение На мой взгляд, проблема принятия и реализации решений является основополагающей для менеджмента. За последние 20 лет дважды Нобелевская премия в области экономики присуждалась за работы по совершенствованию общепринятой концепции принятия р...