70312

Методика построения моделей парной линейной регрессии и оценки их качества

Контрольная

Математика и математический анализ

Содержание: Выбор и построение модели Проверка соответствия модели выборочным данным Прогнозирование проверка соответствия модели новым данным Резюме Была построена модель линейной связи между переменными DPI и PCE. Анализируя диаграмму рассеяния исследуемых данных приходим...

Русский

2014-10-18

252 KB

4 чел.

Отчёт

по индивидуальному заданию №1

студентки 3 курса группы «А»

Проторчиной Анны

Цель работы: Освоение методики построения моделей парной линейной регрессии и оценки их качества.

Содержание:

Выбор и построение модели

Проверка соответствия модели выборочным данным

Прогнозирование, проверка соответствия модели новым данным

Резюме

Была построена модель линейной связи между переменными DPI и PCE. По результатам регрессионного анализа в пакете STATISTICA было выявлено, что данная модель имеет высокую статистическую значимость, что указывает на ее эффективность.

С другой стороны при прогнозировании оказалось, что данная модель не соответствует новым данным за 2000 год. Анализируя диаграмму рассеяния исследуемых данных, приходим к выводу, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.

Таким образом, для дальнейшего исследования связи между данными показателями необходимо подобрать более адекватную модель взаимосвязи.

Задачи исследования:

Построить линейную модель зависимости расходов на товары длительного пользования от располагаемого дохода (DPI) и численно оценить коэффициенты модели.

Выбор и построение модели

Пусть  - данная нам выборка из двумерной генеральной совокупности, отражающая соотношение между располагаемым личным доходом (переменная x) и соответствующими расходами (переменная y) с 1946 по 1999 годы. Предварительное представление о зависимости между случайными величинами X и Y можно получить исходя из диаграммы рассеяния. 

Анализируя вытянутость облака точек на графике, приходим к выводу, что между случайными величинами X и Y существует достаточно тесная линейная статистическая зависимость, которую можно аппроксимировать уравнением линейной регрессии Y на x: , где y — результирующий показатель, x — существенный фактор, a, b — параметры регрессии.

Несмотря на это, разброс точек вокруг линии регрессии позволяет сделать предположение о гетероскедастичности исследуемых данных (разброс точек наблюдений вдоль линии регрессии является неравномерным на всем диапазоне изменения независимой переменной). Наличие гетероскедастичности в данных является одним из ограничений применимости метода линейной регрессии.

Тем не менее, попробуем применить данный метод и уже после сделаем окончательные выводы.


Для вычисления
МНК-коэффициентов регрессии воспользуемся методами модуля “Multiple Linear Regression” пакета STATISTICA.

В результате получим значения =-9,20514; =0,05574.

Таким образом, мы построили модель изменения расходов на товары длительного пользования в зависимости от DPI:

PCE = -9,20514+0,055574*DPI

С помощью пакета STATISTICA выборочные данные были представлены в виде точечной диаграммы, и был проведён линейный тренд.

Используя данную диаграмму, можно сделать предварительный вывод о том, что выбранная модель линейной парной регрессии соответствует выборочным данным.

Проверим насколько уравнение регрессии соответствует реальным данным.


Проверка соответствия модели выборочным данным

Коэффициент детерминации. Вычисленный коэффициент детерминации равен 0,99521932, что свидетельствует о высокой значимости модели.

F-тест   F = 10825 уровень значимости – 0.000000.

T-тест   t(52)=-4,9227; уровень значимости – 0.000000

t(52)= 104,0438; уровень значимости – 0.000000.

Вывод: при 5% и 1%-ом уровнях значимости регрессия признается статистически значимой.

Прогнозирование, проверка соответствия модели новым данным.

Вычислим предсказанные значения и доверительные интервалы для них.

  

Реальное значение за 2000 год: PCE = 374,5 , что не принадлежит предсказанным интервалам 5% и 1% уровней значимости.

Учитывая вышеизложенный анализ диаграммы рассеяния, можно утверждать, что это несоответствие является следствием неверно подобранной модели, а не случайным выбросом.


 

А также другие работы, которые могут Вас заинтересовать

36583. Оператор присваивания 28.5 KB
  Левая часть это переменная любого типа правая часть выражение совместимое по типу с переменной левой части. При выполнении этого оператора вычисляется значение выражения правой части и это значение становится значением переменной левой части. Совместимость левой и правой частей присваивания по типу означает либо равенство типов либо случаи когда тип выражения правой части автоматически преобразуется к типу левой части. Эти случаи автоматического преобразования типов для известных нам стандартных типов исчерпываются следующими:  Тип...
36584. Стандартные типы данных, операции, выражения 48.5 KB
  Целые числа типа integer это числа диапазона 32768 . Константы типа integer обычные целые числа возможно со знаком. Синтаксическое определение целых чисел имеет вид: целое число ::= [ ] { цифра } В отличие от целых чисел вещественные числа типа rel представляются в памяти компьютера приближенно. Константы типа rel числа возможно с дробной частью отделяемой от целой части точкой.
36585. Структура программ на Паскале 36 KB
  Любая программа на Турбо Паскале имеет одну и ту же общую структуру: [ progrm имя программы ; ] [ раздел описаний ] begin раздел операторов end. Эта структура состоит из заголовка программы необязательного раздела описаний который может в особых случаях отсутствовать и раздела операторов содержащего хотя бы один оператор. Имя программы идентификатор выбираемый программистом. В разделе описаний должны быть описаны все нестандартные имена используемые далее в разделе операторов этой программы.
36586. Автоматизация турфирм 31 KB
  Комплексная автоматизация турфирмы позволяет: Автоматизировать оперативный и бухгалтерский учет в турфирмах Автоматизировать оперативную работу с клиентами Формировать турпакет из услуг поставщиков рассчитывать прайслисты и подготавливать электронный и бумажный каталоги цен. Автоматизация туристической деятельности естественным образом приводит к оптимизации бизнеспроцессов. Автоматизация рабочего места в тур. Автоматизация рабочих мест пользователей позволяет: формировать турпакет из услуг поставщиков рассчитывать прайслисты...
36587. Система бронирования Amadeus 37 KB
  В настоящее время mdeus ведущая компьютерная система бронирования в Европе. системы бронирования System One она активно продвигается и на американский рынок. Партнером mdeus является немецкая система бронирования туруслуг Strt и любой пользователь mdeus автоматически является также пользователем Strt.
36588. Реляционная модель данных 46.5 KB
  Любую таблицу упрощенно можно описать следующим образом: НАЗВАНИЕ ТАБЛИЦЫ Поле1 Поле2 Поле3ПолеN Например: СТУДЕНТЫНомер_зачетки ФИО Факультет. Располагаются столбцы в таблице в порядке следования их имен принятом при создании таблицы. В каждой таблице должен быть столбец или совокупность столбцов значение которого однозначно идентифицирует каждую запись таблицы. Этот столбец или совокупность столбцов называется первичным ключом primry key PK таблицы.
36589. Основы проектирования баз данных 93.5 KB
  Основные этапы проектирования баз данных 1 Концептуальное инфологическое проектирование Концептуальное инфологическое проектирование построение семантической смысловой модели предметной области то есть информационной модели наиболее высокого уровня абстракции. Такая модель создаётся без ориентации на какуюлибо конкретную СУБД и модель данных. Кроме того в этом контексте равноправно могут использоваться слова модель базы данных и модель предметной области поскольку такая модель является как образом реальности так и образом...
36590. Язык SQL 499.5 KB
  На раннем этапе развития систем управления базами данных(СУБД) в условиях низких технических характеристик ЭВМ основное внимание разработчиков СУБД было направлено на проблемы размещения информации в базе и обмена данными между дисковой памятью и оперативной памятью, поскольку это в первую очередь определяло эффективность функционирования СУБД
36591. Теорія механізмів і машин 8.12 MB
  Структура та класифікація механізмів Структура механізму це його будова. Будовою механізму визначаються такі його важливі характеристики як види виконуваних рухів способи їх перетворення число ступенів вільності. Основними структурними елементами механізму є ланки тверді тіла та кінематичні пари рухомі зєднання твердих тіл. Ланки механізму рухомо зєднані між собою.