80688

Основы корреляцоинно-регрессионного анализа

Лекция

Экономическая теория и математическое моделирование

Общая схема расчетов корреляционных моделей следующая: логический отбор факторов независимых переменных оказывающих существенное влияние на изучаемую величину зависимую переменную; выбор формы связи зависимой переменной с отобранными факторами и построение соответствующих уравнений регрессии; расчет параметров коэффициентов уравнений регрессии; расчет коэффициентов корреляции и проверка правильности произведенного отбора факторов и принятой формы связи; определение значимости существенности коэффициентов регрессии и корреляции и...

Русский

2015-02-18

116 KB

0 чел.

4

Лекции по курсу '' Моделирование и прогнозирование в экономике''

основы корреляцоинно-регрессионного анализа

1. Общая схема расчетов  корреляционных расчетов 

2. Коэффициент корреляции

3. Определение доверительных интервалов

4. Множественная регрессия

5. Коэффициент множественной корреляции

6. Автокорреляция

7. Автокорреляция остатков

  1.  Общая схема расчетов корреляционных моделей.

Общая схема расчетов корреляционных моделей следующая:

  1.  логический отбор факторов (независимых переменных), оказывающих существенное влияние на изучаемую величину (зависимую переменную);
  2.  выбор формы связи зависимой переменной с отобранными факторами и построение соответствующих уравнений регрессии;
  3.  расчет параметров (коэффициентов) уравнений регрессии;
  4.  расчет коэффициентов корреляции и проверка правильности произведенного отбора факторов и принятой формы связи;
  5.  определение значимости (существенности) коэффициентов регрессии и корреляции и их доверительных интервалов.

Определение формы связи.

Форму парной связи (например, связь между производительностью труда и фондовооруженностью) можно изобразить графически. Связь криволинейная, поэтому можно попытаться выразить эту связь с помощью уравнения параболы. Вместе с тем кривизна невелика и её можно рассмотреть как прямолинейную.

Графический метод определения формы связи зависимой и независимой величины часто оказывается недостаточно надежным. Неправильно же выбранная форма связи может привести к неправильным выводам.

Существует более надежный, алгебраический метод определения типа кривой. Он сводиться к выявлению некоего постоянства приращений зависимой и независимой переменных, специфического для каждого типа зависимостей. Например, для прямолинейной зависимости  , для квадратичной параболы , для степенной зависимости  

Линейная зависимость определена уравнением  y=a+bx

Предположив прямолинейную форму связи, оценим значения параметров a и b способом наименьших квадратов.

Исследование метода наименьших квадратов для определения параметров уравнения парной регрессии.

На графике – результаты наблюдений  значений переменных у и х.

Через область, занимаемую точками, на графике, проведена прямая.  Отклонение какой - либо точки с координатами  и составит величину  .

- фактическое значение переменной у;

- расчетное значение переменной у;

- функция параметров а и b;

обобщенный показатель рассеяния точек вокруг прямой

Стремление найти прямую, которая наилучшим образом описывала бы расположение точек в пространстве переменных у и х, или, иначе говоря, прямую, к которой в целом наиболее тесно примыкали бы отдельные точки, трансформируются в методе наименьших квадратов в критерий, согласно которому параметры а и  b должны быть подобраны так, чтобы сумма квадратов величины была минимальной, т. е.

     

Необходимым условием существования минимума функции в точках а и b является равенство нулю частных производных по неизвестным параметрам а и b.

Отсюда стандартная форма нормальных уравнений:

  1.  Коэффициент корреляции.

Уравнение регрессии характеризует взаимосвязь между переменными х и у в том смысле, что показывает, как изменяется величина у в зависимости от изменения величины х. Однако в самом уравнении регрессии с оцененными параметрами нет указания на то, как близко находятся фактические наблюдения от расчетных, т. е. нет указания на степень тесноты связи между переменными. Между зависимыми х и у определяется коэффициент корреляции:

Величина r лежит между –1 и 1. Чем выше значение r, тем теснее связь между переменными и тем с большим основанием найденная взаимосвязь может быть использована для прогнозирования.

После получения r можно продолжить статистический анализ, исследовав вопрос, в какой мере полученный коэффициент корреляции существенен.

Для проверки существенности при небольшом числе наблюдений:

  1.  Определение доверительных интервалов.

Определяются те границы, в пределах которых с заданной доверительной вероятностью будет находиться значение .

В силу того, что оценивание параметров осуществляется по выборочным данным, оценки а и b создают некоторую погрешность. Причем погрешность в значении а приводит к вертикальному сдвигу линии регрессии, а колеблемость оценки b приводит к «покачиванию» линии регрессии. При одной и той же оценке а линия регрессии будет поворачиваться вокруг оси с координатами , .

Расчетное значение  доверительного интервала:

- стат. Стьюдента.

Отдельные наблюдения рассеяны вокруг неё. В качестве меры рассеяния принимается дисперсия.

Дисперсия значения зависимой переменной, определяемой по уравнению парной регрессии будет складываться из двух компонент – дисперсии параметра а и дисперсии параметра b.

  1.  Множественная регрессия.

Зависимая переменная может быть функцией нескольких переменных  .

Введем матричные обозначения.

Имеем:

  •  вектор неизвестных параметров , j=1,2…m;
  •  вектор зависимой переменной , i=1,2…n;
  •  матрица независимых переменных , размер которых определяется числом наблюдений n и числом переменных m;
  •  вектор ошибок .

Линейная модель в матричном виде:

Оценку а, найденную по этой формуле называют оценкой метода наименьших квадратов.

Определив вектор а записывают уравнение множественной регрессии.

Для задач с двумя переменными можно записать систему нормальных уравнений.

  1.  Коэффициент множественной корреляции.

Взаимосвязь зависимой переменной у с рядом независимых переменных х измеряется в целом с помощью коэффициентов множественной корреляции.

Чем теснее данные примыкают к линии регрессии, тем больше эта величина. Если линия регрессии полностью описывает зависимую переменную, то R=1, в противном случае модуль R<1.

  1.  Автокорреляция.

Автокорреляция – это корреляционная зависимость между средними значениями уровней временного ряда: ; и т. д.

Чтобы оценить степень зависимости между средними уровнями временного ряда рассчитывают коэффициент автокорреляции между уровнями исходного ряда и того же ряда, но сдвинутого на   шагов во времени.

Общая формула для расчета коэффициента автокорреляции:

  •  средний уровень первого ряда;
  •  средний уровень второго ряда;

Наибольшее значение -------------------- должно быть таким, чтобы число пар наблюдений оказалось достаточным для вычисления коэффициента автокорреляции ------------------.

При анализе временных рядов необходимо знать существует ли автокорреляция в уровнях ряда или нет. Самым распространенным методом проверки автокорреляции является критерий Дарбина – Уотсона.

---------------------

Возможные значения критерия находятся в интервале 0-4. Если автокорреляция отсутствует, то d колеблется вокруг 2.

При проверке автокорреляции остатков критерий Дарбина – Уотсона:

--------------------

Значения также сравниваются с табличными.

  •  положительная корреляция;
  •  отрицательная корреляция.

  1.  Автокорреляция остатков.

Если вид функциональной зависимости выбран неудачно, то нельзя говорить о том, что ошибки представляют собой случайные независимые переменные. Если последовательные значения коррелированны между собой, то говорят, что имеет место автокорреляция.

Кроме того, автокорреляция может быть

5

Основы корреляционно-регрессионного анализа


 

А также другие работы, которые могут Вас заинтересовать

46568. Острый мастит. Классификация. Клиника, диагностика, дифференциальная диагностика. Лечение. Показания к операции 20.39 KB
  Эхинококковые кисты печени растут очень медленно хотя иногда достигают огромных размеров и содержат 10 л и более жидкости. Чаще они бывают одиночными и локализуются в правой доле печени по встречаются и множественные кисты. Состояние больных обычно не нарушается; II стадия наблюдаются различные симптомы связанные с увеличением размеров растущей кисты оказывающей давление па окружающие органы. У ряда больных прощупывается опухолевидное образование в верхней половине живота или увеличение печени; III стадия возникают симптомы...
46569. Формирование гражданского общества в России 20.46 KB
  Зачатки гражданского общества в России начали складываться во второй половине ХIХ столетия в результате реформ Александра II отмена крепостного права реформа местного самоуправления судебная административная и другие реформы. Все это ускорило необходимые процессы модернизации русского общества. С развитием буржуазных отношений формируются крупные промышленные предприятия банки и другие субъекты капиталистических отношений что создало экономическую основу гражданского общества.
46570. Термінологічні словники як основне джерело фахової інформації 20.5 KB
  Термінологічні словники як основне джерело фахової інформації. Особливу категорію складають термінологічні словники це словники які включають терміни що стосуються окремої галузі знань або навіть певної теми та їх пояснення Словник термінів теорії груп.
46571. Особенности проблемного обучения изобразительному искусству 20.55 KB
  Особенности проблемного обучения изобразительному искусству. План: понятие ПО Проблемная ситуация и пробл вопрос проблемные задачи по изо структура проблемного урока классификация метолов обучениявывод 1Проблемное обучение это тип развивающего обучения в котором сочетается систематическая самостоятельная поисковая деятельность учащихся с усвоением ими готовых выводов науки. 3 учебнопознавательные задачи приемытехники изображ предмета 4 Структура процесса проблемного обучения представляет собой систему связанных между собой и...
46572. Метод дисконтирования при оценке недвижимости 20.6 KB
  Метод дисконтированных денежных потоков наиболее универсальный метод позволяющий определить настоящую стоимость будущих денежных потоков. Метод ДДП позволяет оценить стоимость недвижимости на основе текущей стоимости дохода состоящего из прогнозируемых денежных потоков и остаточной стоимости. Расчет стоимости объекта недвижимости методом ДДП осуществляется в следующей последовательности: 1.
46573. Роль ХХ столетия в мировой истории 20.67 KB
  Не случайно в большинстве экономически развитых стран у власти чередуются представители либеральных и умеренно-социалистических группировок. Однако подобное обстоятельство не устранило саму конкурентную борьбу лишь изменило ее формы. И хотя экономическое положение США в мировом сообществе уже не так прочно как преждетем не менее очевидно что правящая элита США будет прилагать все усилия для сохранения исключительного положения своей страны. Впрочем мировое развитие идет в направлении возрастания политического веса малых стран в мировой...
46575. Особенности и правовая охрана интеллектуальной собственности 20.7 KB
  Под объектом интеллектуальной собственности следует понимать конкретную разработку произведение представленную на материальном носителе. Объекты интеллектуальной собственности: Литературные художественные и научные произведения; Исполнительская деятельность артистов звукозаписи радио и телевизионные передачи; Изобретения во всех областях человеческой деятельности; Научные открытия; Промышленные образцы; Товарные знаки знаки обслуживания фирменные наименовании и коммерческие обозначения; Авторское право Авторское право...