80688

Основы корреляцоинно-регрессионного анализа

Лекция

Экономическая теория и математическое моделирование

Общая схема расчетов корреляционных моделей следующая: логический отбор факторов независимых переменных оказывающих существенное влияние на изучаемую величину зависимую переменную; выбор формы связи зависимой переменной с отобранными факторами и построение соответствующих уравнений регрессии; расчет параметров коэффициентов уравнений регрессии; расчет коэффициентов корреляции и проверка правильности произведенного отбора факторов и принятой формы связи; определение значимости существенности коэффициентов регрессии и корреляции и...

Русский

2015-02-18

116 KB

0 чел.

4

Лекции по курсу '' Моделирование и прогнозирование в экономике''

основы корреляцоинно-регрессионного анализа

1. Общая схема расчетов  корреляционных расчетов 

2. Коэффициент корреляции

3. Определение доверительных интервалов

4. Множественная регрессия

5. Коэффициент множественной корреляции

6. Автокорреляция

7. Автокорреляция остатков

  1.  Общая схема расчетов корреляционных моделей.

Общая схема расчетов корреляционных моделей следующая:

  1.  логический отбор факторов (независимых переменных), оказывающих существенное влияние на изучаемую величину (зависимую переменную);
  2.  выбор формы связи зависимой переменной с отобранными факторами и построение соответствующих уравнений регрессии;
  3.  расчет параметров (коэффициентов) уравнений регрессии;
  4.  расчет коэффициентов корреляции и проверка правильности произведенного отбора факторов и принятой формы связи;
  5.  определение значимости (существенности) коэффициентов регрессии и корреляции и их доверительных интервалов.

Определение формы связи.

Форму парной связи (например, связь между производительностью труда и фондовооруженностью) можно изобразить графически. Связь криволинейная, поэтому можно попытаться выразить эту связь с помощью уравнения параболы. Вместе с тем кривизна невелика и её можно рассмотреть как прямолинейную.

Графический метод определения формы связи зависимой и независимой величины часто оказывается недостаточно надежным. Неправильно же выбранная форма связи может привести к неправильным выводам.

Существует более надежный, алгебраический метод определения типа кривой. Он сводиться к выявлению некоего постоянства приращений зависимой и независимой переменных, специфического для каждого типа зависимостей. Например, для прямолинейной зависимости  , для квадратичной параболы , для степенной зависимости  

Линейная зависимость определена уравнением  y=a+bx

Предположив прямолинейную форму связи, оценим значения параметров a и b способом наименьших квадратов.

Исследование метода наименьших квадратов для определения параметров уравнения парной регрессии.

На графике – результаты наблюдений  значений переменных у и х.

Через область, занимаемую точками, на графике, проведена прямая.  Отклонение какой - либо точки с координатами  и составит величину  .

- фактическое значение переменной у;

- расчетное значение переменной у;

- функция параметров а и b;

обобщенный показатель рассеяния точек вокруг прямой

Стремление найти прямую, которая наилучшим образом описывала бы расположение точек в пространстве переменных у и х, или, иначе говоря, прямую, к которой в целом наиболее тесно примыкали бы отдельные точки, трансформируются в методе наименьших квадратов в критерий, согласно которому параметры а и  b должны быть подобраны так, чтобы сумма квадратов величины была минимальной, т. е.

     

Необходимым условием существования минимума функции в точках а и b является равенство нулю частных производных по неизвестным параметрам а и b.

Отсюда стандартная форма нормальных уравнений:

  1.  Коэффициент корреляции.

Уравнение регрессии характеризует взаимосвязь между переменными х и у в том смысле, что показывает, как изменяется величина у в зависимости от изменения величины х. Однако в самом уравнении регрессии с оцененными параметрами нет указания на то, как близко находятся фактические наблюдения от расчетных, т. е. нет указания на степень тесноты связи между переменными. Между зависимыми х и у определяется коэффициент корреляции:

Величина r лежит между –1 и 1. Чем выше значение r, тем теснее связь между переменными и тем с большим основанием найденная взаимосвязь может быть использована для прогнозирования.

После получения r можно продолжить статистический анализ, исследовав вопрос, в какой мере полученный коэффициент корреляции существенен.

Для проверки существенности при небольшом числе наблюдений:

  1.  Определение доверительных интервалов.

Определяются те границы, в пределах которых с заданной доверительной вероятностью будет находиться значение .

В силу того, что оценивание параметров осуществляется по выборочным данным, оценки а и b создают некоторую погрешность. Причем погрешность в значении а приводит к вертикальному сдвигу линии регрессии, а колеблемость оценки b приводит к «покачиванию» линии регрессии. При одной и той же оценке а линия регрессии будет поворачиваться вокруг оси с координатами , .

Расчетное значение  доверительного интервала:

- стат. Стьюдента.

Отдельные наблюдения рассеяны вокруг неё. В качестве меры рассеяния принимается дисперсия.

Дисперсия значения зависимой переменной, определяемой по уравнению парной регрессии будет складываться из двух компонент – дисперсии параметра а и дисперсии параметра b.

  1.  Множественная регрессия.

Зависимая переменная может быть функцией нескольких переменных  .

Введем матричные обозначения.

Имеем:

  •  вектор неизвестных параметров , j=1,2…m;
  •  вектор зависимой переменной , i=1,2…n;
  •  матрица независимых переменных , размер которых определяется числом наблюдений n и числом переменных m;
  •  вектор ошибок .

Линейная модель в матричном виде:

Оценку а, найденную по этой формуле называют оценкой метода наименьших квадратов.

Определив вектор а записывают уравнение множественной регрессии.

Для задач с двумя переменными можно записать систему нормальных уравнений.

  1.  Коэффициент множественной корреляции.

Взаимосвязь зависимой переменной у с рядом независимых переменных х измеряется в целом с помощью коэффициентов множественной корреляции.

Чем теснее данные примыкают к линии регрессии, тем больше эта величина. Если линия регрессии полностью описывает зависимую переменную, то R=1, в противном случае модуль R<1.

  1.  Автокорреляция.

Автокорреляция – это корреляционная зависимость между средними значениями уровней временного ряда: ; и т. д.

Чтобы оценить степень зависимости между средними уровнями временного ряда рассчитывают коэффициент автокорреляции между уровнями исходного ряда и того же ряда, но сдвинутого на   шагов во времени.

Общая формула для расчета коэффициента автокорреляции:

  •  средний уровень первого ряда;
  •  средний уровень второго ряда;

Наибольшее значение -------------------- должно быть таким, чтобы число пар наблюдений оказалось достаточным для вычисления коэффициента автокорреляции ------------------.

При анализе временных рядов необходимо знать существует ли автокорреляция в уровнях ряда или нет. Самым распространенным методом проверки автокорреляции является критерий Дарбина – Уотсона.

---------------------

Возможные значения критерия находятся в интервале 0-4. Если автокорреляция отсутствует, то d колеблется вокруг 2.

При проверке автокорреляции остатков критерий Дарбина – Уотсона:

--------------------

Значения также сравниваются с табличными.

  •  положительная корреляция;
  •  отрицательная корреляция.

  1.  Автокорреляция остатков.

Если вид функциональной зависимости выбран неудачно, то нельзя говорить о том, что ошибки представляют собой случайные независимые переменные. Если последовательные значения коррелированны между собой, то говорят, что имеет место автокорреляция.

Кроме того, автокорреляция может быть

5

Основы корреляционно-регрессионного анализа


 

А также другие работы, которые могут Вас заинтересовать

22305. Данные и основные операторы 725.5 KB
  Хороший выбор структур данных позволяет разрабатывать на языке Паскаль простые и эффективные алгоритмы. Достоинства Паскаля: он ориентирован на структурное программирование имеет развитые средства контроля и достаточно прост в изучении; язык имеет хороший состав типов и структур данных; трансляторы с Паскаля есть во всех распространенных ПК; конкретные реализации языка дают возможность использовать все аппаратные средства ПК; на основе языка Паскаль разработана Delphi одна из современных систем визуального программирования....
22306. Организация лечебно-эвакуационного обеспечения населения при ЧС 269.5 KB
  Опыт ликвидации медико-санитарных последствий ЧС позволяет выделить общие факторы обстановки, которые, как правило, имеют место при всех ЧС, сопровождающихся значительными потерями населения, и влияют на организацию лечебно-эвакуационного обеспечения. К ним можно отнести следующие...
22307. МЕДИЦИНСКОЕ ОБЕСПЕЧЕНИЕ НАСЕЛЕНИЯ ПРИ ПРОВЕДЕНИИ МЕРОПРИЯТИЙ ГРЖДАНСКОЙ ОБОРОНЫ 196 KB
  Процесс оповещения населения обязательно сопровождается организацией оповещения органов управления и ответственных должностных лиц, принимающих решения о проведении конкретных мероприятий по защите населения, аварийно-спасательных и других неотложных работ в районах чрезвычайных ситуаций.
22308. Медико-санитарное обеспечение при ликвидации последствий чрезвычайных ситуаций техногенного (антропогенного) характера 233.5 KB
  Изучить классификацию АОХВ, характеристику очагов химического и радиационного заражения при авариях на радиационно опасных и химически опасных объектах. Изучить виды дорожно-транспортных аварий и катастроф, а также чрезвычайных ситуаций на пожаро - и взрывоопасных объектах
22309. ОРГАНИЗАЦИЯ ЛЕЧЕБНО-ЭВАКУАЦИОННОГО ОБЕСПЕЧЕНИЯ НАСЕЛЕНИЯ ПРИ ЛИКВИДАЦИИ ПОСЛЕДСТВИЙ НАПАДЕНИЯ ПРОТИВНИКА 160.5 KB
  Изучить организацию лечебно-эвакуационного обеспечения населения в очагах массовых санитарных потерь при применении противником ОМП. Рассмотреть организацию оказания медицинской помощи пострадавших, медицинскую сортировку. Изучить принципиальную схему развертывания этапа медицинской эвакуации, организацию медицинской эвакуации пострадавших
22310. Медико-санитарное обеспечение при ликвидации последствий чрезвычайных ситуаций природного характера (стихийных бедствий) 271.5 KB
  Изучить условия, определяющие систему лечебно-эвакуационного обеспечения населения при ликвидации последствий чрезвычайной ситуации природного характера, особенности формирования очагов массовых санитарных потерь при землетрясениях, наводнениях, лесных и торфяных пожарах
22311. РАБОТА НЕШТАТНЫХ АВАРИЙНО-СПАСАТЕЛЬНЫХ ФОРМИРОВАНИЙ ГРАЖДАНСКОЙ ОБОРОНЫ ЗДРАВООХРАНЕНИЯ ПРИ ПРОВЕДЕНИИ СПАСАТЕЛЬНЫХ РАБОТ 235.5 KB
  Первая врачебная помощь — комплекс общеврачебных мероприятий, оказываемых в целях устранения или ослабления последствий ранений (заболеваний), угрожающих жизни пораженным, раненых и больных, предупреждения развития опасных для жизни осложнений или уменьшения их тяжести, а также подготовки нуждающихся к дальнейшей эвакуации.
22312. Управління користувачами в невеликій мережі 28 KB
  Створюючи групи і додаючи в них користувачів ви визначаєте громадянство які мають права доступу до комп'ютерів в мережі. Крім того ви дістаєте можливість розділити користувачів на групи що володіють різними правами доступу. Двічі клацніть на значку Користувачі і паролі щоб відкрити діалогове вікно. Дозвольте користувачам обов'язково указувати свої ім'я користувача і пароль для чого встановите відповідний прапорець єдиний на вкладці Користувачі діалогового вікна Користувачі і паролі Перейдіть на вкладку Додатково.