17623

Метод наименьших квадратов. Функциональная стохастическая и корреляционная связи

Лекция

Экономическая теория и математическое моделирование

Метод наименьших квадратов План: Что такое функциональная стохастическая и корреляционная связи Что такое метод наименьших квадратов МНК Первая процедура МНК: проверка гипотезы о существовании связи. Вторая процедура МНК: подбор лучшей функци...

Русский

2015-01-29

226.5 KB

30 чел.

Тема: «Метод наименьших квадратов»

План:

  1.  Что такое функциональная, стохастическая и корреляционная связи?
  2.  Что такое метод наименьших квадратов (МНК)?
  3.  Первая процедура МНК: проверка гипотезы о существовании связи.
  4.  Вторая процедура МНК: подбор лучшей функциональной модели.
  5.  Третья процедура МНК: определение параметров уравнения регрессии.

Все социально-экономические явления взаимосвязаны. Связь между ними имеет причинно-следственный характер. Признаки, характеризующие причины и условия связи, называются факторными х, а признаки, которые характеризуют следствия связи, — результативными у. Между признаками х и у возникают разные по природе и характеру связи, а именно: функциональные и стохастические. При функциональной связи каждому значению признака х соответствует одно определенное значение у. Эта связь проявляется однозначно в каждом отдельном случае. При стохастической связи каждому значению признака х соответствует определенное множество значений у, образующих так называемое условное распределение. Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условное распределение средней величинойy, то образуется разновидность стохастической связи — корреляционная. В случае корреляционной связи каждому значению признака х соответствует среднее значение результативного признака y.

Примером стохастической, и в частности корреляционной, связи является распределение проданных однокомнатных квартир по их стоимости у и размеру общей площади х (табл. 1).

                                                                                          Таблица 1

Размер

общей площади,

м2

x

Количество квартир со стоимостью

тыс. усл. ден. ед.

Средняя стоимость квартиры,

тыс. усл. ден.ед.

yj

9—11

11—13

13—15

15—17

17—19

Итого

fi

До 25

26

12

2

--

--

40

10,8

25-30

4

9

12

5

--

30

13,2

30—35

--

4

6

10

4

24

15,2

35 и более

--

--

--

--

6

6

18,0

В целом

30

25

20

15

10

100

13,0

Большинство экономических явлений имеет вероятностный, или случайный, или стохастический характер, то есть, в реальных условиях очень трудно со 100-процентной уверенностью предвидеть развитие того или иного экономического объекта. Естественно, это факт приводит к некоторым осложнениям, и требует наличия у управленческого персонала навыков в области предсказания неопределенного будущего - навыков обнаружения закономерностей, скрытых среди случайностей прошлого и настоящего периодов, и переносу этих закономерностей в (на) будущее – навыков экстраполирования.

Как правило, исследование случайных взаимоотношений сводится к адаптации реальных вероятностных взаимосвязей к логике функциональных зависимостей, то есть другими словами, нужно определить и аналитически выразить («проявить») форму предполагаемой зависимости и потом исследовать ее.

Современная наука еще не нашла лучшего «проявителя» корреляционных зависимостей, чем метод наименьших квадратов.

Сущность метода наименьших квадратов заключается в отыскании параметров модели тренда, которая лучше всего описывает тенденцию развития какого-либо  случайного явления во времени или в пространстве (тренд - это линия, которая и характеризует тенденцию этого развития). Задача      метода наименьших квадратов (сокращенно - МНК) сводится к нахождению не просто какой-то модели тренда, а к нахождению лучшей или оптимальной модели. В свою очередь, модель будет оптимальной, если сумма квадратических отклонений между наблюдаемыми фактическими величинами и соответствующими им расчетными величинами тренда будет минимальной (наименьшей):

,

где - квадратичное отклонение между наблюдаемой фактической величиной и соответствующим ей расчетной величиной тренда,

      - фактическое (наблюдаемое) значение изучаемого явления,

     - расчетное значение модели тренда,

        n - число наблюдений за изучаемым  явлением.

        

МНК самостоятельно применяется довольно редко. Как правило, чаще всего его используют лишь в качестве необходимого технического приема при корреляционно-регрессионных исследованиях.

Инструментарий МНК сводится к следующим процедурам:

Первая процедура. Выясняется, существует ли вообще какая-либо тенденция изменения результативного признака при изменении выбранного фактора-аргумента, или другими словами, есть ли связь между «у» и «х».

Вторая процедура. Определяется, какая линия (траектория) способна лучше всего описать или охарактеризовать  эту тенденцию.

Третья процедура.  Рассчитываются параметры регрессионного уравнения, характеризующего данную линию, или другими словами, определяется аналитическая формула, описывающая лучшую модель тренда.

ВНИМАНИЕ!!! Следует помнить, что информационной основой МНК может быть только достоверный статистический ряд, причем число наблюдений не должно быть меньше 4-х, иначе, сглаживающие процедуры МНК могут потерять здравый смысл.

Пример. Допустим, мы имеем информацию о средней урожайности подсолнечника по исследуемому хозяйству:

Таблица 2

Таблица исходных данных

Номер наблюдения

1

2

3

4

5

6

7

8

9

10

Годы

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

Урожайность, ц/га

14,2

15,6

17,5

14,5

15,3

17,0

16,6

17,5

15,0

17,7

Предположение (гипотеза): «Поскольку уровень технологии при производстве подсолнечника в нашей стране за последние 10 лет практически не изменился, значит, по всей видимости, колебания урожайности в анализируемый период очень сильно зависели  от колебания погодно-климатических условий. Действительно ли это так?»

Первая процедура МНК: Проверяется гипотеза о существовании тенденции изменения урожайности подсолнечника в зависимости от изменения погодно-климатических условий за анализируемые 10 лет.

В данном примере за «y» целесообразно принять урожайность подсолнечника, а за «x» - номер наблюдаемого года в анализируемом периоде. Проверку гипотезы о существовании какой-либо взаимосвязи между «x» и «y» можно выполнить двумя способами: вручную и при помощи компьютерных программ типа «YYY» и т.п. Конечно, при наличие компьютерной техники данная проблема решается сама собой. Но, чтобы лучше понять инструментарий МНК целесообразно выполнить проверку гипотезы о существовании связи между «x» и «y» вручную, когда под рукой находятся только ручка и обыкновенный калькулятор. В таких случаях гипотезу о существовании тенденции лучше всего проверить визуальным способом по расположению графического изображения анализируемого ряда динамики - корреляционного поля:

Корреляционное поле в нашем примере расположено вокруг медленно возрастающей линии. Это уже само по себе говорит о существовании определенной тенденции в изменении урожайности подсолнечника. Нельзя говорить о наличии какой-либо тенденции лишь тогда, когда корреляционное поле похоже на круг, окружность, строго вертикальное или строго горизонтальное облако, или же состоит из хаотично разбросанных точек. Во всех остальных случаях следует подтвердить гипотезу о существовании взаимосвязи между «x» и «y», и продолжить исследования.

Вторая процедура МНК: Определяется, какая линия (траектория) способна лучше всего описать или охарактеризовать  тенденцию изменения урожайности подсолнечника за анализируемый период.

При наличии компьютерной техники подбор оптимального тренда происходит автоматически. При «ручной» обработке выбор оптимальной функции осуществляется, как правило, визуальным способом - по расположению корреляционного поля. То есть, по виду графика подбирается уравнение линии, которая лучше всего подходит к эмпирическому тренду (к фактической траектории).

Как известно, в природе существует огромное разнообразие функциональных зависимостей, поэтому визуальным способом проанализировать даже незначительную их часть - крайне затруднительно. К счастью, в реальной экономической практике большинство взаимосвязей достаточно точно могут быть описаны или параболой, или гиперболой, или же прямой  линией. В связи с этим, при «ручном» варианте подбора лучшей функции, можно ограничиться только  этими  тремя моделями.

прямая   выглядит таким образом:     

гипербола имеет следующий вид:

парабола второго порядка выглядит так:

Нетрудно заметить, что в нашем примере лучше всего тенденцию изменения урожайности подсолнечника за анализируемые 10 лет характеризует прямая линия, поэтому уравнением регрессии будет уравнение прямой  -

.

Третья процедура МНК.  Рассчитываются параметры регрессионного уравнения, характеризующего данную линию, или другими словами, определяется аналитическая формула, описывающая лучшую модель тренда.

Нахождение значений параметров уравнения регрессии, в нашем случае параметров и , является сердцевиной МНК. Данный процесс сводится к решению системы нормальных уравнений. В свою очередь, любая система нормальных уравнений для всех видов зависимостей строится по следующей схеме:

Во-первых, определяются коэффициенты при неизвестных параметрах в обнаруженном уравнении прямой линии . Коэффициент при параметре равен 1, а при параметре равен.

Во-вторых, уравнение прямой поочередно, сначала умножается на коэффициент при параметре, а затем на коэффициент при параметре. Таким образом, получается два уравнения: первое -и второе - .

В-третьих, в первое уравнение из таблицы исходных данных попарно, в соответствие с номером наблюдения,  подставляются абсолютно все значенияи. Получается 10-ть уравнений типа: ; ;  и так далее до десятого -  . После чего, все эти уравнения складываются, и получается одно суммарное нормальное уравнение:              

Затем, во второе уравнение из таблицы исходных данных точно также, в соответствие с номером наблюдения,  подставляются абсолютно все значенияи. Получается опять таки 10-ть уравнений: ; ;  и так далее до десятого  -       . После чего, все эти уравнения складываются, и получается еще одно нормальное уравнение:              

В-четвертых, создается система, состоящая из двух нормальных уравнений:

,

которая довольно легко решается методом Гаусса. Напомним, что в результате решения, в нашем примере, находятся значения параметров  и .

Таким образом, найденное уравнение регрессии будет иметь следующий вид:

На этом процедуры МНК закончены.


 

А также другие работы, которые могут Вас заинтересовать

73059. В.С Соловьев (1853 - 1900) 35.5 KB
  Центральная идея его философии идея всеединства. В аксиологии всеединства центральное место занимает абсолютная ценность Истины Добра и Красоты соответствующих трём Ипостасям Божественной Троицы. Основой всеединства у Соловьева выступает божественная троица в ее связи со всеми божественными творениями...
73060. Понятие: общая характеристика, объём и содержание, виды понятий, отношения между понятиями 42 KB
  Понятие - форма мысли, отражающая предметы в их общих, существенных и отличительных признаках. Понятие может отражать явление, процесс, предмет (как материальный, вещественный, так и идеальный, мнимый, воображаемый). Главное — отражать общее и в то же время существенное, отличительное, специфическое в этом предмете.
73061. Определение понятий, виды определений и правила 24.5 KB
  Определение понятий виды определений и правила. Определение понятия логическая операция раскрывающая содержание понятия т. Как логическая операция определение состоит из двух элементов: определяемого понятия понятия содержание которых требуется раскрыть...
73062. Виды умозаключений: дедукция, индукция, аналогия 23 KB
  Умозаключение –- форма мышления посредством которой из одного или нескольких суждений выводится новое суждение; это такая мыслительная структура в которой из двух или более истинных исходных суждений называемых посылками на основании определенной логической связи между ними формируется новое истинное суждение.
73063. Системный и синергетический подходы к культуре: М.Каган, Э.Маркарян, Л.Уайт 35 KB
  Различая три основные формы бытия — бытие природы, бытие общества и бытие человека, он полагает, что культура в самом общем, философском плане представляет собою четвертую форму бытия, которая порождена деятельностью человека.
73065. Политическая философия русского либерализма 28.5 KB
  Личность и исторический процесс в историософской концепции Кавелина; проблема собственности и государства в филии права Чичерина Либерализм возник в екатерининскую эпоху окончательно оформился к середине 19 века. Философия личности. Необходима новая филия постороенная на антропологии.
73066. Философия науки, становление и основные этапы развития 31 KB
  Как философская дисциплина она представлена различными концепциями которые предлагают ту или иную модель развития науки различными подходами и взглядами. Развитие философии науки в конце XIX в. выступает одним из решающих импульсов развития самой науки.
73067. Этика долга Канта 33 KB
  Этическая стратегия Канта ориентирована не на то как должны вести себя индивиды в тех или иных ситуациях не на конкретные добродетели а на обязательства которые сохраняются при всех обстоятельствах и применительно ко всем разумным существам.