17623

Метод наименьших квадратов. Функциональная стохастическая и корреляционная связи

Лекция

Экономическая теория и математическое моделирование

Метод наименьших квадратов План: Что такое функциональная стохастическая и корреляционная связи Что такое метод наименьших квадратов МНК Первая процедура МНК: проверка гипотезы о существовании связи. Вторая процедура МНК: подбор лучшей функци...

Русский

2015-01-29

226.5 KB

30 чел.

Тема: «Метод наименьших квадратов»

План:

  1.  Что такое функциональная, стохастическая и корреляционная связи?
  2.  Что такое метод наименьших квадратов (МНК)?
  3.  Первая процедура МНК: проверка гипотезы о существовании связи.
  4.  Вторая процедура МНК: подбор лучшей функциональной модели.
  5.  Третья процедура МНК: определение параметров уравнения регрессии.

Все социально-экономические явления взаимосвязаны. Связь между ними имеет причинно-следственный характер. Признаки, характеризующие причины и условия связи, называются факторными х, а признаки, которые характеризуют следствия связи, — результативными у. Между признаками х и у возникают разные по природе и характеру связи, а именно: функциональные и стохастические. При функциональной связи каждому значению признака х соответствует одно определенное значение у. Эта связь проявляется однозначно в каждом отдельном случае. При стохастической связи каждому значению признака х соответствует определенное множество значений у, образующих так называемое условное распределение. Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условное распределение средней величинойy, то образуется разновидность стохастической связи — корреляционная. В случае корреляционной связи каждому значению признака х соответствует среднее значение результативного признака y.

Примером стохастической, и в частности корреляционной, связи является распределение проданных однокомнатных квартир по их стоимости у и размеру общей площади х (табл. 1).

                                                                                          Таблица 1

Размер

общей площади,

м2

x

Количество квартир со стоимостью

тыс. усл. ден. ед.

Средняя стоимость квартиры,

тыс. усл. ден.ед.

yj

9—11

11—13

13—15

15—17

17—19

Итого

fi

До 25

26

12

2

--

--

40

10,8

25-30

4

9

12

5

--

30

13,2

30—35

--

4

6

10

4

24

15,2

35 и более

--

--

--

--

6

6

18,0

В целом

30

25

20

15

10

100

13,0

Большинство экономических явлений имеет вероятностный, или случайный, или стохастический характер, то есть, в реальных условиях очень трудно со 100-процентной уверенностью предвидеть развитие того или иного экономического объекта. Естественно, это факт приводит к некоторым осложнениям, и требует наличия у управленческого персонала навыков в области предсказания неопределенного будущего - навыков обнаружения закономерностей, скрытых среди случайностей прошлого и настоящего периодов, и переносу этих закономерностей в (на) будущее – навыков экстраполирования.

Как правило, исследование случайных взаимоотношений сводится к адаптации реальных вероятностных взаимосвязей к логике функциональных зависимостей, то есть другими словами, нужно определить и аналитически выразить («проявить») форму предполагаемой зависимости и потом исследовать ее.

Современная наука еще не нашла лучшего «проявителя» корреляционных зависимостей, чем метод наименьших квадратов.

Сущность метода наименьших квадратов заключается в отыскании параметров модели тренда, которая лучше всего описывает тенденцию развития какого-либо  случайного явления во времени или в пространстве (тренд - это линия, которая и характеризует тенденцию этого развития). Задача      метода наименьших квадратов (сокращенно - МНК) сводится к нахождению не просто какой-то модели тренда, а к нахождению лучшей или оптимальной модели. В свою очередь, модель будет оптимальной, если сумма квадратических отклонений между наблюдаемыми фактическими величинами и соответствующими им расчетными величинами тренда будет минимальной (наименьшей):

,

где - квадратичное отклонение между наблюдаемой фактической величиной и соответствующим ей расчетной величиной тренда,

      - фактическое (наблюдаемое) значение изучаемого явления,

     - расчетное значение модели тренда,

        n - число наблюдений за изучаемым  явлением.

        

МНК самостоятельно применяется довольно редко. Как правило, чаще всего его используют лишь в качестве необходимого технического приема при корреляционно-регрессионных исследованиях.

Инструментарий МНК сводится к следующим процедурам:

Первая процедура. Выясняется, существует ли вообще какая-либо тенденция изменения результативного признака при изменении выбранного фактора-аргумента, или другими словами, есть ли связь между «у» и «х».

Вторая процедура. Определяется, какая линия (траектория) способна лучше всего описать или охарактеризовать  эту тенденцию.

Третья процедура.  Рассчитываются параметры регрессионного уравнения, характеризующего данную линию, или другими словами, определяется аналитическая формула, описывающая лучшую модель тренда.

ВНИМАНИЕ!!! Следует помнить, что информационной основой МНК может быть только достоверный статистический ряд, причем число наблюдений не должно быть меньше 4-х, иначе, сглаживающие процедуры МНК могут потерять здравый смысл.

Пример. Допустим, мы имеем информацию о средней урожайности подсолнечника по исследуемому хозяйству:

Таблица 2

Таблица исходных данных

Номер наблюдения

1

2

3

4

5

6

7

8

9

10

Годы

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

Урожайность, ц/га

14,2

15,6

17,5

14,5

15,3

17,0

16,6

17,5

15,0

17,7

Предположение (гипотеза): «Поскольку уровень технологии при производстве подсолнечника в нашей стране за последние 10 лет практически не изменился, значит, по всей видимости, колебания урожайности в анализируемый период очень сильно зависели  от колебания погодно-климатических условий. Действительно ли это так?»

Первая процедура МНК: Проверяется гипотеза о существовании тенденции изменения урожайности подсолнечника в зависимости от изменения погодно-климатических условий за анализируемые 10 лет.

В данном примере за «y» целесообразно принять урожайность подсолнечника, а за «x» - номер наблюдаемого года в анализируемом периоде. Проверку гипотезы о существовании какой-либо взаимосвязи между «x» и «y» можно выполнить двумя способами: вручную и при помощи компьютерных программ типа «YYY» и т.п. Конечно, при наличие компьютерной техники данная проблема решается сама собой. Но, чтобы лучше понять инструментарий МНК целесообразно выполнить проверку гипотезы о существовании связи между «x» и «y» вручную, когда под рукой находятся только ручка и обыкновенный калькулятор. В таких случаях гипотезу о существовании тенденции лучше всего проверить визуальным способом по расположению графического изображения анализируемого ряда динамики - корреляционного поля:

Корреляционное поле в нашем примере расположено вокруг медленно возрастающей линии. Это уже само по себе говорит о существовании определенной тенденции в изменении урожайности подсолнечника. Нельзя говорить о наличии какой-либо тенденции лишь тогда, когда корреляционное поле похоже на круг, окружность, строго вертикальное или строго горизонтальное облако, или же состоит из хаотично разбросанных точек. Во всех остальных случаях следует подтвердить гипотезу о существовании взаимосвязи между «x» и «y», и продолжить исследования.

Вторая процедура МНК: Определяется, какая линия (траектория) способна лучше всего описать или охарактеризовать  тенденцию изменения урожайности подсолнечника за анализируемый период.

При наличии компьютерной техники подбор оптимального тренда происходит автоматически. При «ручной» обработке выбор оптимальной функции осуществляется, как правило, визуальным способом - по расположению корреляционного поля. То есть, по виду графика подбирается уравнение линии, которая лучше всего подходит к эмпирическому тренду (к фактической траектории).

Как известно, в природе существует огромное разнообразие функциональных зависимостей, поэтому визуальным способом проанализировать даже незначительную их часть - крайне затруднительно. К счастью, в реальной экономической практике большинство взаимосвязей достаточно точно могут быть описаны или параболой, или гиперболой, или же прямой  линией. В связи с этим, при «ручном» варианте подбора лучшей функции, можно ограничиться только  этими  тремя моделями.

прямая   выглядит таким образом:     

гипербола имеет следующий вид:

парабола второго порядка выглядит так:

Нетрудно заметить, что в нашем примере лучше всего тенденцию изменения урожайности подсолнечника за анализируемые 10 лет характеризует прямая линия, поэтому уравнением регрессии будет уравнение прямой  -

.

Третья процедура МНК.  Рассчитываются параметры регрессионного уравнения, характеризующего данную линию, или другими словами, определяется аналитическая формула, описывающая лучшую модель тренда.

Нахождение значений параметров уравнения регрессии, в нашем случае параметров и , является сердцевиной МНК. Данный процесс сводится к решению системы нормальных уравнений. В свою очередь, любая система нормальных уравнений для всех видов зависимостей строится по следующей схеме:

Во-первых, определяются коэффициенты при неизвестных параметрах в обнаруженном уравнении прямой линии . Коэффициент при параметре равен 1, а при параметре равен.

Во-вторых, уравнение прямой поочередно, сначала умножается на коэффициент при параметре, а затем на коэффициент при параметре. Таким образом, получается два уравнения: первое -и второе - .

В-третьих, в первое уравнение из таблицы исходных данных попарно, в соответствие с номером наблюдения,  подставляются абсолютно все значенияи. Получается 10-ть уравнений типа: ; ;  и так далее до десятого -  . После чего, все эти уравнения складываются, и получается одно суммарное нормальное уравнение:              

Затем, во второе уравнение из таблицы исходных данных точно также, в соответствие с номером наблюдения,  подставляются абсолютно все значенияи. Получается опять таки 10-ть уравнений: ; ;  и так далее до десятого  -       . После чего, все эти уравнения складываются, и получается еще одно нормальное уравнение:              

В-четвертых, создается система, состоящая из двух нормальных уравнений:

,

которая довольно легко решается методом Гаусса. Напомним, что в результате решения, в нашем примере, находятся значения параметров  и .

Таким образом, найденное уравнение регрессии будет иметь следующий вид:

На этом процедуры МНК закончены.


 

А также другие работы, которые могут Вас заинтересовать

8029. Знакомство с пакетом MatLab 49.74 KB
  Знакомство с пакетом MatLab Выполнить действия в Matlab и сравнить полученный результат с приведенным ответом. Задать мат...
8030. Алгоритм обмена сообщениями о статусе синхронизации - SSM 113.5 KB
  Алгоритм обмена сообщениями о статусе синхронизации - SSM 1 Цель работы Изучение алгоритма обмена сообщениями о статусе синхронизации SSM (SynchronizationStatusMessage, укр. - ПСС, повідомлення про статус синзхронізації), широк...
8031. Педагогика как наука, её выделение в особую отрасль знания и предмет исследования 21.2 KB
  Педагогика как наука, её выделение в особую отрасль знания и предмет исследования Становление и развитие педагогики как науки. Категориальный аппарат педагогики Педагогика - с греческого детоводство. В Древней Греции называли педагогом раба, котор...
8032. Традиционно выделяют три этапа в истории педагогической мысли 28.92 KB
  Традиционно выделяют три этапа в истории педагогической мысли: Донаучный (с древнейших времен до XVIIв.). эмпирический (первобытнообщинный, рабовладельческий и феодальный строй). Народные педагогика, решавшая решающую роль в духовном и физичес...
8033. Современная педагогика 21.21 KB
  Современная педагогика - это наука о закономерностях воспитания в течение всей жизни. В процессе развития педагогики образовывались все новые связи с другими науками, что привело к выделению различных отраслей педагогики в системе педагогически...
8034. Связь педагогики с различными естественными и гуманитарными науками 21.28 KB
  Связь педагогики с различными естественными и гуманитарными науками Педагогика взаимосвязана с философией и использует ее основные методологические подходы (системный, личностный, деятельностный, полисубъектный и др.) для обоснования сущности педаго...
8035. Педагогические категории и понятия 24.69 KB
  Педагогические категории и понятия Основные педагогические понятия, выражающие научные обобщения, принято называть педагогическими категориями. К ним относятся воспитание, обучение, образование. Педагогика широко оперирует также общенаучными категор...
8036. Методы педагогических исследований 47.5 KB
  Методы педагогических исследований - это пути, с помощью которых педагоги-исследователи добывают знания о предмете. Существует много методов накопления знаний. Среди них выделим традиционные (эмпирические) и новые (экспериментальные, теоретичес...
8037. Проблема целеполагания в педагогике. Трактовка цели в законодательных и директивных документах Р Б 27.2 KB
  Проблема целеполагания в педагогике. Трактовка цели в законодательных и директивных документах Р Б Образование как целостный педагогический процесс имеет целенаправленный характер. Цель образования определяет содержание, методы, формы, средства, рез...