17623

Метод наименьших квадратов. Функциональная стохастическая и корреляционная связи

Лекция

Экономическая теория и математическое моделирование

Метод наименьших квадратов План: Что такое функциональная стохастическая и корреляционная связи Что такое метод наименьших квадратов МНК Первая процедура МНК: проверка гипотезы о существовании связи. Вторая процедура МНК: подбор лучшей функци...

Русский

2015-01-29

226.5 KB

30 чел.

Тема: «Метод наименьших квадратов»

План:

  1.  Что такое функциональная, стохастическая и корреляционная связи?
  2.  Что такое метод наименьших квадратов (МНК)?
  3.  Первая процедура МНК: проверка гипотезы о существовании связи.
  4.  Вторая процедура МНК: подбор лучшей функциональной модели.
  5.  Третья процедура МНК: определение параметров уравнения регрессии.

Все социально-экономические явления взаимосвязаны. Связь между ними имеет причинно-следственный характер. Признаки, характеризующие причины и условия связи, называются факторными х, а признаки, которые характеризуют следствия связи, — результативными у. Между признаками х и у возникают разные по природе и характеру связи, а именно: функциональные и стохастические. При функциональной связи каждому значению признака х соответствует одно определенное значение у. Эта связь проявляется однозначно в каждом отдельном случае. При стохастической связи каждому значению признака х соответствует определенное множество значений у, образующих так называемое условное распределение. Как закон эта связь проявляется только в массе случаев и характеризуется изменением условных распределений у. Если заменить условное распределение средней величинойy, то образуется разновидность стохастической связи — корреляционная. В случае корреляционной связи каждому значению признака х соответствует среднее значение результативного признака y.

Примером стохастической, и в частности корреляционной, связи является распределение проданных однокомнатных квартир по их стоимости у и размеру общей площади х (табл. 1).

                                                                                          Таблица 1

Размер

общей площади,

м2

x

Количество квартир со стоимостью

тыс. усл. ден. ед.

Средняя стоимость квартиры,

тыс. усл. ден.ед.

yj

9—11

11—13

13—15

15—17

17—19

Итого

fi

До 25

26

12

2

--

--

40

10,8

25-30

4

9

12

5

--

30

13,2

30—35

--

4

6

10

4

24

15,2

35 и более

--

--

--

--

6

6

18,0

В целом

30

25

20

15

10

100

13,0

Большинство экономических явлений имеет вероятностный, или случайный, или стохастический характер, то есть, в реальных условиях очень трудно со 100-процентной уверенностью предвидеть развитие того или иного экономического объекта. Естественно, это факт приводит к некоторым осложнениям, и требует наличия у управленческого персонала навыков в области предсказания неопределенного будущего - навыков обнаружения закономерностей, скрытых среди случайностей прошлого и настоящего периодов, и переносу этих закономерностей в (на) будущее – навыков экстраполирования.

Как правило, исследование случайных взаимоотношений сводится к адаптации реальных вероятностных взаимосвязей к логике функциональных зависимостей, то есть другими словами, нужно определить и аналитически выразить («проявить») форму предполагаемой зависимости и потом исследовать ее.

Современная наука еще не нашла лучшего «проявителя» корреляционных зависимостей, чем метод наименьших квадратов.

Сущность метода наименьших квадратов заключается в отыскании параметров модели тренда, которая лучше всего описывает тенденцию развития какого-либо  случайного явления во времени или в пространстве (тренд - это линия, которая и характеризует тенденцию этого развития). Задача      метода наименьших квадратов (сокращенно - МНК) сводится к нахождению не просто какой-то модели тренда, а к нахождению лучшей или оптимальной модели. В свою очередь, модель будет оптимальной, если сумма квадратических отклонений между наблюдаемыми фактическими величинами и соответствующими им расчетными величинами тренда будет минимальной (наименьшей):

,

где - квадратичное отклонение между наблюдаемой фактической величиной и соответствующим ей расчетной величиной тренда,

      - фактическое (наблюдаемое) значение изучаемого явления,

     - расчетное значение модели тренда,

        n - число наблюдений за изучаемым  явлением.

        

МНК самостоятельно применяется довольно редко. Как правило, чаще всего его используют лишь в качестве необходимого технического приема при корреляционно-регрессионных исследованиях.

Инструментарий МНК сводится к следующим процедурам:

Первая процедура. Выясняется, существует ли вообще какая-либо тенденция изменения результативного признака при изменении выбранного фактора-аргумента, или другими словами, есть ли связь между «у» и «х».

Вторая процедура. Определяется, какая линия (траектория) способна лучше всего описать или охарактеризовать  эту тенденцию.

Третья процедура.  Рассчитываются параметры регрессионного уравнения, характеризующего данную линию, или другими словами, определяется аналитическая формула, описывающая лучшую модель тренда.

ВНИМАНИЕ!!! Следует помнить, что информационной основой МНК может быть только достоверный статистический ряд, причем число наблюдений не должно быть меньше 4-х, иначе, сглаживающие процедуры МНК могут потерять здравый смысл.

Пример. Допустим, мы имеем информацию о средней урожайности подсолнечника по исследуемому хозяйству:

Таблица 2

Таблица исходных данных

Номер наблюдения

1

2

3

4

5

6

7

8

9

10

Годы

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

Урожайность, ц/га

14,2

15,6

17,5

14,5

15,3

17,0

16,6

17,5

15,0

17,7

Предположение (гипотеза): «Поскольку уровень технологии при производстве подсолнечника в нашей стране за последние 10 лет практически не изменился, значит, по всей видимости, колебания урожайности в анализируемый период очень сильно зависели  от колебания погодно-климатических условий. Действительно ли это так?»

Первая процедура МНК: Проверяется гипотеза о существовании тенденции изменения урожайности подсолнечника в зависимости от изменения погодно-климатических условий за анализируемые 10 лет.

В данном примере за «y» целесообразно принять урожайность подсолнечника, а за «x» - номер наблюдаемого года в анализируемом периоде. Проверку гипотезы о существовании какой-либо взаимосвязи между «x» и «y» можно выполнить двумя способами: вручную и при помощи компьютерных программ типа «YYY» и т.п. Конечно, при наличие компьютерной техники данная проблема решается сама собой. Но, чтобы лучше понять инструментарий МНК целесообразно выполнить проверку гипотезы о существовании связи между «x» и «y» вручную, когда под рукой находятся только ручка и обыкновенный калькулятор. В таких случаях гипотезу о существовании тенденции лучше всего проверить визуальным способом по расположению графического изображения анализируемого ряда динамики - корреляционного поля:

Корреляционное поле в нашем примере расположено вокруг медленно возрастающей линии. Это уже само по себе говорит о существовании определенной тенденции в изменении урожайности подсолнечника. Нельзя говорить о наличии какой-либо тенденции лишь тогда, когда корреляционное поле похоже на круг, окружность, строго вертикальное или строго горизонтальное облако, или же состоит из хаотично разбросанных точек. Во всех остальных случаях следует подтвердить гипотезу о существовании взаимосвязи между «x» и «y», и продолжить исследования.

Вторая процедура МНК: Определяется, какая линия (траектория) способна лучше всего описать или охарактеризовать  тенденцию изменения урожайности подсолнечника за анализируемый период.

При наличии компьютерной техники подбор оптимального тренда происходит автоматически. При «ручной» обработке выбор оптимальной функции осуществляется, как правило, визуальным способом - по расположению корреляционного поля. То есть, по виду графика подбирается уравнение линии, которая лучше всего подходит к эмпирическому тренду (к фактической траектории).

Как известно, в природе существует огромное разнообразие функциональных зависимостей, поэтому визуальным способом проанализировать даже незначительную их часть - крайне затруднительно. К счастью, в реальной экономической практике большинство взаимосвязей достаточно точно могут быть описаны или параболой, или гиперболой, или же прямой  линией. В связи с этим, при «ручном» варианте подбора лучшей функции, можно ограничиться только  этими  тремя моделями.

прямая   выглядит таким образом:     

гипербола имеет следующий вид:

парабола второго порядка выглядит так:

Нетрудно заметить, что в нашем примере лучше всего тенденцию изменения урожайности подсолнечника за анализируемые 10 лет характеризует прямая линия, поэтому уравнением регрессии будет уравнение прямой  -

.

Третья процедура МНК.  Рассчитываются параметры регрессионного уравнения, характеризующего данную линию, или другими словами, определяется аналитическая формула, описывающая лучшую модель тренда.

Нахождение значений параметров уравнения регрессии, в нашем случае параметров и , является сердцевиной МНК. Данный процесс сводится к решению системы нормальных уравнений. В свою очередь, любая система нормальных уравнений для всех видов зависимостей строится по следующей схеме:

Во-первых, определяются коэффициенты при неизвестных параметрах в обнаруженном уравнении прямой линии . Коэффициент при параметре равен 1, а при параметре равен.

Во-вторых, уравнение прямой поочередно, сначала умножается на коэффициент при параметре, а затем на коэффициент при параметре. Таким образом, получается два уравнения: первое -и второе - .

В-третьих, в первое уравнение из таблицы исходных данных попарно, в соответствие с номером наблюдения,  подставляются абсолютно все значенияи. Получается 10-ть уравнений типа: ; ;  и так далее до десятого -  . После чего, все эти уравнения складываются, и получается одно суммарное нормальное уравнение:              

Затем, во второе уравнение из таблицы исходных данных точно также, в соответствие с номером наблюдения,  подставляются абсолютно все значенияи. Получается опять таки 10-ть уравнений: ; ;  и так далее до десятого  -       . После чего, все эти уравнения складываются, и получается еще одно нормальное уравнение:              

В-четвертых, создается система, состоящая из двух нормальных уравнений:

,

которая довольно легко решается методом Гаусса. Напомним, что в результате решения, в нашем примере, находятся значения параметров  и .

Таким образом, найденное уравнение регрессии будет иметь следующий вид:

На этом процедуры МНК закончены.


 

А также другие работы, которые могут Вас заинтересовать

34739. Материалы всероссийской переписи населения 1897года как источник по генеалогии непривилегированных слоев населения 13.06 KB
  дают материалы Первой всероссийской переписи населения это прямой массовый статистический учет населения проводимый с целью определения его численности состава и размещения на определенный момент. Первый подробный проект переписи населения был представлен председателем Центрального статистического комитета П. Только почти через 20 лет этот проект был утвержден императором Николаем II согласно Положению о Первой всеобщей переписи населения Российской империи изданному в 1895 г.
34740. Церковные метрические книги как источник по генеалогии непривилегированных слоев населения 13.82 KB
  Метрические книги велись в России до революции в церковных приходах духовенством или особыми гражданскими чиновниками. Во второй части метрической книги также приводился порядковый номер и дата бракосочетания. Метрические книги велись в двух экземплярах: один направлялся на хранение в архив консистории учреждение с церковноадминистративными и судебными функциями которая подчинялась епархиальному архиерею второй оставался в церкви.
34741. Методика генеалогических исследований. Генеалогические таблицы и росписи 15.71 KB
  Поколенная роспись – это нумерованное перечисление членов рода потомков родоначальника по мужской линии обоего пола по генеалогическому старшинству с выделением поколений и указанием при каждом члене рода номера его отца. Выделяются три наиболее употребительных: а все лица рода распределялись по коленам нумеровавшимся римскими цифрами перед представителем рода ставился порядковый номер арабскими цифрами а в конце строки ставился порядковый номер отца; как валовая нумерация б номер отца при сплошной нумерации переносится в начало...
34742. Историческая хронология. Предмет и задачи. Виды календарных систем. Основные понятия и термины 17.43 KB
  В этом календаре год состоял из 365 дней. по 30 дней каждый; в конце года добавлялось пять праздничных дней не входивших в состав месяцев. В течение каждых 19 лет считают 12 лет по 12 лунных месяцев по 29 30 дней и 7 лет по 13 лунных месяцев. лунносолнечный календарь является официальным в Израиле где начало года приходится на один из дней периода с 5 сентября по 5 октября.
34743. Древние календарные системы: Египет, Древняя Греция, Китай 18.83 KB
  Этот лунный календарь использовался на протяжении всей древнеегипетской истории как религиозный календарь фиксирующий время проведения праздников. Схематический гражданский календарь Новый календарь был построен по простой схеме. Поздний лунный календарь Хронологической единицей в нем как и в раннем лунном календаре служил лунный месяц начинавшийся в первый день невидимости Луны.
34744. Мусульманский календарь. Мусульманская система летоисчисления 13.08 KB
  Мусульманская система летоисчисления Мусульманский исламский календарь лунный календарь используемый в исламе для определения дат религиозных праздников а также как официальный календарь в некоторых мусульманских странах. Поэтому в мусульманских странах календарь называют календарём Хиджры. Такая система до сих пор используется в некоторых странах например в Пакистане и Бангладеш. В разных странах используются разные правила.
34745. Календарные системы в Древнем Риме. Реформа Юлия Цезаря 16.15 KB
  Последующие месяцы продолжали сохранять свои числовые обозначения: Квинтилис Quintilis пятый Секстилис Sextilis шестой Септембер September седьмой Октобер Oktober восьмой Новембер November девятый Децомбер December десятый Мартиус майус квинтилис и октобер имели по 31 дню а остальные месяцы состояли из 30 дней. Очень любопытна история распределения дней по месяцам. Первоначально год римского календаря как уже говорилось состоял из 304 дней. Чтобы...
34746. Григорианская реформа и григорианский календарь 14.62 KB
  Эта разница ежегодно накапливаясь привела через 128 лет к ошибке в одни сутки а через 1280 лет уже в 10 суток. Реформа должна была решить две основные задачи: вопервых ликвидировать накопившуюся разницу в 10 суток между календарным и тропическим годами вовторых максимально приблизить календарный год к тропическому чтобы в будущем разница между ними не была ощутимой. Григорианский календарь В григорианском календаре длительность года принимается равной 3652425 суток.
34747. Единицы счета времени: месяц, неделя, сутки 12.86 KB
  Переход к земледелию и скотоводству определил необходимость учета времени его фиксирования в определенных единицах. Все основные выработанные человечеством единицы счета времени сутки месяц и год определяются астрономическими факторами: сутки периодом обращения Земли вокруг своей оси месяц периодом обращения Луны вокруг Земли год периодом обращения Земли вокруг Солнца. Для облегчения исчисления времени введено фиктивное понятие среднее солнце т.