10988

Сглаживание временного ряда (выделение неслучайной компоненты)

Лекция

Математика и математический анализ

Сглаживание временного ряда выделение неслучайной компоненты Одной из важнейших задач исследования временного ряда является выявление основной тенденции изучаемого процесса выраженной неслучайной составляющей тренда либо тренда с циклической или/и сезонной ком...

Русский

2013-04-03

98.62 KB

44 чел.

Сглаживание временного ряда (выделение неслучайной компоненты)

Одной из важнейших задач исследования временного ряда является выявление основной тенденции изучаемого процесса, выраженной неслучайной составляющей  (тренда, либо тренда с циклической или/и сезонной компонентой).

Для решения этой задачи необходимо выбрать модель (вид функции) . Наиболее часто используются следующие функции:

  1.  линейная

  1.  полиномиальная

  1.  экспоненциальная

  1.  логистическая

  1.  Гомперца

где .

Из двух функций предпочтение, обычно, отдается той, для которой сумма квадратов отклонений фактических данных от расчетных – минимальна. Однако этот принцип нельзя доводить до абсурда, т.к. для любого ряда из  точек можно подобрать полином -й степени, проходящий через все точки. В этом случае сумма квадратов отклонений будет равна нулю, однако при этом бессмысленно говорить о выделении основной тенденции, учитывая случайный характер эмпирических данных (точек). На практике, при прочих равных условиях предпочтительно использовать более простые функции.

Значения временного ряда  или  рассматриваются как зависимая переменная, а время  как объясняющая:

 

где  возмущения, представляющие независимые и одинаково распределенные случайные величины, распределение которых предполагается нормальным. Как и в регрессионном анализе, для определения коэффициентов (параметров) модели воспользуемся методом наименьших квадратов. Представим функцию  в виде линейной комбинации базисных функций, являющихся линейно независимыми степенными функциями. Учтем, что во временных рядах в качестве аргумента  берем , а . Тогда для линейной модели матрица Грама примет вид:

Для квадратичной (параболической) функции  получим матрицу Грама:

Учитывая, что значения переменной  образуют натуральный ряд чисел от 1 до  суммы из (25.2) и (25.3) можно выразить через число членов ряда:

Пример 1.  По данным (Пример 2, Лекция 24) найдем уравнение неслучайной составляющей (тренда) для временного ряда , полагая тренд линейным.

РЕШЕНИЕ. По формуле (25.4) вычислим:  

Система нормальных уравнений имеет вид:

Отсюда  и уравнение тренда: , т.е. спрос ежегодно увеличивается, в среднем, на 25.7 усл.ед. Исходный ряд и модель линейного тренда приведена на рис.1.

Рис. 1. Линейное сглаживание временного ряда

Проверим качество линейной модели тренда по  критерию на 5%-ном уровне значимости. Для этого вычислим суммы квадратов:

  1.  обусловленную регрессией –
  2.  общую –
  3.  остаточную –

По формуле (13.3) значение статистики

Следовательно, принимаем альтернативную гипотезу  уравнение тренда значимо.

Модель скользящего среднего

Другим методом выравнивания (сглаживания) временного ряда, т.е. выделения неслучайной составляющей, является метод скользящего среднего. Метод основан на переходе от исходных эмпирических данных к средним значениям на интервале времени, длина которого определена заранее. При этом сам выбранный интервал времени "скользит" вдоль ряда.

Получаемый таким образом ряд скользящих средних ведет себя более гладко, чем исходный ряд, из-за усреднения отклонений ряда. Действительно, если индивидуальный разброс значений члена временного ряда  около своего среднего (сглаженного) значения  характеризуется дисперсией , то разброс средних из  членов временного ряда  около того же значения  будет характеризоваться существенно меньшей величиной дисперсии, равной . Для усреднения могут быть использованы средняя арифметическая (простая и с некоторым весом), медиана и др.

Пример 2.  По данным (Пример 2, Лекция 24) найдем уравнение неслучайной составляющей (тренда) для временного ряда  методом скользящего среднего. В качестве усреднения используем простую среднюю арифметическую оценку с интервалом сглаживания  года.

РЕШЕНИЕ. Скользящие средние находим по формуле:

Здесь  нечетное число; при . В результате получим сглаженный ряд:

t

1

2

3

4

5

6

7

8

-

225.0

241.0

305.7

329.3

336.3

358.0

-

Полученный результат представлен на рис. 2.

Рис. 2. Сглаживание временного ряда (сплошная ломанная – исходный ряд;
прямая – линейная модель; пунктирная ломанная – скользящее среднее
m=3)

Прогнозирование временных рядов

Одна из важнейших задач анализа временного (динамического) ряда состоит в прогнозировании на его основе развития изучаемого процесса. При этом исходят из того, что тенденция развития, установленная в прошлом, может быть распространена (экстраполирована) на будущий период.

Задача ставится так: имеется временной (динамический) ряд
, необходимо дать прогноз уровня этого ряда на момент времени .

Если рассматривать временной ряд как регрессионную модель изучаемого признака по переменной "время", то к нему могут быть применены рассмотренные выше методы анализа. Следует, однако, вспомнить, что одна из основных предпосылок регрессионного анализа состоит в том, что возмущения  представляют собой независимые случайные величины с математическим ожиданием (средним значением) равным нулю. А при работе с временными рядами такое допущение оказывается в большинстве случаев неверным.

Действительно, если вид функции тренда выбран неудачно, то вряд ли можно говорить о том, что отклонения от нее (возмущения ), являются независимыми. В этом случае наблюдается заметная концентрация положительных и отрицательных возмущений, и можно предполагать их взаимосвязь. Если последовательные значения  коррелируют между собой, то говорят об автокорреляции возмущений (остатков, ошибок).

Метод наименьших квадратов, вообще говоря, и в случае автокорреляции возмущений дает несмещенные и состоятельные оценки параметров, однако их интервальные оценки могут содержать грубые ошибки. В случае выявления автокорреляции возмущений целесообразно вновь вернуться к проблеме спецификации уравнений регрессии (выбора функции тренда), пересмотреть набор включенных в него переменных и т.п.

Наиболее простым и достаточно надежным критерием определения автокорреляции возмущений является критерий Дарбина – Уотсона. С помощью этого критерия проверяется гипотеза об отсутствии автокорреляции между соседними остаточными членами ряда  и  (для лага ), где  выборочная оценка . Статистика критерия достаточно подробно рассмотрена в лекции № 13, формулы (13.5 – 13.6).

Пример 3.  По данным (Пример 2, Лекция 24) выявим на уровне значимости  наличие автокорреляции возмущений для временного ряда . В случае отсутствия значимой автокорреляции возмущений методами регрессионного анализа найдем точечную и интервальную оценки уровней ряда с надежностью (доверительной вероятностью) . Прогноз среднего и индивидуального значений спроса на некоторый товар необходимо дать на момент  (девятый год).

РЕШЕНИЕ. В примере 1 было получено уравнение тренда:
. Все расчеты, необходимые для вычисления  статистики (Дарбина – Уотсона) сведены в таблицу:

t

1

213

207.0

6.0

2

171

232.7

-61.7

6.0

-370.2

3806.9

3

291

258.4

32.6

-61.7

-2011.4

1062.8

4

309

284.0

25.0

32.6

815.0

625.0

5

317

309.7

7.3

25.0

182.5

53.3

5

362

335.4

26.6

7.3

194.2

707.6

7

351

361.1

-10.1

26.6

-268.7

102.0

8

361

386.8

-25.8

-10.1

260.6

665.6

1198.0

7023.2

Теперь по формуле (13.6) статистика . Так как в статистических таблицах минимальное значение , у нашего же ряда , поэтому воспользуемся "грубым" правилом: считаем, что автокорреляция остатков отсутствует, если . Таким образом, для рассматриваемого временного ряда спроса на уровне значимости  гипотеза об отсутствии автокорреляции возмущений принимается.

Вычислим условное математическое ожидание, оценкой для которого является групповая средняя:

(усл. ед.).

Теперь вычислим оценку  дисперсии : . Вычислим оценку дисперсии групповой средней, учитывая (12.14):

По таблицам получим . Теперь по формуле (12.14) получим интервальную оценку среднего спроса:

;

Для нахождения интервальной оценки прогноза индивидуального значения  вычислим дисперсию оценки:

;

Теперь получим интервальную оценку индивидуального значения:

;

Итак, с надежностью 0.95 среднее значение спроса на товар на девятый год будет находиться в пределах от 347 до 477.8 (усл. ед.) а его индивидуальное значение – от 306 до 518.8 (усл. ед.).

Авторегрессионная модель

Для конкретного временного ряда далеко не всегда удается подобрать адекватную модель вида (25.1), для которой ряд возмущений  будет удовлетворять основным предпосылкам регрессионного анализа, в частности, не будет автокоррелирован. В этом случае целесообразно попытаться использовать другие модели, например, авторегрессионные, учитывающие влияние предыдущих уровней фактора.

Авторегрессионная модель p-го порядка имеет вид:

где  некоторые константы. Модель описывает изучаемый процесс в момент  в зависимости от его значений в предыдущие моменты .

Если исследуемый процесс  в момент  определяется лишь его значениями в предшествующий период , то рассматривают авторегрессионную модель 1-го порядка (марковский случайный процесс):

Пример 4.  В таблице, приведенной ниже, представлены данные, отражающие динамику курса акций некоторой компании ($).

t

1

2

3

4

5

6

7

8

9

10

11

971

1166

1044

907

957

727

752

1019

972

815

823

t

12

13

14

15

17

17

18

19

20

21

22

1112

1386

1428

1364

1241

1145

1351

1325

1226

1189

1213

Необходимо построить авторегрессионную модель 1-го порядка, дать точечный и интервальный прогнозы среднего и индивидуального значения курса акций в момент t = 23.

РЕШЕНИЕ. Попытка построить линейную и полиномиальную модель вида (25.1) оказалась бесполезной. Построим авторегрессионную модель тренда вида (25.7). Неизвестные коэффициента получим, решив матрицу Грама (25.2):

.

Найденное уравнение регрессии значимо на 5%-ном уровне (критерий Фишера – Снедекора), так как полученное значение статистики
.

Проверка критерия Дарбина – Уотсона свидетельствует о незначимой автокорреляции возмущений .

Вычислим точечный прогноз . Интервальные оценки для среднего и индивидуального значения на уровне значимости 0.05 вычислим по формулам (см. пример 3). Получим окончательные оценки: .

Итак, с доверительной вероятностью 0.95 среднее значение курса акций данной компании на момент t = 23 будет заключен в пределах от 1046.6 до 1341.6 ($), а его индивидуальное значение – от 879.1 до 1509.1 ($).


 

А также другие работы, которые могут Вас заинтересовать

81842. Принципы выбора видов транспорта 26.81 KB
  Четвертый принцип – обеспечение достоверной и достаточной информированности потребителей транспортных услуг в частности через рекламу о емкости качестве и стоимости этих услуг благодаря наличию хорошей экспедиторской службы по обслуживанию клиентов развитию материальных подходов в работе транспортных предприятий. Объективная информация транспортных услугах позволяет потребителям проводить сравнительные расчеты по оптимизации своих затрат на транспорт рационализировать перевозку и эффективнее размещать заказы определять более выгодные рынки...
81843. Технико–эксплуатационные характеристики железнодорожного транспорта 27.33 KB
  Массовость перевозок в сочетании с довольно низкой себестоимостью малые эксплуатационные расходы и достаточно высокой скоростью доставки; более короткий путь следования по сравнению с естественными путями водного транспорта. Относительные недостатки железнодорожного транспорта: ограниченная маневренность из-за привязки к колее; высокая первоначальная стоимость основных фондов: стоимость строительства 1 км однопутной линии примерно 10 млн.
81844. Особенности транспортного обслуживания городов 27.79 KB
  Для городского пассажирского транспорта важно соблюдение необходимого соответствия мощностей отдельных звеньев транспортной системы. Пассажиропотоки в часы пик определяют характер массовых передвижений и служат основой для определения потребности в подвижном составе при решении вопросов о провозной и пропускной способности транспорта и уличнодорожной...
81845. Себестоимость перевозок, особенности определения и различия по видам транспорта 27.43 KB
  Наибольшее влияние на нее оказывают следующие факторы: объем и дальность перевозок густота перевозок на 1 км линии грузоподъемность или пассажировместимость подвижного состава вагонов судов автомобилей автобусов самолетов и т. Особенно заметно повышение себестоимости грузовых перевозок на железнодорожном морском и речном транспорте. Повышение себестоимости перевозок обусловлено в основном повышением уровня заработной платы и оптовых цен на топливо подвижной состав машины оборудование и другие материалы.
81847. Основные свойства транспортного узла 26.03 KB
  Узлы играют важную роль в организации комбинированных перевозок и совершенствовании взаимодействия различных видов транспорта. В зависимости от хозяйственного профиля города можно выделить транспортные узлы обслуживающие: центры обрабатывающей промышленности центры добывающей промышленности многоотраслевые центры непромышленные и курортные центры. Классифицируются узлы и по числу взаимодействующих видов транспорта. Кроме того по расположению узлов в транспортной системе узлы бывают транзитные обслуживающие преимущественно транзитные...
81848. Значение транспорта в развитии экономики страны 26.12 KB
  Транспортный комплекс Казахстана включающий в себя железнодорожный автомобильный водный и воздушный транспорт сеть автомобильных дорог с твердым покрытием трубопроводный и городской электрический транспорт ежегодно в среднем перевозит около 400 млн.т грузов и свыше 750 млн. Транспортная система Казахстана обеспечивает перевозки в среднем в год 70 млн. угля 1415 млн.
81849. Автомобильный транспорт. Зарождение и развитие а/т, его роль в ЕТС. Достоинства и недостатки 27.23 KB
  Первый отечественный автомобиль с двигателем внутреннего сгорания создан в С. Выдающимся русским автоконструктором с мировым именем был Борис Григорьевич Луцкий который в начале 90х годов прошлого столетия спроектировал несколько двигателей внутреннего сгорания предназначавшихся для самодвижущихся экипажей но отечественная промышленность еще не была готова к их освоению. 1 по виду двигателя: внутреннего сгорания карбюраторные дизельные газобаллонные газотурбинные электрические солнечные 2 грузоподъемности: малый средний...
81850. Процессы взаимодействия в транспортных узлах 27 KB
  Основная масса грузовых и пассажирских перевозок осуществляется с участием 2 х и более видов транспорта. Практически вся нефть из трубопроводов передается на другие виды транспорта а автомобиль взаимодействует со всеми видами транспорта особенно велик его вес для пассажирских перевозок. Во взаимодействии различных видов транспорта должна возродиться ЕТС единая транспортная система. Взаимодействие различных видов транспорта заключается в слаженной и согласованной работе транспорта в общем перевозочном процессе.